Quản lý trang web đa khu vực và đa ngôn ngữ

Nếu trang web của bạn có nội dung riêng cho người dùng theo từng ngôn ngữ, quốc gia hoặc khu vực, thì bạn có thể tối ưu hoá kết quả của Google Tìm kiếm cho trang web của mình.

Sự khác biệt giữa đa khu vực và đa ngôn ngữ

  • Trang web đa ngôn ngữ là trang web cung cấp nội dung bằng nhiều ngôn ngữ. Ví dụ: trang web của một doanh nghiệp Canada có các phiên bản tiếng Anh và tiếng Pháp. Google Tìm kiếm sẽ cố gắng tìm các trang phù hợp với ngôn ngữ của người tìm kiếm.
  • Trang web đa khu vực là một trang web nhắm mục tiêu rõ ràng đến người dùng ở nhiều quốc gia. Ví dụ: một nhà sản xuất giao hàng đến cả Canada và Hoa Kỳ. Google Tìm kiếm sẽ cố gắng tìm trang địa phương phù hợp với người tìm kiếm.

Một số trang web cung cấp nội dung vừa theo khu vực vừa theo ngôn ngữ. Ví dụ: một trang web có thể có các phiên bản riêng cho Hoa Kỳ và Canada, trong đó, nội dung của phiên bản Canada lại có cả phiên bản tiếng Anh và tiếng Pháp.

Quản lý các phiên bản theo ngôn ngữ cho trang web

Nếu trang web của bạn có nội dung giống nhau bằng nhiều ngôn ngữ, sau đây là một số mẹo giúp người dùng (và Google Tìm kiếm) tìm đúng trang:

Dùng URL riêng cho từng phiên bản ngôn ngữ

Bạn nên dùng URL riêng cho mỗi phiên bản ngôn ngữ của một trang thay vì dùng cookie hoặc các chế độ cài đặt của trình duyệt để điều chỉnh ngôn ngữ cho nội dung trên trang.

Nếu bạn dùng URL riêng cho từng ngôn ngữ, hãy dùng chú thích hreflang để giúp các kết quả tìm kiếm trên Google liên kết đến đúng phiên bản ngôn ngữ phù hợp của trang.

Nếu bạn muốn linh động thay đổi nội dung hoặc chuyển hướng người dùng dựa trên chế độ cài đặt ngôn ngữ, hãy lưu ý rằng có thể Google sẽ không tìm và thu thập dữ liệu được tất cả phiên bản. Điều này là do trình thu thập dữ liệu Googlebot thường bắt nguồn từ Hoa Kỳ. Ngoài ra, trình thu thập dữ liệu này còn gửi các yêu cầu HTTP mà không thiết lập Accept-Language trong tiêu đề của yêu cầu.

Thông báo cho Google về các phiên bản ngôn ngữ

Google hỗ trợ một số phương pháp để gắn nhãn các phiên bản của một trang theo ngôn ngữ hoặc khu vực, bao gồm cả chú thích hreflang và sơ đồ trang web. Hãy đánh dấu trang của bạn sao cho phù hợp.

Đảm bảo rằng ngôn ngữ của trang rõ ràng

Google sử dụng nội dung xuất hiện trên trang của bạn để xác định ngôn ngữ của trang đó. Chúng tôi không dùng thông tin ngôn ngữ có trong mã lập trình, chẳng hạn như thuộc tính lang hoặc trong URL của trang. Bạn có thể giúp Google xác định đúng ngôn ngữ bằng cách dùng một ngôn ngữ duy nhất cho nội dung và phần điều hướng trên mỗi trang, cũng như tránh các bản dịch song ngữ.

Nếu bạn chỉ dịch phần văn bản lặp lại trên trang nhưng lại dùng một ngôn ngữ duy nhất cho phần lớn nội dung (thường xảy ra trên các trang có nội dung do người dùng tạo) thì bạn có thể tạo ra trải nghiệm không tốt cho người dùng, khi cùng một nội dung lại xuất hiện nhiều lần trong kết quả tìm kiếm với nhiều ngôn ngữ cho phần văn bản lặp lại.

Hãy dùng tệp robots.txt để ngăn công cụ tìm kiếm thu thập dữ liệu các trang được dịch tự động trên trang web của bạn. Bản dịch tự động không phải lúc nào cũng có nghĩa và có thể bị xem là nội dung vi phạm. Quan trọng hơn, một bản dịch kém chất lượng hay thiếu tự nhiên có thể khiến người dùng nhận định tiêu cực về trang web của bạn.

Cho phép người dùng chuyển đổi ngôn ngữ trên trang

Nếu một trang có nhiều phiên bản, hãy làm những điều sau:

  • Tránh tự động chuyển hướng người dùng từ một phiên bản ngôn ngữ của trang web sang một phiên bản ngôn ngữ khác của trang web. Ví dụ: đừng chuyển hướng dựa trên phỏng đoán của bạn về ngôn ngữ của người dùng. Các lệnh chuyển hướng như vậy có thể khiến người dùng (và công cụ tìm kiếm) không xem được tất cả phiên bản của trang web.
  • Cân nhắc việc thêm siêu liên kết vào các phiên bản ngôn ngữ khác của trang. Như vậy, người dùng có thể nhấp để chọn phiên bản ngôn ngữ khác của trang.

Sử dụng URL theo ngôn ngữ

Bạn có thể dùng từ ngữ đã bản địa hoá trong URL hoặc dùng một Tên miền quốc tế hoá (IDN). Tuy nhiên, đừng quên sử dụng phương thức mã hoá UTF-8 trong URL (thực tế là bạn nên sử dụng UTF-8 bất cứ khi nào có thể) và nhớ áp dụng ký tự thoát đúng cách khi liên kết đến các URL đó.

Nhắm mục tiêu nội dung trang web đến một quốc gia cụ thể (nhắm mục tiêu theo địa lý)

Bạn có thể nhắm mục tiêu trang web hoặc một số phần trên trang web đến người dùng ở một quốc gia cụ thể và nói một ngôn ngữ cụ thể. Điều này có thể cải thiện thứ hạng trang của bạn ở quốc gia mục tiêu, nhưng sẽ làm giảm thứ hạng trong kết quả ở các khu vực/ngôn ngữ khác.

Cách nhắm mục tiêu trang web theo địa lý trên Google:

Hãy lưu ý rằng việc nhắm mục tiêu theo địa lý không mang tính chính xác tuyệt đối. Vì thế, bạn cần lường trước tình huống có người dùng truy cập vào "nhầm" phiên bản của trang web. Một cách để thực hiện việc này là cho thấy đường liên kết trên mọi trang để người dùng có thể tự chọn khu vực và/hoặc ngôn ngữ.

Sử dụng URL theo khu vực

Hãy cân nhắc sử dụng một cấu trúc URL giúp bạn dễ dàng nhắm mục tiêu trang web hoặc một số phần trên trang web đến nhiều khu vực. Bảng sau đây mô tả các phương án cho bạn:

Phương án dùng cấu trúc URL
Miền theo quốc gia

example.de

Ưu điểm:

  • Nhắm mục tiêu rõ ràng theo địa lý
  • Không quan trọng vị trí máy chủ
  • Dễ dàng phân tách các trang web

Nhược điểm:

  • Đắt tiền (nguồn cung có thể hạn chế)
  • Đòi hỏi nhiều cơ sở hạ tầng hơn
  • Đôi khi có yêu cầu nghiêm ngặt đối với miền cấp cao nhất theo mã quốc gia (ccTLD)
  • Chỉ có thể nhắm đến một quốc gia duy nhất
Miền phụ với miền cấp cao nhất chung (gTLD)

de.example.com

Ưu điểm:

  • Dễ dàng thiết lập
  • Cho phép có nhiều vị trí máy chủ
  • Dễ dàng phân tách các trang web

Nhược điểm:

  • Nếu chỉ nhìn vào URL, người dùng có thể không nhận ra ý định nhắm mục tiêu theo địa lý (ví dụ: "de" là chỉ ngôn ngữ hay quốc gia?)
Thư mục con với miền cấp cao nhất chung (gTLD)

example.com/de/

Ưu điểm:

  • Dễ dàng thiết lập
  • Chi phí bảo trì thấp (cùng máy chủ)

Nhược điểm:

  • Nếu chỉ nhìn vào URL, người dùng có thể không nhận ra ý định nhắm mục tiêu theo địa lý
  • Một vị trí máy chủ
  • Khó phân tách các trang web
Tham số URL

site.com?loc=de

Không nên.

Nhược điểm:

  • Khó phân đoạn dựa trên URL
  • Nếu chỉ nhìn vào URL, người dùng có thể không nhận ra ý định nhắm mục tiêu theo địa lý

Google xác định khu vực mục tiêu bằng cách nào?

Google sử dụng một số tín hiệu để xác định đối tượng mục tiêu phù hợp nhất cho mỗi trang:

  • Tên miền cấp cao nhất theo mã quốc gia (ccTLD). Các tên miền này được gắn với một quốc gia cụ thể (ví dụ như .de cho Đức, .cn cho Trung Quốc). Vì thế, đây là một tín hiệu cụ thể giúp cả người dùng và công cụ tìm kiếm biết rằng trang web của bạn rõ ràng là dành cho một quốc gia cụ thể. Một số quốc gia hạn chế những người có thể sử dụng ccTLD. Vì thế, bạn hãy nhớ tìm hiểu trước. Chúng tôi cũng xem một số ccTLD không rõ ràng (chẳng hạn như .tv hay .me) là gTLD vì chúng tôi nhận thấy rằng người dùng và chủ sở hữu trang web thường xem các miền này là miền chung chứ không phải miền được nhắm mục tiêu theo quốc gia. Xem danh sách gTLD (miền cấp cao nhất dùng chung) của Google.
  • Câu lệnh hreflang trong thẻ, tiêu đề hay sơ đồ trang web.
  • Vị trí máy chủ (thông qua địa chỉ IP của máy chủ). Vị trí máy chủ thường nằm gần người dùng và có thể là tín hiệu về đối tượng mục tiêu của trang web. Một số trang web sử dụng mạng phân phối nội dung (CDN) hoặc được lưu trữ tại một quốc gia có cơ sở hạ tầng máy chủ web tốt hơn. Vì thế, đây không phải là một tín hiệu chắc chắn.
  • Các tín hiệu khác. Để xác định đối tượng mục tiêu cho trang web, bạn có thể xem xét những tín hiệu khác như địa chỉ và số điện thoại địa phương trên các trang, ngôn ngữ và đơn vị tiền tệ địa phương được sử dụng, đường liên kết từ các trang web địa phương khác hoặc các tín hiệu trên Trang doanh nghiệp (nếu có).

Những việc Google không làm:

  • Google thu thập dữ liệu web từ nhiều vị trí trên khắp thế giới. Chúng tôi không tìm cách thay đổi nguồn của trình thu thập dữ liệu được dùng cho một trang web để tìm mọi phiên bản của một trang trên trang web đó. Do đó, hãy đảm bảo rằng bạn thông báo rõ ràng cho Google về mọi biến thể ngôn ngữ hoặc khu vực mà trang web của bạn cho thấy bằng cách sử dụng một trong những phương thức nêu tại đây (chẳng hạn như các mục hreflang, ccTLD (miền cấp cao nhất theo mã quốc gia) hoặc đường liên kết cụ thể).
  • Google bỏ qua thẻ meta vị trí (như geo.position hoặc distribution) hoặc thuộc tính HTML nhắm mục tiêu theo địa lý.

Xử lý các trang trùng lặp trong trường hợp trang web có nhiều khu vực/ngôn ngữ

Nếu trang web đa khu vực của bạn cung cấp nội dung tương tự hoặc nội dung trùng lặp bằng cùng một ngôn ngữ trên nhiều URL (ví dụ: nếu cả example.de/example.com/de/ đều cho thấy cùng một nội dung bằng tiếng Đức), hãy ưu tiên một phiên bản và dùng phần tử rel="canonical" và thẻ hreflang để đảm bảo URL của phiên bản ngôn ngữ hoặc khu vực phù hợp được phân phát đến người tìm kiếm.

Miền cấp cao nhất dùng chung

Miền cấp cao nhất chung (gTLD) là các miền không liên quan đến vị trí cụ thể. Nếu trang web của bạn có một miền cấp cao nhất dùng chung, chẳng hạn như .com, .org hoặc một miền bất kỳ dưới đây, đồng thời trang web này muốn nhắm đến người dùng ở một vị trí địa lý cụ thể, thì bạn nên nêu rõ quốc gia mục tiêu bằng một trong những phương thức nêu trên.

Google coi những miền cấp cao nhất sau đây là gTLD:

  • Miền chung cấp cao nhất (gTLD): Trừ phi ICANN liệt kê một miền cấp cao nhất là miền cấp cao nhất theo mã quốc gia (ccTLD), Google sẽ coi mọi TLD phân giải thông qua vùng gốc DNS IANA là gTLD. Ví dụ:
    • .com
    • .org
    • .edu
    • .gov
    • và nhiều miền khác.
  • Miền chung cấp cao nhất theo khu vực: Tuy có liên quan đến một khu vực địa lý, nhưng những miền này thường được xem như miền cấp cao nhất dùng chung (giống như .com hoặc .org):
    • .eu
    • .asia
  • Miền chung cấp cao nhất theo mã quốc gia (ccTLD): Google coi một số ccTLD (như .tv, .me, v.v.) là gTLD vì chúng tôi nhận thấy người dùng và chủ sở hữu trang web thường xem các miền này là miền chung thay vì miền được nhắm mục tiêu theo quốc gia. Đây là danh sách những ccTLD như vậy (danh sách này có thể thay đổi).
    • .ad
    • .ai
    • .as
    • .bz
    • .cc
    • .cd
    • .co
    • .dj
    • .fm
    • .io
    • .la
    • .me
    • .ms
    • .nu
    • .sc
    • .sr
    • .su
    • .tv
    • .tk
    • .ws