Rel = canonical là gì và tại sao tôi nên sử dụng nó?

Hinting để tìm kiếm công cụ phiên bản ưa thích của một tài liệu

Khi bạn chạy một trang web hướng dữ liệu hoặc có lý do khác tại sao một tài liệu có thể được nhân đôi, điều quan trọng là phải nói với các công cụ tìm kiếm rằng bản sao là bản sao chính hoặc trong thuật ngữ, bản sao “kinh điển”. Khi công cụ tìm kiếm lập chỉ mục các trang của bạn, công cụ tìm kiếm có thể cho biết khi nào nội dung bị trùng lặp. Nếu không có thông tin bổ sung, công cụ tìm kiếm sẽ quyết định trang nào đáp ứng tốt nhất nhu cầu của khách hàng của họ. Điều này có thể tốt, nhưng có nhiều trường hợp công cụ tìm kiếm cung cấp các trang cũ và lỗi thời vì họ đã chọn tài liệu sai là chuẩn.

Cách chỉ định trang chuẩn

Nó rất dễ dàng để cho công cụ tìm kiếm URL chuẩn với dữ liệu meta trong tài liệu của bạn. Đặt HTML sau gần đầu phần tử HEAD của bạn trên mọi trang không chính tắc:

Nếu bạn có quyền truy cập vào tiêu đề HTTP (chẳng hạn như với .htaccess hoặc PHP), bạn cũng có thể đặt URL chuẩn trên các tệp không có HEAD HTML, như PDF. Để thực hiện việc này, hãy đặt tiêu đề cho các trang không chuẩn như sau:

Liên kết: < URL của trang chuẩn >; rel = "canonical"

Thẻ Canonical hoạt động như thế nào và khi nào nó không

Dữ liệu meta chuẩn được sử dụng làm gợi ý cho các công cụ tìm kiếm như trang chủ. Công cụ tìm kiếm sử dụng công cụ này để cập nhật chỉ mục của họ để tham khảo bản sao chính làm bản sao chính và khi họ phân phối kết quả tìm kiếm, họ phân phối trang mà họ tin là kinh điển.

Nhưng trang chuẩn mà bạn chỉ định có thể không phải là trang mà công cụ tìm kiếm phân phối.

Có nhiều lý do tại sao điều này có thể xảy ra:

Thẻ Rel = Canonical là gì?

Nhiều người tin rằng nếu bạn thêm liên kết rel = canonical vào một trang thì trang đó sẽ được chuyển hướng đến phiên bản chuẩn, chẳng hạn như với chuyển hướng HTTP 301. Điều đó không đúng. Liên kết rel = canonical cung cấp thông tin cho các công cụ tìm kiếm, nhưng nó không ảnh hưởng đến cách trang được hiển thị cũng như không thực hiện bất kỳ chuyển hướng nào ở cấp máy chủ .

Các liên kết kinh điển là, cuối cùng, chỉ là một gợi ý. Công cụ tìm kiếm không phải tôn vinh nó. Hầu hết các công cụ tìm kiếm đều cố gắng tôn trọng mong muốn của chủ sở hữu trang, nhưng vào cuối ngày, kết quả tìm kiếm là những gì họ làm và nếu họ không muốn phân phối trang chuẩn của bạn, họ sẽ không làm như vậy.

Thời điểm sử dụng liên kết Canonical

Như tôi đã nói ở trên, bạn nên sử dụng liên kết trên mọi trang trùng lặp không phải là trang chuẩn. Nếu bạn có các trang tương tự, nhưng không giống nhau, đôi khi có ý nghĩa hơn khi thay đổi một trong số chúng để khác biệt hơn là tạo một trang kinh điển.

Có thể đánh dấu hai trang không hoàn toàn giống hệt như kinh điển. Chúng phải giống nhau, nhưng bạn không bao giờ chỉ cần trỏ tất cả các trang vào trang chủ của bạn. Canonical có nghĩa là trang là bản sao chính của tài liệu đó, không phải bất kỳ loại liên kết chính nào trên trang web của bạn.

Tôi nghĩ rằng điều quan trọng là phải lặp lại bit cuối cùng đó - bạn không bao giờ nên trỏ tất cả các trang của bạn vào trang chủ của bạn như trang kinh điển cho dù bạn bị cám dỗ như thế nào. Làm điều này, thậm chí do tai nạn, có thể khiến mọi trang không phải là trang chuẩn (nghĩa là mọi trang không phải là trang chủ của bạn và có liên kết rel = canonical trên đó) sẽ bị xóa khỏi chỉ mục của công cụ tìm kiếm.

Đây không phải là Google (hoặc Bing hoặc Yahoo! hoặc bất kỳ công cụ tìm kiếm nào khác) là độc hại. Họ đang làm những gì bạn yêu cầu họ làm - xem xét mọi trang trùng lặp với trang chủ của bạn và trả lại tất cả kết quả cho trang đó. Sau đó, khi khách hàng nhận được thất vọng kết thúc trên trang chủ của bạn thay vì một tài liệu có liên quan hơn, trang đó sẽ ít phổ biến hơn và sẽ giảm trong kết quả tìm kiếm. Ngay cả khi bạn khắc phục sự cố, bạn có thể giết kết quả tìm kiếm của mình trong nhiều tháng sau đó và không đảm bảo rằng thứ hạng trang web của bạn sẽ khôi phục.

Bạn không nên tạo một trang kinh điển đã bị loại trừ khỏi tìm kiếm vì một số lý do (chẳng hạn như với thẻ meta noindex hoặc bị loại trừ bởi tệp robots.txt). Để công cụ tìm kiếm tham chiếu trang như trang chuẩn, công cụ tìm kiếm phải có khả năng tham chiếu trang đó ngay từ đầu.

Các địa điểm tốt để sử dụng liên kết rel = canonical bao gồm:

Khi không sử dụng Canonical Link

Lựa chọn đầu tiên của bạn phải là chuyển hướng 301. Điều này không chỉ nói với công cụ tìm kiếm rằng URL trang đã thay đổi, nhưng nó cũng đưa mọi người đến phiên bản mới nhất (và tôi dám nói, canonicol?) Của trang.

Đừng lười biếng. Nếu bạn đang thay đổi cấu trúc URL của mình, hãy sử dụng một số hình thức thao tác tiêu đề HTTP (chẳng hạn như .htaccess hoặc PHP hoặc tập lệnh khác) để tự động thêm chuyển hướng 301.

Trong khi bạn có thể sử dụng liên kết rel = canonical, điều đó không đưa các trang cũ xuống. Và vì vậy bất cứ ai cũng có thể gặp họ bất kỳ lúc nào. Trong thực tế, nếu khách hàng có một trang được đánh dấu trang và bạn thay đổi URL nhưng chỉ cập nhật công cụ tìm kiếm bằng cách sử dụng liên kết rel = canonical, khách hàng đó sẽ không bao giờ thấy trang mới.

Liên kết rel = canonical là một công cụ hữu ích cho các trang web có nhiều nội dung trùng lặp. Bằng cách hiểu cách hoạt động, bạn có thể sử dụng nó hiệu quả. Nhưng cuối cùng, nó là một công cụ được phát hành bởi các công cụ tìm kiếm để giúp họ giữ chỉ mục tìm kiếm của họ luôn cập nhật. Nếu bạn không giữ cho máy chủ của bạn luôn sạch sẽ và cập nhật, khách hàng của bạn sẽ bị ảnh hưởng và trang web của bạn có thể bị tổn thương. Sử dụng nó một cách có trách nhiệm.