Nếu bạn đang tìm hiểu về SEO hay đang là một SEO-er thì chắc hẳn không quá xa lạ với canonical. Vậy với những ai chưa có nhiều kiến thức về SEO, bạn đã biết Canonical là gì chưa? Những lưu ý cùng với cách sử dụng của nó như thế nào? Tất cả những thông tin với Web Chuẩn nhé.
Mục lục
Canonical là gì?
Thẻ Canonical hay còn được gọi là Rel Canonical chính là một cách thông báo cho các công cụ tìm kiếm được biết rằng URL đó là một bản sao của một URL gốc mà bạn đang muốn công cụ tìm hiểu hiển thị URL đó ở trên kết quả tìm kiếm
Nói đơn giản hơn thì việc sử dụng Canonical chính là để hợp nhất các URL có nội dung trùng lặp hay tương tự ở trên nhiều URL khác nhau.
Tầm quan trọng của Canonical trong SEO
Khi có một website đang càng ngày trở nên càng lớn và có nhiều thông tin hơn nó sẽ dẫn đến việc xuất hiện ở những trang khác có nội dung tương tự nhau hay trùng lặp. Điều này sẽ gây ra vấn đề “trùng lặp nội dung” cũng như website sẽ bị các thuật toán của công cụ tìm kiếm phạt.
Có thể nói một website khi gặp vấn đề về trùng lặp nội dung sẽ vô cùng phức tạp. Khi công cụ tìm kiếm thu thập được các URL với nội dung giống nhau hay tương tự nhau và nếu các URL đó có đủ điều kiện index và xếp hạng cho một cụm từ khóa nhất định. Thì điều này sẽ khiến cho công cụ tìm kiếm lựa chọn xếp hạng của URL mà bạn không mong muốn. Và Canonical Tags chính là một giải pháp dành cho vấn đề này.
- Chỉ định ra một URL chuẩn mà bạn muốn cho người tìm kiếm nhìn thấy được kết quả tìm kiếm
- Hợp nhất được các URL với nội dung tương tự nhau hay trùng lặp
- Đơn giản hóa được việc theo dõi các chỉ số cho một chủ đề hoặc một sản phẩm
- Quản lý nội dung được phân phối nếu nội dung xuất bản ở trên các miền khác nhau, khi đó bạn muốn có thể hợp nhất xếp hạng của các trang cho URL ưa thích
- Để tránh bots các công cụ tìm kiếm dành thời gian để thu thập dữ liệu ở các trang trùng lặp. Khi đó các bots sẽ khai thác được tối đa trang web của bạn và dành nhiều thời gian để thu thập dữ liệu của trang mới ở trên web thay vì thu thập dữ liệu ở phiên bản dành cho máy tính để bàn và thiết bị di động
Tại sao khi SEO website nên dùng Canonical URL?
Khi sử dụng Canonical URL đúng cách và hợp lý thì nó sẽ giúp người dùng xử lý được những vấn đề khi bị công cụ tìm kiếm đánh lỗi trùng lặp nội dung ở trên website. Bản thân của SEO cũng rất dị ứng với các nội dung bị trùng lặp ở các website và giữa các trang ở trên cùng website. Sự trùng lặp sẽ làm tốn thời gian và tài nguyên của SEO khi phải thu thập nhiều thông tin ở các trang giống nhau. Đồng thời nó cũng đem đến sự khó chịu cho người tìm kiếm thông tin khi vào các trang website có nội dung tương tự nhau.
Do đó, một khi website của bạn đã chỉ rõ được trang nào là chuẩn trong các trang mà bạn thấy có nội dung bị trùng lặp thì bạn chủ động làm cho công việc thu thập thông tin này trở nên dễ dàng hơn. Điều đó cũng có nghĩa là nó làm cho website của bạn thân thiện hơn với SEO và cũng đã góp phần trong việc tối ưu hóa cho website.
Cách sử dụng Canonical để SEO hiệu quả
Ở các trang website thương mại điện tử, các trang bán hàng chính là những trang dễ có những nội dung trùng lặp nhất. Bởi ở trong cùng một danh mục sản phẩm thì sẽ có nhiều phiên bản, kiểu dáng khác nhau nhưng nếu cùng một loại hay một tên gọi, tính năng và chỉ khác nhau về màu sắc, size số, giá cả, ký hiệu nhỏ mà thôi.
Tuy nhiên, không phải chỉ có những trang thương mại điện tử, bán hàng đều là “nạn nhân” của sự trùng lặp nội dung. Mà hiện nay, hầu hết tất cả các trang website đều gặp phải những nguy cơ này. Vì thế, việc sử dụng các Canonical dành cho website chính là một điều hết sức quan trọng mà các website cần phải có.
Có rất nhiều phương pháp để tối ưu Canonical. Tuy nhiên, không phải ai cũng biết cách và lựa chọn được cách sử dụng thẻ Canonical ở trong SEO để đem đến hiệu quả tốt nhất cho website.
Phương pháp sử dụng URL tuyệt đối
Google đã tuyên bố bằng cách tốt nhất là không sử dụng những đường dẫn tương đối. Bạn nên để URL của mình ở link tuyệt đối có nghĩa là dùng rel=canonical khi đường dẫn của bạn được tối ưu.
Giải pháp chính là bạn nên sử dụng dựa vào cấu trúc: <link rel = “Canonical” href=”https//domain.com/sample-page/”/>.
Phương pháp sử dụng URL chữ thường
Vì google có thể phân biệt được URL chữ hoa và chữ thường là hai URL khác nhau. Cũng vì thế, cách tốt nhất để google có thể lập chỉ mục đúng link chính là URL chữ thường bạn nên sử dụng Canonical tags cho URL chữ thường.
Phương pháp sử dụng phiên bản miền chính xác (sử dụng https thay thế cho http)
Nếu website của bạn chuyển sang SSL bạn cần đảm bảo rằng đã khai báo được đúng với google các liên kết được chuyển sang https ở trong thẻ rel=canonical. Bởi vì nếu bạn khai báo nhầm URL cũ http thì sẽ dẫn đến việc nhầm lẫn và thay đổi thứ hạng của website của bạn.
- <link rel=”canonical” href=”https://domain.com/sample-page/”/>
- Còn nếu như website của bạn chưa được chuyển từ http sang https thì bạn có thể sử dụng rel=canonical với đủ cú pháp sau đây:
<link rel= “canonical” href=”http://domain.com/sample-page/”/>
Phương pháp mỗi website chỉ sử dụng một thẻ Canonical
Có thể bạn nghĩ rằng Canonical có thể được sử dụng càng nhiều càng tốt nhằm ngăn chặn được sự trùng lặp về nội dung. Nhưng trên thực tế nếu như website của bạn có nhiều khai báo thẻ Canonical thì google sẽ tự động bỏ qua những gợi ý của thẻ rel=canonical đó.
Do đó, bạn chỉ cần làm thật tốt việc tối ưu ở thẻ tiêu đề và phần mô tả ở nội dung xuất bản.
Thẻ Canonical sẽ hỗ trợ SEO như thế nào?
Thẻ Canonical sẽ giúp giải quyết được những vấn đề về nội dung trùng lặp bằng cách sử dụng một URL chính thức và duy nhất. Mọi bản sao của Canonical sẽ được xác nhận về URL chính thức đó. Có thể thấy được nhiều trường hợp cần bắt buộc sử dụng thẻ Canonical như:
- http và https
- www và non www
- Trang chủ và index.php
- Sử dụng phiên bản AMP hay mobile
Để thẻ Canonical ở đâu?
Về cú pháp của thẻ Canonical vô cùng đơn giản so với những thẻ khác và vị trí đặt của thẻ này chính là ở <head>. Và thông thường với mã nguồn wordpress thì người ta có thể sử dụng plugin Yoast SEO để tạo ra thẻ Canonical một cách tự động.
Thẻ Canonical không hoạt động
Thẻ Canonical không phải chỉ là một chỉ thị do đó nó có thể sẽ bị bỏ qua, Và việc có các URL xung đột ở trong sitemap hay trong liên kết nội bộ sẽ đưa ra các tín hiệu khá lộn xộn.
Ngoài ra, còn có những trường hợp như sao chép bài viết và không thay đổi thẻ Canonical về URL duy nhất. Bạn nên sử dụng URL tuyệt đối chứ không phải tương đối để tránh Canonical gặp lỗi. Các thẻ Canonical sẽ tự động định nghĩa và gây ra nhiều việc có nhiều trang cùng thể hiện với công cụ tìm kiếm như đó chính là một phiên bản ưu tiên. Nếu website có nhiều thẻ Canonical khác nhau thì ở trên cùng một nội dung hiển thị thì google sẽ loại bỏ cả hai.
Google sẽ làm gì nếu như phát hiện các dấu hiệu lộn xộn như ở trên. Họ sẽ cố tìm ra và xác định được những tín hiệu khác nhau như liên kết nội bộ, thẻ Canonical, sitemap hay các yếu tố khác. Ví dụ như nó có thể lựa chọn những đường dẫn ngắn hơn so với các đường dẫn dài hay cũng có thể là chọn https thay vì http.
Google sẽ ưu tiên cho các trang https hơn là các trang http tương tự nếu các trang có trùng nội dung. Trừ khi nó có các tín hiệu gây xung đột như sau:
- Trang https có chứng chỉ SSL không hợp lệ
- Trang https bị chặn thu thập
- Trang https có chứa phụ thuộc không an toàn
- Trang https chuyển hướng người dùng đến hay thông tin qua trang http
- Trang https chứa một thẻ meta robot noindex
- Trang https có chứa liên kết rel=Canonical đến trang http
Tương tác với các thẻ khác và canonical
Một thẻ Canonical rất dễ dàng bị sai bởi một số chi tiết nhỏ nhặt như ở lỗi đánh vần, dấu gạch chéo hay đặc biệt trong bộ đánh số trang hoặc hreflang
Ở trong các bộ này thì việc có trang khác nhau được lập chỉ mục chứ không phải là trang có trong thẻ sẽ khiển tập hợp các trang sẽ không hợp nhất như chúng nên thế. Như là việc thiết lập Canonical ở trang 2 của một bộ đường dẫn ở trang 1. Các thẻ noindex và canonical cũng được sử dụng cùng nhau. Tôi thấy các trường hợp khi thẻ canonical dường như sẽ đưa thẻ noindex tới phiên bản ưu tiên.
Những ứng dụng khác của thẻ canonical
Bạn có biết được rằng các thẻ canonical được sử dụng với nhiều tên miền khác nhau. Đây thực sự sẽ là một cách vô cùng ưa chuộng khi sử dụng để kiểm soát nội dung. Bạn cũng nên tránh trường hợp trùng lặp với các phiên bản phụ của trang web như là phiên bản mobile hay phiên bản AMP. Theo google thì sắp tới sẽ không cần sự thay đổi của các canonical cho chỉ mục ưu tiên di động.
Những lưu ý khi sử dụng thẻ Canonical
Tránh sử dụng gắn thẻ Canonical chéo
Việc gắn thẻ Canonical chéo chính là gắn thẻ Canonical trang A vào trang B hay ngược lại sẽ khiến cho công cụ tìm kiếm bỏ qua thẻ hoặc hiểu sai. Để tránh cho điều này xảy ra thì cần phải cho công cụ tìm kiếm hiểu được ý định gắn thẻ dựa theo một cách rõ ràng.
Kiểm tra lại thẻ Canonical sau khi gắn
Sau khi gắn cần kiểm tra lại đã gắn đúng URL chưa, tránh trường hợp xảy ra lỗi hay sơ xuất dẫn đến việc gắn sai thẻ Canonical. Đặc biệt ở trong những trang thương mại điện tử và hệ thống quản lý nội dung. Hiện nay, có rất nhiều tool chất lượng để kiểm tra Canonical URL trong đó Open SEO Stats sẽ có nhiều lựa chọn cho SEOer
Cẩn thận khi dùng với những trang gần như duplicate nội dung
Thẻ Canonical có thể được dùng cho những trang có nội dung gần như trùng lặp nhau. Như những trang về các sản phẩm chỉ khác nhau đơn vị tiền tệ, tính năng và địa điểm. Lưu ý nếu nội dung của các trang quá khác nhau thì công cụ tìm kiếm có thể sẽ bỏ qua thẻ Canonical
Trên đây là những thông tin cơ bản mà WebChuan giúp bạn giải đáp thắc mắc Canonical là gì cũng như nó đã bổ sung một số kiến thức dành cho SEOer vô cùng bổ ích.