Trong SEO có thể đã rất nhiều lần bạn nhận được thông báo trong Google Search Console thông báo rằng nội dung trùng lặp, google đã chọn một trang chính tắc để lập chỉ mục. Và trang đó hoàn toàn không phải nội dung bạn muốn phân phối đến người dùng. Hiện tượng này gọi là Duplicate Content. Vậy duplicate content là gì? Làm sao để khắc phục website bị lỗi trùng lặp nội dung? Cùng SEO Mini Task tìm hiểu chi tiết qua bài viết dưới đây.
Duplicate Content là gì?
Duplicate content là một thuật ngữ trong SEO (Search Engine Optimization) để chỉ các nội dung trùng lặp trên cùng một website hoặc trên các trang web khác. Điều này có thể xảy ra khi bạn sao chép hoặc tái sử dụng các nội dung từ một trang web khác hoặc từ các trang khác trên cùng một trang web.
Ví dụ, nếu bạn đăng cùng một nội dung lên danh mục sản phẩm và trên trang tin tức của mình, thì đó được coi là nội dung trùng lặp. Ngay cả khi bạn đăng lại bài viết trên một trang web khác, nó vẫn được xem là Duplicate Content. Ngoài ra, cả các trang AMP của bạn cũng có thể bị tính là Duplicate Content nếu không được liên kết đúng cách.
Tác hại của Duplicate Content cho website
Tác hại của trùng lặp nội dung đối với website là rất nặng nề nếu không được tìm thấy và chỉnh sửa sớm. Dưới đây là một số tác hại có thể có do việc duplicate content gây ra.
Gây bối rối cho các công cụ tìm kiếm
Khi các công cụ tìm kiếm gặp phải nội dung trùng lặp, chúng không biết trang nào là trang chính thức và chất lượng nhất, vì vậy sẽ lựa chọn một trong số chúng để hiển thị trong kết quả tìm kiếm. Điều này có thể làm giảm thứ hạng của trang web và ảnh hưởng đến lượng lưu lượng truy cập và doanh thu.
Giảm thẩm quyền của url cần tối ưu
Nếu website của bạn bị Duplicate Content, thì điều đó sẽ giảm thẩm quyền của URL mà bạn muốn tối ưu SEO. Khi các trang của bạn bị trùng lặp nội dung với nhau hoặc với các trang web khác trên Internet, các công cụ tìm kiếm sẽ không biết trang nào nên xếp hạng cao hơn trên kết quả tìm kiếm. Kết quả là, các trang web của bạn sẽ giảm đáng kể thứ hạng của nó trên các kết quả tìm kiếm và trang web của bạn sẽ khó có thể được tìm thấy bởi khách hàng tiềm năng.
Gây lãng phí tài nguyên dự án seo
Việc không phát hiện được trùng lặp nội dung làm bạn tốn nhiều thời gian và công sức onpage, offpage cho cùng một nội dung. Tuy nhiên, điều này không những không mang lại kết quả tốt mà còn ảnh hưởng đến thứ hạng từ khóa và tiến độ dự án SEO.
Bị kìm hãm bởi thuật toán Google Panda
Thuật toán Google Panda được phát triển để phát hiện và xử lý các trang web có nội dung chất lượng kém, spam hoặc trùng lặp. Nó sẽ ưu tiên hiển thị các trang web có nội dung chất lượng cao và loại bỏ các trang web có nội dung trùng lặp, bị sao chép hoặc không hữu ích cho người dùng.
Vì vậy, nếu trang web của bạn chứa nhiều nội dung trùng lặp, nó có thể bị ảnh hưởng bởi thuật toán Google Panda. Khi đó, thứ hạng của trang web của bạn trên kết quả tìm kiếm sẽ giảm đi đáng kể hoặc thậm chí bị loại khỏi kết quả tìm kiếm.
Ảnh hưởng tới thứ hạng từ khóa mục tiêu
Trùng lặp nội dung cũng là một trong các nguyên nhân gây ra hiện tượng ăn thịt từ khóa (keyword canibazional) làm giảm đáng kể thứ hạng của website bạn trên công cụ tìm kiếm.
Hiển thị các kết quả không mong muốn cho người dùng
Khi xuất hiện duplicate content, google sẽ tự động chọn một trang chính tắc để hiển thị cho khách hàng. Nếu may mắn trang đấy sẽ là nội dung mà bạn nhắm mục tiêu. Nhưng hầu hết các case thực tế lại ngược lại. Google hiển thị các bài viết chưa được tối ưu cho người dùng, làm giảm đáng kể tỉ lệ chuyển đổi của website.
Nguyên nhân khiến website gặp lỗi Duplicate Content
Có rất nhiều nguyên nhân dẫn đến việc website lỗi duplicate content
Trùng lặp về mặt technical trên website
Việc code website không phải lúc nào cũng hoàn hảo, nếu lựa chọn được doanh nghiệp thiết kế website chuẩn seo thì sẽ cải thiện được chất lượng SEO cho website. Tuy nhiên, không phải doanh nghiệp nào cũng coi trọng các yếu tố chuẩn seo trong thiết kế. Chính vì vậy làm phát sinh các lỗi trùng lặp do kỹ thuật (technical) gây ra.
Trùng lặp Url
Url là yếu tố vô cùng quan trọng trong SEO tuy nhiên để tối ưu url có những quy tắc cần phải đáp ứng. Việc không tuân thủ các nguyên tắc tối ưu Url có thể dẫn đến trùng lặp nội dung. Một số trường hợp hay gặp nhất đó là:
- Chữ hoa chữ thường: https://example.com/abc-la-gi/ khác hoàn toàn với https://example.com/Abc-La-gi/
- Có gạch chéo và không có gạch chéo: Đối với trang chủ, việc có "/" hay không có google đều không phân biệt. Tuy nhiên với một url bất kì thì lại khác. Chẳng hạn: https://example.com/abc-la-gi/ và https://example.com/abc-la-gi là khác nhau. Nếu website dùng tồn tại 2 phiên bản này và không được xử lý thì website sẻ gặp trường hợp duplicate content.
- Url phiên bản mobile và PC: Phiên bản mobile và PC cần được xử lý đúng, thông thường bản Mobile sẽ khai báo canonical về PC. Nhưng vì lý do nào đó, hai phiên bản này không được khai báo hợp lý dẫn đến hiện tượng trùng lặp. Ví dụ: https://example.com/abc-la-gi/?amp=1 và https://example.com/abc-la-gi/
Phiên bản http, https, www
Việc tồn tại cùng lúc các url dạng dưới đây cũng sẽ gây trùng lặp:
- https://example.com/abc-la-gi/
- http://example.com/abc-la-gi/
- https://www.example.com/abc-la-gi/
Thông thường với các dạng này, bạn sẽ phải yêu cầu IT redirect về 1 url duy nhất. Đối với hai phiên bản http và https bạn chỉ cần cài đặt SSL cho website. Lúc này phiên bản http sẽ tự động chuyển hướng về https.
Việc tối ưu giữa url có www và non-www cũng tương tự như vậy, để xử lý điều này bạn có thể thêm mã code bên dưới vào file .htcess của website.
Redrect có www sang không có www:
RewriteCond %{HTTPS} on
RewriteCond %{HTTP_HOST} ^www\.(.*)$ [NC]RewriteRule ^(.*)$ https://%1/$1 [R=301,L]
Nếu không am hiểu về các code, bạn nên yêu cầu bộ phận IT hỗ trợ để tránh các lỗi không mong muốn.
Trùng lặp thẻ tag và sản phẩm, danh mục sản phẩm
Điều này rất hay xảy ra đối với các website thương mại điện tử. Trùng lặp xảy ra khi bạn sử dụng từ khóa sản phẩm trùng với danh mục sản phẩm dạng.
Ví dụ:
https://example.com/ao-bong-da/
https://example.com/tags/ao-bong-da/
Tuy rằng đây là hai url khác nhau, nhưng cùng trả về các sản phẩm áo bóng đá, điều này gây trùng lặp nội dung rất lớn cho website. Rất nhiều trường hợp google đã index và lập chỉ mục url tags chứ không lập chỉ mục danh mục sản phẩm. Gây ảnh hưởng đến chuyển đổi của website.
Để khắc phục tình trạng này, bạn có thể canonical link tags về link danh mục sản phẩm. Trường hợp bạn có nhiều danh mục và thẻ tags sản phẩm trùng lặp. Tối nhất bạn có thể set noindex cho thẻ tags để google ưu tiên lập chỉ mục danh mục sản phẩm. Bạn có thể làm điều này dễ dàng bởi plugin Rank Math Seo hoặc Yoast Seo.
Ngoài ra, bạn cũng có thể thông báo với bot google không lập chỉ mục thẻ tags bằng file robots.txt. Thêm đoạn mã sau vào file robots.txt ngay dưới tác nhân use-agent:
Disallow: /tags/*
Lưu ý rằng, bạn phải biết rõ bạn đang thêm gì vào file robots.txt và vị trí chính xác của file robots trên hosting. Rất may, SEO Mini Task đã có một bài hướng dẫn chi tiết về Robots.txt tại đây!
Trùng lặp do kết quả tìm kiếm nội bộ trên website
Các tìm kiếm trên website có thể gây trùng lặp, hiện tượng này rất dễ xảy ra khi kết quả tìm kiếm nội bộ không được set noindex.
Ví dụ:
https://example.com/acb/
https://example.com/acb/?seach=áo+bóng+rổ
Để xử lý trường hợp này, bạn nên cấu hình file robots.txt chặn noindex với các kết quả tìm kiếm nội bộ. Tùy thuộc vào url tìm kiếm nội bộ của bạn như thế nào mà có cú pháp hợp lý. Dưới đây là các xử lý với ví dụ trên của chúng tôi. Thêm đoạn sau vào file robots.txt, gưới use-agent:
Disallow: /?search=*
Sau đó lưu lại những thay đổi, kiểm tra lại kết quả tìm kiếm đã được gắn noindex hay chưa.
Do các yếu tố Onpage trên website
Các yếu tố Onpage cũng là nguyên nhân gây ra hiện tượng trùng lặp trên website. Dưới đây là một số trường hợp duplicate content thường gặp nhất.
Thẻ heading 1,2,3
Các thẻ heading toàn trang như Mô tả sản phẩm, Hướng dẫn sử dụng, ... nếu không được xử lý tốt sẽ gây hiện tượng trùng lặp toàn trang ảnh hưởng đến toàn bộ website. Vậy nên đối với các thẻ dùng chung, bạn nên set thẻ P hoặc nếu muốn set heading thì để các thẻ heading từ 4 trở lên. Điều này giúp hạn chế tối đa hiện tượng duplicate thẻ heading.
Trùng lặp Seo Title
Trùng lặp SEO Title cũng là thường hợp thường xuyên gặp phải. Việc không tối ưu page title làm cho CMS tự động lấy title làm trùng lặp hàng loạt trên website. Vì vậy, bạn phải tối ưu cẩn thận Seo title và đảm bảo mỗi trang có một tile độc nhất, không trùng lặp. Xem thêm checklist tối ưu seo title chuẩn nhất tại đây!
Meta Description
Trùng lặp Meta Description là khi hai trang web hoặc nhiều trang web khác nhau có cùng một mô tả Meta Description hoặc nội dung mô tả giống nhau. Điều này có thể xảy ra khi các trang web bị sao chép hoặc khi các trang web khác sử dụng cùng một mô tả Meta Description cho các trang của họ.
Tuy nhiên, trùng lặp Meta Description có thể ảnh hưởng đến việc tối ưu hóa công cụ tìm kiếm (SEO) của trang web, vì các công cụ tìm kiếm có thể coi đó là một dấu hiệu của nội dung trùng lặp hoặc spam. Nếu nhiều trang web có cùng một mô tả Meta Description, các công cụ tìm kiếm có thể không hiển thị mô tả của trang web bạn trong kết quả tìm kiếm.
Vì vậy, để tránh trùng lặp Meta Description, bạn nên tạo ra các mô tả Meta Description độc đáo và thu hút người dùng. Ngoài ra, bạn nên đảm bảo rằng mô tả Meta Description của trang web của bạn phản ánh đúng nội dung của trang và không trùng lặp với bất kỳ trang web nào khác.
Trùng lặp do nội dung gây ra
Việc vô hình dung xuất bản hay nhân bản nội dung trên website làm cho trùng lặp là điều hoàn toàn xảy ra. Ngoài ra việc copy một phần của nội dung website tái sử dụng trong các bài viết khác có thể dẫn đến trùng lặp nội dung nghiêm trọng trên website.
Biến thể nhiều thuộc tính cùng 1 sản phẩm
Ví dụ bạn bán áo quần và có 2 biến thể về màu sắc riêng biệt là màu đỏ và màu cam. Lúc này mỗi biến thể sẽ tạo ra một url khác nhau với cùng nội dung. Vô hình dung gây trùng lặp nội dung cho website của bạn. Để xử lý trường hợp này, bạn nên chọn ra một url chính và thực hiện thêm thẻ canonical sản phẩm còn lại về sản phẩm chính. Tránh trường hợp trùng lặp nội dung.
Xuất bản nhiều bài viết cùng một nhóm từ khóa
Có 2 nguyên nhân gây ra hiện tượng này, đó là mỗi keyword viết một bài hoặc nhiều bài cho một keyword. Đây là kỹ thuật seo ngày xưa và hiện tại đã lỗi thời. Không những không giúp ranking từ khóa tốt mà ngược lại còn gây trùng lặp, ảnh hưởng đến kết quả xếp hạng của website.
Công cụ kiểm tra trùng lặp cho website
Hiện nay có rất nhiều công cụ kiểm tra trùng lặp nội dung cho website. Sau đây là một số công cụ miễn phí phổ biến mà bạn có thể sử dụng:
1. Copyscape: Là công cụ kiểm tra trùng lặp nội dung miễn phí và trả phí hàng đầu. Copyscape có khả năng phát hiện trùng lặp nội dung trên toàn bộ Internet và cung cấp cho bạn các báo cáo chi tiết về việc sao chép nội dung trên trang web của bạn.
2. Small SEO Tools: Là một trang web cung cấp nhiều công cụ SEO miễn phí, bao gồm công cụ kiểm tra trùng lặp nội dung và trùng lặp Meta Description. Công cụ của họ có khả năng kiểm tra trùng lặp nội dung trên nhiều trang web và đưa ra báo cáo chi tiết về các kết quả.
3. Siteliner: Là một công cụ miễn phí để kiểm tra trùng lặp nội dung trên trang web của bạn. Siteliner cung cấp cho bạn một báo cáo chi tiết về các trang web trong trang web của bạn và chỉ ra các vấn đề trùng lặp nội dung.
4. Google Search Console: Là công cụ miễn phí từ Google để giúp bạn quản lý và tối ưu hóa trang web của mình. Trong Google Search Console, bạn có thể sử dụng tính năng "Bộ lọc tệp trùng lặp" để tìm kiếm các trang có nội dung trùng lặp và tìm giải pháp cho vấn đề này.
5. Screaming Frog: là một công cụ rất mạnh mẽ để kiểm tra trùng lặp nội dung trên trang web của bạn. Công cụ này sẽ quét toàn bộ trang web và cho phép bạn xác định các trang web có nội dung trùng lặp, giúp bạn tìm ra các trang web cần sửa đổi để tránh các vấn đề liên quan đến SEO.
Chú ý rằng các công cụ kiểm tra trùng lặp nội dung chỉ là một phần của chiến lược tối ưu hóa công cụ tìm kiếm (SEO). Bạn nên sử dụng nó để đảm bảo rằng trang web của bạn không có nội dung trùng lặp, nhưng cũng nên tập trung vào việc tạo ra nội dung chất lượng và độc đáo để cải thiện hiệu quả SEO của trang web của bạn.
Tổng kết
SEO Mini Task vừa giải thích chi tiết duplicate content là gì? Cách xử lý các trường hợp trùng lặp nội dung thường gặp trên website. Hi vọng bài viết có thể giúp bạn xử lý triệt để lỗi này, không gây ảnh hưởng đến kết quả chiến dịch SEO.
0 Nhận xét