Xử lý các vấn đề về nội dung trùng lặp trên trang web

Vấn đề nội dung trùng lặp phát sinh khi nhiều phiên bản của một trang được lập chỉ mục bởi công cụ tìm kiếm. Sự trùng lặp có thể là cả tại chỗ và ngoài trang web: sự trùng lặp tại chỗ hiển thị cùng một nội dung trên nhiều trang của một trang web và sự trùng lặp ngoài trang web là nội dung tương tự với trang web của bạn cũng như trên bất kỳ trang web nào khác.

Nội dung trùng lặp trên cùng một trang web khiến công cụ tìm kiếm khó quyết định xếp hạng trang nào.

Dưới đây là một số sự cố phổ biến nhất với nội dung trùng lặp trên trang web và cách khắc phục chúng:

Các vấn đề về nội dung trùng lặp

  • Các vấn đề với nội dung trùng lặp có thể dẫn đến giảm tốc độ thu thập thông tin – điều này xảy ra vì Googlebot đang bận thu thập thông tin các trang tương tự một cách không cần thiết
  • Xếp hạng trang không chính xác dẫn đến trải nghiệm người dùng kém
  • Có thể có sự chậm trễ trong xếp hạng cho các trang web mới
  • Công cụ tìm kiếm không biết trang nào để lập chỉ mục
  • Công cụ tìm kiếm không xác định trang nào nên được xếp hạng cho một truy vấn tìm kiếm

Nguyên nhân của vấn đề trùng lặp nội dung

Các thông số URL như theo dõi lần nhấp và mã phân tích nhất định có thể gây ra các vấn đề về nội dung trùng lặp. Google đưa ra lời khuyên tại đây về các URL có chứa các thông số nhất định.

Nội dung phiên bản thân thiện với bản in cũng có thể gây ra sự cố trùng lặp nội dung khi lập chỉ mục các phiên bản khác nhau của một trang.

Mô tả sản phẩm giống hệt nhau cho các sản phẩm tương tự, trong trang web của bạn hoặc trên nhiều trang web bán cùng một sản phẩm, là vấn đề mà các trang web thương mại điện tử chủ yếu gặp phải khi sử dụng mô tả sản phẩm chung chung, tức là bản sao do nhà sản xuất cung cấp. Bởi vì chúng đến từ cùng một nguồn, chúng giống nhau 100%.

Một yếu tố khác tạo ra các vấn đề về nội dung trùng lặp là ID phiên. Sự cố xảy ra khi các ID phiên khác nhau được chỉ định cho mỗi người dùng truy cập một trang web.

Sử dụng các URL hoặc miền khác nhau như phương pháp M. cho các phiên bản di động của trang web cũng có thể dẫn đến sự cố.

Nội dung trùng lặp cũng có thể phát sinh khi cả hai phiên bản www và không phải www của một trang đều có sẵn và cùng một nội dung được cung cấp trên cả hai.

Các nguyên nhân khác dẫn đến nội dung trùng lặp có thể là do biên tập và cung cấp nội dung; Phân trang các bình luận; nội dung tương tự trên một trang đăng, trang chủ và trang lưu trữ; hoặc một kiến ​​trúc trang web trong đó có nhiều đường dẫn đến cùng một trang.

Matt Cutts đưa ra một số lời khuyên tuyệt vời về những gì các trang web thương mại điện tử có thể làm để tránh vấn đề nội dung trùng lặp ở đây.

Giải quyết vấn đề nội dung trùng lặp

Chuyển hướng nội dung trùng lặp: Thiết lập chuyển hướng 301 từ trang nội dung đã sao chép sang trang nội dung gốc. Đảm bảo bạn chuyển hướng bất kỳ url nội dung trùng lặp cũ nào đến các url chuẩn chính xác.

Sử dụng thẻ “rel = canonical”: Việc sử dụng thẻ “rel = canonical” cho các công cụ tìm kiếm biết phiên bản trang nào mà công cụ tìm kiếm sẽ hiển thị trên trang kết quả tìm kiếm. Thẻ chuẩn nằm trong tiêu đề của trang web.

Sử dụng thẻ meta: Sử dụng thẻ meta để cho các công cụ tìm kiếm biết những trang nào bạn không muốn được lập chỉ mục.

Cung cấp thông tin cẩn thận: Hãy cẩn thận nếu bạn cung cấp nội dung của mình cho các trang web khác. Đảm bảo rằng mọi trang web mà nội dung của bạn được cung cấp cho các điểm đến trang web của bạn. Bạn cũng có thể yêu cầu họ sử dụng “không theo dõi”.

Nếu bạn có một số trang giống nhau, hãy mở rộng các trang để chứa nội dung độc đáo hoặc hợp nhất chúng thành một trang duy nhất.

Cùng một url cho các trang web di động: Để giải quyết vấn đề nội dung trùng lặp trong trường hợp phiên bản di động của trang web của bạn, một URL đáp ứng hoặc cùng một URL sẽ giải quyết được vấn đề.

Kiểm tra các bài đăng của khách xem có trùng lặp không: Trước khi chấp nhận các bài đăng của khách, hãy kiểm tra xem chúng có trùng lặp không. Đạo văn có thể dẫn đến các hình phạt nghiêm khắc đối với các trang web hợp pháp.

Cho Google biết cách lập chỉ mục trang web của bạn: Với Google, bạn có thể quyết định trang nào sẽ thu thập thông tin và trang nào không. Bạn cũng có thể cho Google biết bạn muốn các trang của mình được lập chỉ mục như thế nào.

Nhất quán với chiến lược liên kết nội bộ của bạn: Chỉ cần bám vào một định dạng cụ thể để tránh nhầm lẫn.

Công cụ

Công cụ quản trị trang web của Google: Sử dụng Công cụ quản trị trang web của Google để tìm nội dung trùng lặp trong mô tả meta và mô tả tiêu đề. Nếu bạn đang sử dụng Công cụ quản trị trang web của Google, hãy đăng nhập vào tài khoản của bạn, nhấp vào Chẩn đoán, sau đó nhấp vào Đề xuất HTML. Bạn sẽ thấy một bảng có các thẻ tiêu đề trùng lặp và các mô tả meta trùng lặp. Nếu bạn nhấp vào một trong các liên kết, bạn sẽ được hiển thị các URL có sự trùng lặp.

Người giới thiệu trang web: Sử dụng Siteliner để kiểm tra nội dung trùng lặp và liên kết bị hỏng bằng cách nhập url trang web của bạn và nhấp vào truy cập. Siteliner tạo một báo cáo đầy đủ về nội dung trùng lặp, liên kết bị hỏng và các trang bị bỏ qua. Trong phần Chi tiết Trang web, hãy nhấp vào Nội dung Trùng lặp để biết tổng quan về URL, tiêu đề, các từ đối sánh, tỷ lệ phần trăm đối sánh và các trang đối sánh.

Ếch kêu: Trình thu thập thông tin ScreamingFrog tìm kiếm các sự cố lên đến 500 trang, bao gồm cả nội dung trùng lặp miễn phí. Nhấp vào Tiêu đề trang. Trong phần Bộ lọc, chọn Nhân bản. Bạn sẽ nhận được danh sách các URL đã sao chép nội dung. Phân tích chúng và sửa chữa chúng.

Trình kiểm tra nội dung trùng lặp Virant: Gửi tên miền của bạn và Virante sẽ quét trang web của bạn để xem có bất kỳ bản sao nội bộ nào không. Nó thực hiện kiểm tra bộ nhớ cache của google, kiểm tra 404 và kiểm tra giữa www và không phải www bằng cách kiểm tra các tiêu đề được trả về bởi cả hai phiên bản của url, phân phối PR và các trang bổ sung trong chỉ mục google trở thành.

Xenu: Xenu tìm kiếm các liên kết bị hỏng. Đi qua bảng để kiểm tra các tiêu đề giống hệt nhau. Khởi động Xenu Sleuth. Đi tới Tệp và nhấp vào Kiểm tra URL. Sau khi bạn nhấp vào OK, Xenu bắt đầu thu thập dữ liệu các URL. Lưu tệp và xuất nó sang MS Excel. Sau đó, bạn có thể phân tích bảng để tìm các vấn đề trùng lặp.

SmallSeoTools: Để kiểm tra đạo văn, hãy sao chép và dán bài đăng trên blog của bạn vào hộp. Công cụ cho bạn biết nội dung của bạn nguyên bản như thế nào. Sao chép nội dung bạn muốn kiểm tra tính trùng lặp và dán vào ô màu vàng trên công cụ. Nhập mã captcha và nhấp vào “Kiểm tra đạo văn”. Hồ sơ lấy ở nơi khác được đánh dấu màu đỏ. Bạn có thể nhấp vào văn bản được đánh dấu để xem nguồn.

Vấn đề trùng lặp nội dung không phải là điều không thể sửa được. Thay thế nội dung trùng lặp bằng nội dung độc đáo và nhiều thông tin cũng hữu ích cho người dùng và công cụ tìm kiếm sẽ mang lại cho trang web của bạn một sự thúc đẩy rất cần thiết.

Nếu bạn cho rằng chúng tôi đã bỏ lỡ một số công cụ phát hiện nội dung trùng lặp quan trọng, vui lòng cho chúng tôi biết bên dưới. Ngoài ra, bạn cũng có thể gửi phản hồi cho chúng tôi nếu bạn có thêm thông tin và mẹo xử lý nội dung trùng lặp.

Nguồn: www.searchenginewatch.com

Trả lời

Chat Zalo