Google Panda: Hiểu hoạt động kỹ thuật bên trong

Khái niệm về công cụ tìm kiếm rất đơn giản. Cơ sở dữ liệu vị trí của các trang và trả về kết quả phù hợp nhất.

Các công cụ tìm kiếm đơn giản chỉ hiểu các từ trên các trang trong cơ sở dữ liệu của họ và trả về các trang có chứa các từ được tìm kiếm đó. Về cơ bản, Google đã đưa ra khả năng sắp xếp lại thứ tự các kết quả tìm kiếm này dựa trên số lượng các trang khác trên internet liên kết đối với họ.

Kể từ đó, Google và các công cụ tìm kiếm khác đã cải thiện các yếu tố xếp hạng cơ bản này và phát triển hàng nghìn cách để sắp xếp lại Kết quả tìm kiếm để chỉ những kết quả phù hợp nhất được hiển thị cho người dùng. Ví dụ: “tính mới” của nội dung hoặc vị trí nơi tìm kiếm diễn ra.

Panda chỉ là một cách khác mà Google sắp xếp lại kết quả dựa trên chất lượng nội dung của trang web.

Trong bài viết này, chúng tôi suy đoán chi tiết những gì có thể học được từ “bằng sáng chế Panda”. Từ vựng được sử dụng thường mơ hồ và đôi khi có thể gây khó khăn trong việc duy trì ý nghĩa, vì vậy đây là một bản phân tích ngắn gọn về khái niệm sẽ hữu ích trong suốt.

  1. gấu trúc làm mới thông tin tổng hợp về các liên kết và truy vấn liên quan đến một trang web.
  2. Với tìm kiếm của người dùng, mỗi danh sách kết quả (URL / trang) nhận được xếp hạng ban đầu dựa trên mức độ liên quan cho tìm kiếm và chất lượng trang.
  3. Các phép tính # 1 và # 2 xác định xem danh sách kết quả (url / trang) cao hơn hay thấp hơn giá trị ngưỡng.
  4. Kết quả được sắp xếp lại theo giá trị cuối cùng.

Đánh giá và “xếp hạng gấu trúc” mới

Vào tháng 2 năm 2011, Google đã thực hiện một thay đổi cơ bản về thứ tự của các kết quả tìm kiếm. Trong đó họ giải thích:

Bản cập nhật này được thiết kế để giảm thứ hạng cho các trang web chất lượng kém – các trang web có ít giá trị gia tăng cho người dùng, sao chép nội dung từ các trang web khác hoặc các trang web không hữu ích lắm.

Họ tiếp tục nói:

… điều quan trọng là các trang chất lượng cao sẽ được khen thưởng và đó chính xác là những gì thay đổi này đang thực hiện.

Panda đã xem xét chất lượng của nội dung ở khía cạnh Cạnh? ˅.

Hình ảnh bằng sáng chế của Google Panda

Tóm lại, Google đã chỉ định một giá trị cho mọi trang đủ điều kiện cho kết quả tìm kiếm, giá trị này xác định kết quả tìm kiếm cho một truy vấn tìm kiếm nhất định dựa trên chất lượng của tập đoàn (ví dụ: một trang web) mà trang được liên kết đến. Đây là một bản tóm tắt đầy khó khăn và có vẻ phức tạp để tự động hóa theo chương trình.

Danny Sullivan, người sáng lập của Search Engine Land, cho biết trong một bài báo được xuất bản 4 tháng sau khi Panda ra mắt: “Hiện tại có quá nhiều khả năng xử lý để thực hiện phân tích trang cụ thể này. Thay vào đó, Google chạy bộ lọc thường xuyên để tính toán các giá trị cần thiết. “

Chúng tôi đã học được những gì được mô tả ở đây là Cập nhật, trong trường hợp các trang web bị tấn công hoặc bỏ chặn bởi Ngưỡng gấu trúc.

Lưu ý: (Theo Google, điều này gần đây đã được tích hợp vào quy trình làm việc bình thường của họ, vì vậy không còn “cập nhật” nữa).

Tua đi nhanh hơn 3 năm và hơn 25 bản cập nhật Panda khi Bill Slawski phát hiện ra bằng sáng chế có tên Navneet Panda, kỹ sư của Google đã viết bản cập nhật Panda. Bill lưu ý rằng Panda “… nhằm mục đích cải thiện kết quả tìm kiếm hơn là phạt các trang web hoặc xác định các nỗ lực thao túng kết quả tìm kiếm.” Đây là điểm khác biệt quan trọng khi so sánh Panda với các bản cập nhật khác của Google.

Để cung cấp cho phân tích bằng sáng chế sau trong một bối cảnh nhất định, chúng tôi gọi là điểm chất lượng dựa trên nhóm mới mà Google đã tạo ra Xếp hạng Panda. Dựa trên cách Google xác định ban đầu các trang có liên quan cho các truy vấn tìm kiếm, Xếp hạng trang.

Bằng sáng chế ‘Xếp hạng gấu trúc’

Theo như chúng ta có thể nói về độ phức tạp của một bằng sáng chế, Panda dường như là một quá trình gồm hai phần nói một cách đơn giản nhất. Đối với bất kỳ URL nào thích hợp cho một truy vấn tìm kiếm cụ thể:

  • Điểm ban đầu được tạo – cấp URL, mức độ liên quan đến truy vấn và / hoặc điểm chất lượng.
  • Nếu có, các yếu tố sửa đổi dựa trên nhóm Đã được áp dụng.

Điểm ban đầu

Bước đầu tiên trong việc tạo Xếp hạng Panda là tạo điểm số ban đầu cho mỗi danh sách URL trong bối cảnh của một yêu cầu cụ thể. Bằng sáng chế đi vào chi tiết hơn: “… thước đo mức độ liên quan của tài nguyên (danh sách URL) đối với truy vấn tìm kiếm, thước đo chất lượng của tài nguyên (danh sách URL) hoặc cả hai.”

BƯỚC MỘT: Sử dụng cụm từ tìm kiếm, chỉ định giá trị ban đầu cho tất cả các URL phù hợp dựa trên:

  • Mức độ liên quan đến truy vấn.
  • Đo lường chất lượng.

Suy đoán về điểm ban đầu và tóm tắt

Điểm số ban đầu được tạo ra từ các yếu tố không mới. Panda đặc biệt vì nó là một cách khả thi để tự động hóa việc sắp xếp lại các kết quả tìm kiếm dựa trên chất lượng URL của nhóm VS.

Yếu tố sửa đổi dựa trên nhóm

Khi xếp hạng ban đầu đã được tạo cho mỗi URL cho một truy vấn tìm kiếm cụ thể, xếp hạng đó sẽ dựa trên chất lượng của tập đoàn url là giao.

Thay đổi yếu tố cho Google Panda cho nhóm tài nguyên

Trang web là một loại nhóm mà Google đề cập đến nhóm dựa trên địa chỉ nhiều lần trong toàn bộ bằng sáng chế, nhưng cung cấp các khả năng về một nhóm có thể trông như thế nào:

… một số tài nguyên trên Internet. Một nhóm có thể được định nghĩa theo nhiều cách khác nhau. Nhóm tài nguyên dựa trên địa chỉ là một nhóm tài nguyên được xác định bởi địa chỉ Internet, ví dụ: Bộ định vị tài nguyên thống nhất (URL), của các tài nguyên trong nhóm. Các tài nguyên được nhóm lại để một tài nguyên không thể nằm trong nhiều hơn một nhóm tài nguyên. Ví dụ, một nhóm tài nguyên có thể bao gồm bất kỳ tài nguyên nào có thể được truy cập bằng một tên miền cụ thể. Nghĩa là, nhóm có thể bao gồm http://www.domain.com/resource1, http://www.domain.com/resource2, http://www.domain.com/resourceN, v.v. bất kể khi nào Tìm kiếm động cơ 130 tài nguyên có sẵn để lập chỉ mục lần đầu tiên. Ngoài ra, một nhóm tài nguyên có thể bao gồm bất kỳ tài nguyên nào có thể được truy cập bằng một tên máy chủ cụ thể, ví dụ: B. http://host.example.com/resource1, http://host.example.com/resource2, http: // host.example.com/resourceN, v.v. Có thể có các nhóm dựa trên địa chỉ khác. Ví dụ: một nhóm cụ thể chỉ có thể bao gồm một tập hợp con của các tài nguyên có thể được truy cập bằng tên máy chủ lưu trữ hoặc tên miền cụ thể.

Người phát ngôn bằng sáng chế muốn dự đoán rằng bất cứ điều gì có thể là những gì có ý nghĩa cho việc kiện tụng.

BƯỚC HAI: Khi các URL thích hợp với cụm từ tìm kiếm đã được chỉ định điểm ban đầu, hãy sửa đổi điểm dựa trên chất lượng của các nhóm mà chúng được chỉ định. Đối với tất cả các URL trong một nhóm, Điểm chất lượng dựa trên việc xác định đếm từ:

  • Yêu cầu tham chiếu.
  • Các liên kết độc lập.

Số lượng nhóm truy vấn tham chiếu

Truy vấn tham chiếu là khi người tìm kiếm sử dụng truy vấn tìm kiếm để tìm một URL cụ thể.

Lưu ý: Để biết thêm thông tin về các truy vấn tham khảo, hãy xem Tóm tắt Dòng chảy và Suy đoán Panda bên dưới.

Số lượng nhóm liên kết độc lập

Các liên kết độc lập cụ thể là các liên kết “đã được kiểm tra” tham chiếu đến một URL.

Tóm tắt và suy đoán sửa đổi dựa trên nhóm

Panda đã lấy mức độ liên quan và xếp hạng chất lượng ban đầu ở cấp URL và thay đổi chúng theo yếu tố dựa trên nhóm, có tính đến các truy vấn tham chiếu và các liên kết độc lập.

Dòng chảy gấu trúc

Hình ảnh bằng sáng chế sau đây mô tả quá trình của Panda.

  • Tạo xếp hạng ban đầu cho tất cả các mục nhập URL thích hợp cho một truy vấn tìm kiếm cụ thể.
  • Xác định xem truy vấn có thể điều hướng được không, nếu có, hãy để nguyên điểm số ban đầu.
  • Nếu xếp hạng ban đầu của URL dưới ngưỡng xếp hạng chất lượng của nhóm, hãy thay đổi xếp hạng ban đầu.
  • Nói lại.

Lưu ý: Trong bằng sáng chế thực tế, chúng dường như đề cập đến một URL như một “tài nguyên”.

Thay đổi thứ hai từ Google Panda cho điểm số ban đầu

Tóm tắt và đầu cơ dòng chảy gấu trúc

Một khía cạnh khó hiểu của luồng Panda là sự khác biệt giữa truy vấn điều hướng và truy vấn tham chiếu. Chúng tôi nghĩ rằng các truy vấn điều hướng có thể bao gồm gợi ý tên thương hiệu trong chính truy vấn.

Một cái gì đó giống như tìm kiếm [nike shoes on zappos] có thể được xem như một truy vấn điều hướng. Các truy vấn tham chiếu có thể dựa trên thời gian. Nếu ai đó sử dụng tìm kiếm và nhấp vào một liên kết trong một khoảng thời gian nhất định, nó có thể được đánh dấu là “yêu cầu tham chiếu”.

Một khía cạnh thú vị khác của quá trình này là khả năng có nhiều ngưỡng. Điều hợp lý là Google muốn Điểm chất lượng dựa trên trang web hoặc nhóm URL và nhận thấy đây là trường hợp của Panda, nhưng nhiều ngưỡng có thể tạo ra các kết quả khác nhau. Danh sách URL cho một truy vấn tìm kiếm cụ thể có thể là:

  • Bị ảnh hưởng tiêu cực bởi nhiều yếu tố điểm nhóm.
  • Bị ảnh hưởng tiêu cực bởi một yếu tố điểm số của nhóm và bị ảnh hưởng tích cực bởi những yếu tố khác.
  • Bị ảnh hưởng tích cực bởi một số yếu tố điểm nhóm.

Bằng sáng chế nêu rõ: “Các tài nguyên được nhóm lại để một tài nguyên không thể được đưa vào nhiều hơn một nhóm tài nguyên.”

Mặc dù điều này đã được tuyên bố thẳng thắn, nhưng một ý kiến ​​cho rằng các yếu tố thay đổi dựa trên địa chỉ và các nhóm không dựa trên địa chỉ có thể được áp dụng cho một URL.

Google có thể ngăn chặn điều đó dựa trên địa chỉ Thay đổi yếu tố để có tác động lớn hơn đến một URL Không phải địa chỉ các nhóm dựa trên. Hạ cấp hiệu quả các URL / trang có vấn đề trùng lặp nội bộ so với các URL / trang có vấn đề trùng lặp bên ngoài.

Nếu một bên có các vấn đề về chất lượng nhóm bên trong và bên ngoài, nó có thể bị tác động tiêu cực hai lần.

Panda ngày nay và các yếu tố xếp hạng cần xem xét

Không cần suy nghĩ về chi tiết, chúng ta có thể đồng ý rằng xếp hạng chất lượng dựa trên trang web và nhóm hiện là một yếu tố xếp hạng trong kết quả tìm kiếm của Google. Không nghi ngờ gì nữa, mọi thứ đã thay đổi kể từ khi bằng sáng chế này được viết ra, nhưng nó dường như cung cấp một số hiểu biết có giá trị về cách nghĩ về gấu trúc của Google cũng như cách tránh và vượt qua nó.

Như được mô tả trong bằng sáng chế, các URL được xếp hạng duy nhất được thay đổi theo từng truy vấn được tìm kiếm. Ngoài ra, yếu tố sửa đổi này phụ thuộc động vào các biến thay đổi liên tục. Điều này có nghĩa là Panda có ảnh hưởng khác nhau đối với mỗi URL. Điều này khiến cho việc định lượng trở nên khó khăn, nhưng có những yếu tố được thảo luận chi tiết ở trên cần được xem xét để kết hợp vào các phương pháp hay nhất:

Các yếu tố xếp hạng cấp độ URL của gấu trúc

  • Mức độ liên quan đến truy vấn.
  • Chất lượng.

Xếp hạng các yếu tố ở cấp độ nhóm gấu trúc

  • Số lượng yêu cầu tham khảo.
  • Số lượng liên kết độc lập.

Bản thân bằng sáng chế Panda rất thú vị khi đọc. Bạn chắc chắn nên xem phân tích của Bill Slawksi kỳ cựu bằng sáng chế SEO để có cái nhìn chi tiết hơn về một số yếu tố xếp hạng gấu trúc này.

Nguồn: www.searchenginewatch.com

Trả lời

Chat Zalo