Matt Cutts về cách Google đang thử nghiệm các thuật toán của mình

Matt Cutts

Bạn đã bao giờ tò mò về cách Google quyết định thuật toán nào tốt hơn thuật toán khác khi họ phát hành một trong nhiều điều chỉnh mà họ thực hiện hàng tuần? Làm thế nào để bạn đánh giá tinh chỉnh nào thực sự mang lại kết quả tốt hơn và tinh chỉnh nào mang lại nhiều kết quả tốt? Hay nhóm spam chỉ vẫy một con dơi Nerf trên máy chủ trước khi nhấn một nút lớn màu đỏ và hy vọng điều tốt nhất?

Matt Cutts của Google giải thích trong video trợ giúp quản trị viên web về cách nhóm tìm kiếm thực sự làm điều này và hỏi Google sử dụng số liệu nào để đánh giá xem một lần lặp lại thuật toán xếp hạng có mang lại cho người dùng kết quả tốt hơn một lần lặp khác hay không.

Như Cutts đang bắt đầu nói rằng anh ấy có thể giữ chủ đề này bận rộn trong một thời gian khá dài và tôi chắc chắn rằng rất nhiều người trong chúng ta sẽ thích nó nếu anh ấy làm vậy, nhưng anh ấy nói rằng anh ấy sẽ cố gắng giữ lại vì lý do thời lượng video.

“Bất cứ khi nào kỹ thuật viên đánh giá một thay đổi chất lượng tìm kiếm mới và muốn biết liệu đó có phải là một cải tiến hay không, điều đó sẽ giúp chúng tôi có hàng trăm người đánh giá chất lượng trước đây đã đánh giá URL là tốt hay xấu, spam, tất cả những loại này khác nhau. Đồ đạc.

“Vì vậy, khi bạn thực hiện một thay đổi, bạn có thể thấy dòng chảy, bạn có thể thấy những gì đang tăng lên và những gì đang di chuyển xuống, và bạn có thể xem xét các tìm kiếm mẫu nơi kết quả đã thay đổi rất nhiều, chẳng hạn,” ông nói. “Và bạn có thể nói, OK, khi kết quả tìm kiếm đã thay đổi, hãy lấy các URL tăng lên. Những URL đó thường được xếp hạng cao hơn so với những URL được người đánh giá chất lượng tìm kiếm chuyển xuống?”

Mặc dù Google cố gắng giữ bí mật các chi tiết về nguyên tắc xếp hạng chất lượng của mình, nhưng chúng chắc chắn sẽ bị rò rỉ. Phiên bản mới nhất được phát hành vào tháng 11 và mô tả chính xác những gì người đánh giá chất lượng đang tìm kiếm khi đánh giá kết quả tìm kiếm.

“Vì đôi khi nó là những con số được tính toán trước, liên quan đến xếp hạng, chúng tôi đã có cơ sở dữ liệu được lưu trữ của tất cả những xếp hạng này từ tất cả những người đánh giá mà chúng tôi có, đôi khi bạn có dấu chấm hỏi hoặc những vùng trống mà trường hợp này không được đánh giá “, anh nói. “Vì vậy, bạn cũng có thể gửi nội dung đó cho người đánh giá, hoặc kéo các kết quả lên song song hoặc xem từng URL và họ nói rằng những kết quả tìm kiếm đó tốt hơn song song với nhau, hoặc cụm từ đó tốt hơn hoặc bạn có thể nói URL này là giỏi một URL này là thư rác và bạn đang sử dụng tất cả những điều này để đánh giá xem bạn có đang tiến bộ tốt hay không. “

Mặc dù thật tốt khi Google đang thúc đẩy những thứ mà người đánh giá chất lượng nhìn thấy để xem những gì họ nhận thấy, nhưng nó không phải lúc nào cũng nắm bắt được mọi thứ. Chắc chắn có những lúc các chỉnh sửa mới đã phá vỡ điều gì đó, như chúng ta đã thấy với các trang web giải trí đã giảm đáng kể trong bảng xếp hạng vào tháng 2, các giám khảo chất lượng không phải lúc nào cũng bắt đầu.

“Khi bạn tiến xa hơn và chuẩn bị bắt đầu điều gì đó, bạn thường bắt đầu cái gọi là thử nghiệm trực tiếp, nơi bạn thực sự sử dụng hai thuật toán khác nhau, giả sử thuật toán cũ và thuật toán mới, và bạn lấy kết quả do một thuật toán tạo ra và sau đó khác, và sau đó bạn có thể lồng chúng. Và sau đó nếu có nhiều nhấp chuột hơn vào nhóm kết quả tìm kiếm mới hơn thì bạn có xu hướng nói rằng bạn biết gì, nhóm kết quả tìm kiếm mới này được tạo bởi thuật toán này có thể tốt hơn một chút so với thuật toán khác này.

Thật thú vị khi anh ấy mô tả sự lồng vào nhau của hai trang kết quả tìm kiếm, như chúng ta thường nghe về các lần đẩy đầy đủ hoặc đẩy đến một tỷ lệ nhỏ người dùng. Tuy nhiên, đây có thể là một thử nghiệm trực tiếp chỉ giới hạn cho nhân viên và người đánh giá chất lượng của Google.

Anh ấy nói rằng các chỉ số của nhóm spam web trong Google có thể trông rất khác so với phần còn lại của Google đơn giản vì họ thích nhấp vào spam và xem những gì được xếp hạng, tại sao nó được xếp hạng và tốt hơn là tìm hiểu cách loại bỏ nó. .

Ông nói: “Đôi khi các chỉ số của chúng tôi trông tệ hơn một chút về spam web bởi vì mọi người nhấp vào spam và chúng tôi nghĩ rằng chúng tôi có ít spam hơn và có vẻ như mọi người không thích thuật toán cho lắm”. “Vì vậy, bạn phải cẩn thận về tất cả các đánh giá này bởi vì không có gì thay thế được đánh giá của bạn và đánh giá của ủy ban chất lượng.”

Ủy ban Khởi chạy Chất lượng không thực sự nổi tiếng mà chỉ đơn giản là một nhóm Kỹ sư Chất lượng Tìm kiếm nhận báo cáo và tổ chức các cuộc họp về chất lượng tìm kiếm, mà Matt đã đề cập ít nhất một lần trong các video trợ giúp quản trị trang web trước đó.

Anh ấy tiếp tục bằng cách nói một chút về những gì chính xác mà người đánh giá chất lượng đang tìm kiếm khi đưa ra đánh giá của họ.

“Mọi người có thể đánh giá mọi thứ là có liên quan trên thang điểm, họ có thể đánh giá mọi thứ là spam, thậm chí họ có thể đánh giá chất lượng của trang, điều này quan trọng dựa trên truy vấn nhưng mức độ uy tín của trang đó”, Cutts nói. “Và sau đó, chúng tôi có các chỉ số kết hợp tất cả lại với nhau và khi chúng tôi hoàn thành, chúng tôi thường nói ổn, chúng tôi nghĩ rằng kết quả sẽ tốt hơn một chút, và đây là cách chúng tốt hơn hoặc tệ hơn. Chúng tôi thậm chí có thể cắt và xúc xắc và xem xét các quốc gia khác nhau hoặc các ngôn ngữ khác nhau, những thứ tương tự. Vì vậy, khi nói đến spam web, chúng tôi không ngạc nhiên nếu người dùng tiếp tục nhấp vào spam, bởi vì chúng tôi có thể phát hiện ra spam, chúng tôi có các chuyên gia về các chủ đề như vậy. Và chúng tôi đặc biệt chú ý đến các quốc gia cụ thể nơi chúng tôi biết có nhiều thư rác hơn, vì vậy chúng tôi có thể thấy phản ứng mà chúng tôi nhận được ở đó. “

Thậm chí, hãy tiếp tục và nói một chút về cách họ thực hiện và cập nhật các hướng dẫn đánh giá chất lượng theo thời gian, điều mà chúng tôi đã cập nhật vài lần trong nhiều năm.

“Vì vậy, chúng tôi có một hệ thống khá tốt,” Cutts nói. “Thỉnh thoảng chúng ta cần hồi sinh một quy trình và xem chúng ta có thể cải thiện nó như thế nào, nhưng hầu hết thời gian nó hoạt động tương đối tốt khi đánh giá những thay đổi lớn và cải thiện chúng và làm cho mọi thứ tốt hơn và cho đến khi chúng tôi bắt đầu ủy ban, thường thì mọi người đều có một ý tưởng khá tốt về việc liệu nó có hoạt động hay không và điểm mạnh và điểm yếu của một thuật toán cụ thể là gì.

Vì vậy, nếu bạn đã nhìn thấy Matt Cutts ngồi trong văn phòng của mình với một nút lớn màu đỏ trên bàn để mở một thuật toán mới mà không có phản hồi hoặc giám sát, bạn có thể sẽ thất vọng. Thực sự còn rất nhiều việc phải làm trong việc thử nghiệm các thuật toán, đặc biệt là các thuật toán lớn và chúng được gửi qua nhạc chuông trước khi phát trực tiếp để đảm bảo rằng Google trả về kết quả tìm kiếm tốt hơn so với thuật toán trước đó.

Nguồn: www.searchenginewatch.com

Trả lời

Chat Zalo