Googlebot bắt đầu thu thập thông tin bằng giao thức HTTP / 2

Google đã cập nhật trang hỗ trợ nhà phát triển Googlebot của họ để cho biết rằng Google hiện có thể cố gắng tải xuống các trang bằng giao thức HTTP / 2 mới nhất. Điều này sẽ có hiệu lực kể từ tháng 11 năm 2020. Trang dành cho nhà phát triển Googlebot đã được cập nhật vào ngày 12 tháng 11 năm 2020 để phản ánh thay đổi này.

Sự thay đổi này đã được thông báo trở lại vào tháng Chín. Thay đổi sẽ được áp dụng từ tháng 11 năm 2020.

Theo Google:

“Nói chung, Googlebot thu thập thông tin qua HTTP / 1.1. Tuy nhiên, kể từ tháng 11 năm 2020, Googlebot sẽ có thể thu thập dữ liệu các trang web có thể được hưởng lợi từ nó thông qua HTTP / 2 nếu trang web đó hỗ trợ. “

Tại sao lại sử dụng Giao thức mạng HTTP / 2

HTTP / 2 hiện là giao thức mạng mới nhất. Nó cho phép truyền dữ liệu nhanh hơn và hiệu quả hơn giữa máy chủ và trình duyệt (hoặc Googlebot).

quảng cáo

Đọc bên dưới

HTTP / 2 giảm thời gian gửi trang web từ trình duyệt đến máy chủ. HTTP / 2 cũng giảm chi phí bằng cách nén các trường tiêu đề HTTP.

Với giao thức mạng trước đây (HTTP / 1), một số luồng phải được tải xuống song song, vì với phiên bản HTTP / 1 cũ, chỉ có một yêu cầu được kích hoạt tại một thời điểm.

Với HTTP / 2, Googlebot và trình duyệt có thể tận dụng lợi thế của “ghép lạiChất lượng. Điều này có nghĩa là nhiều tài nguyên có thể được tải xuống từ một kết nối trong một luồng thay vì phải yêu cầu nhiều luồng từ nhiều kết nối để tải xuống cùng một trang web.

quảng cáo

Đọc bên dưới

Theo trang Câu hỏi thường gặp chính thức của IETF trên Github:

“HTTP / 1.x có một vấn đề được gọi là ‘chặn đầu dòng’ trong đó chỉ có một yêu cầu thực sự có thể được thực hiện trên một kết nối tại một thời điểm.

… Ghép kênh khắc phục những vấn đề này bằng cách cho phép gửi nhiều bản tin yêu cầu và phản hồi cùng một lúc; thậm chí có thể trộn các phần của một tin nhắn với một tin nhắn khác trên dây.

Đến lượt nó, điều này cho phép khách hàng chỉ sử dụng một kết nối cho mỗi điểm gốc để tải một trang. “

Khả năng của HTTP / 2 có nghĩa là ít quá tải máy chủ và tiết kiệm tài nguyên máy chủ.

Giảm thiểu tải trên tài nguyên máy chủ là tốt cho các trang web. Đôi khi không chỉ Googlebot mà nhiều bot khác truy cập vào một trang web cùng một lúc.

Kết quả là trang web phản hồi chậm vì sử dụng quá nhiều tài nguyên máy chủ. Điều này có hại cho những người dùng đang cố gắng xem các trang web và có hại cho nhà xuất bản nếu Googlebot không thể thu thập dữ liệu một trang web vì máy chủ đang bị đẩy đến giới hạn bởi các bot giả mạo như kẻ phá hoại và tin tặc.

Theo Google:

“… Từ tháng 11 năm 2020, Googlebot có thể thu thập dữ liệu các trang web có thể được hưởng lợi từ điều này thông qua HTTP / 2, nếu điều này được trang web hỗ trợ.

Điều này có thể tiết kiệm tài nguyên máy tính (ví dụ: CPU, RAM) cho trang web và Googlebot, nhưng nếu không, điều này không ảnh hưởng đến việc lập chỉ mục hoặc xếp hạng trang web của bạn. “

quảng cáo

Đọc bên dưới

Nhà xuất bản có thể tắt thu thập thông tin HTTP / 2

Có thể tắt thu thập thông tin HTTP / 2. Máy chủ phải được cấu hình để gửi mã phản hồi máy chủ 421.

Mã trạng thái 421 được Lực lượng Đặc nhiệm Kỹ thuật Internet (IETF.org) mô tả là một yêu cầu bị định hướng sai. Điều này có nghĩa là một yêu cầu HTTP / 2 sẽ bị định tuyến sai nếu nó không khả dụng.

Theo IETF:

“Mã trạng thái 421 (Yêu cầu sai) chỉ ra rằng yêu cầu đã được chuyển hướng đến một máy chủ không thể tạo ra phản hồi.
Điều này có thể được gửi từ một máy chủ không được định cấu hình để tạo phản hồi cho sự kết hợp của lược đồ và quyền hạn có trong URI yêu cầu. “

quảng cáo

Đọc bên dưới

Trang web dành cho nhà phát triển của Google khuyến nghị:

“Để từ chối thu thập thông tin qua HTTP / 2, hãy hướng dẫn máy chủ lưu trữ trang web của bạn phản hồi với mã trạng thái HTTP 421 khi Googlebot cố gắng thu thập dữ liệu trang web của bạn qua HTTP / 2. Nếu không được, bạn có thể gửi tin nhắn đến nhóm Googlebot (tuy nhiên, giải pháp này chỉ là tạm thời). “

Trang web của bạn có phù hợp để thu thập thông tin HTTP / 2 không?

Nhiều trang web đã sẵn sàng để thu thập thông tin HTTP / 2. Thật dễ dàng để tìm ra. Bạn có thể sử dụng công cụ kiểm tra HTTP / 2 để xác minh rằng máy chủ của bạn đủ điều kiện.

Thu thập thông tin HTTP / 2 là một thay đổi đáng hoan nghênh

Khả năng thu thập dữ liệu của Googlebot bằng giao thức HTTP / 2 là một tin tuyệt vời cho các nhà xuất bản. Nó làm giảm tải máy chủ và giúp Googlebot thu thập dữ liệu các trang web dễ dàng hơn.

quảng cáo

Đọc bên dưới

Trích dẫn

Trang web nhà phát triển Googlebot
https://www.google.com/webmasters/tools/googlebot-report

Nguồn: www.searchenginejournal.com

Trả lời

Chat Zalo