5 thống kê thu thập thông tin hàng đầu trong Google Search Console

Có một báo cáo trên Google Search Console vừa cực kỳ hữu ích và khá khó tìm, đặc biệt nếu bạn mới bắt đầu hành trình SEO của mình.

Đây là một trong những công cụ mạnh mẽ nhất cho bất kỳ chuyên gia SEO nào, mặc dù bạn thậm chí không thể truy cập nó từ giao diện Google Search Console chính.

Tôi đang nói về báo cáo thống kê thu thập thông tin.

Bài viết này sẽ cho bạn biết tại sao báo cáo này lại quan trọng như vậy, cách truy cập nó và cách sử dụng nó cho lợi ích SEO.

Trang web của bạn được thu thập thông tin như thế nào?

Ngân sách thu thập thông tin (số lượng trang mà Googlebot có thể và muốn thu thập thông tin) là điều cần thiết cho SEO, đặc biệt là đối với các trang web lớn.

Nếu bạn gặp sự cố với ngân sách thu thập thông tin của trang web, Google có thể không lập chỉ mục một số trang có giá trị của bạn.

Và như người ta thường nói: nếu Google không lập chỉ mục thứ gì đó, thì nó không tồn tại.

Google Search Console có thể cho bạn biết có bao nhiêu trang trên trang web của bạn được Googlebot truy cập mỗi ngày.

quảng cáo

Đọc bên dưới

Với kiến ​​thức này, bạn có thể tìm thấy những điểm bất thường có thể gây ra sự cố SEO của bạn.

Đắm mình trong số liệu thống kê thu thập thông tin của bạn: 5 điều quan trọng

Để truy cập báo cáo thống kê thu thập thông tin của bạn, hãy đăng nhập vào tài khoản Google Search Console của bạn và điều hướng đến Cài đặt> Thống kê Thu thập thông tin.

Dưới đây là tất cả các thứ nguyên dữ liệu mà bạn có thể xem xét trong báo cáo thống kê thu thập thông tin:

Máy chủ đầu tiên

Hãy tưởng tượng bạn có một cửa hàng thương mại điện tử trên shop.website.com và một blog trên blog.website.com.

Báo cáo thống kê thu thập thông tin giúp bạn dễ dàng xem thống kê thu thập thông tin cho từng tên miền phụ trên trang web của mình.

Thật không may, phương pháp này hiện không hoạt động với các thư mục con.

2. Trạng thái HTTP

Một trường hợp sử dụng khác cho báo cáo thống kê thu thập thông tin là kiểm tra mã trạng thái của các URL được thu thập thông tin.

Đó là bởi vì bạn không muốn Googlebot sử dụng tài nguyên để thu thập dữ liệu các trang không phải là HTTP 200 OK. Thật lãng phí ngân sách thu thập thông tin của bạn.

Để xem bảng phân tích các URL được thu thập thông tin theo mã trạng thái, hãy truy cập Cài đặt> Thống kê Thu thập thông tin> Phân tích Yêu cầu Thu thập thông tin.

Báo cáo thống kê thu thập thông tin của Google Search Console hiển thị bảng phân tích các URL được thu thập thông tin theo loại phản hồi HTTP.

Trong trường hợp cụ thể này, 16% tổng số yêu cầu được thực hiện cho các trang được chuyển hướng.

quảng cáo

Đọc bên dưới

Nếu bạn thấy số liệu thống kê như thế này, tôi khuyên bạn nên điều tra thêm và tìm kiếm các bước chuyển hướng và các vấn đề tiềm ẩn khác.

Theo tôi, một trong những trường hợp tồi tệ nhất mà bạn có thể thấy ở đây là một số lượng lớn lỗi 5xx.

Trích dẫn tài liệu từ Google: “Nếu trang web chậm lại hoặc phản hồi với lỗi máy chủ, giới hạn sẽ giảm xuống và Googlebot thu thập dữ liệu ít hơn.”

Nếu bạn quan tâm đến chủ đề này, Roger Montti đã viết một bài báo chuyên sâu về lỗi 5xx trong Google Search Console.

3. Mục đích

Báo cáo thống kê thu thập thông tin chia mục đích của việc thu thập thông tin thành hai loại:

  • URL được thu thập thông tin cho mục đích cập nhật (thu thập thông tin mới của các trang đã biết, ví dụ: Googlebot truy cập trang bắt đầu của bạn để khám phá các liên kết và nội dung mới).
  • URL được thu thập thông tin để khám phá (URL được thu thập thông tin lần đầu tiên).

Phân tích này cực kỳ hữu ích và đây là một ví dụ:

Gần đây, tôi đã xem qua một trang web có ~ 1 triệu trang được đánh giá là “Đã khám phá – Hiện chưa được lập chỉ mục”.

Vấn đề này đã được báo cáo cho 90% tất cả các trang trên trang web này.

(Nếu bạn không quen với điều này, “Đã khám phá nhưng chưa được lập chỉ mục” có nghĩa là Google đã phát hiện nhưng không truy cập vào một trang cụ thể. Ví dụ: nếu bạn đã khám phá nhưng không thử một nhà hàng mới trong thành phố của mình.)

Một trong những lựa chọn là chờ đợi với hy vọng rằng Google sẽ dần lập chỉ mục các trang đó.

Một tùy chọn khác là xem dữ liệu và chẩn đoán sự cố.

Vì vậy, tôi đã đăng nhập vào Google Search Console và điều hướng đến Cài đặt> Thống kê thu thập thông tin> Yêu cầu thu thập thông tin: HTML.

Hóa ra trung bình mỗi ngày Google chỉ truy cập 7.460 trang của trang web này.

Biểu đồ hiển thị thống kê thu thập thông tin cho một trang web thương mại điện tử.

Nhưng có một cái gì đó quan trọng hơn ở đây.

quảng cáo

Đọc bên dưới

Nhờ báo cáo thống kê thu thập thông tin, tôi thấy rằng chỉ 35% trong số 7460 URL đó được thu thập thông tin vì lý do khám phá.

Báo cáo thống kê thu thập thông tin của Google Search Console hiển thị phân tích về mục đích thu thập thông tin.

Đó chỉ là 2611 trang mới mà Google khám phá mỗi ngày.

2611 trong tổng số hơn một triệu.

Google sẽ mất 382 ngày để lập chỉ mục toàn bộ trang web với tốc độ này.

Tìm ra điều này là một thay đổi trò chơi. Tất cả các tối ưu hóa tìm kiếm khác đã bị hoãn lại vì chúng tôi tập trung hoàn toàn vào việc tối ưu hóa ngân sách thu thập thông tin.

quảng cáo

Đọc bên dưới

4. Loại tệp

Thống kê thu thập thông tin GSC có thể hữu ích cho các trang web JavaScript. Bạn có thể dễ dàng kiểm tra tần suất Googlebot thu thập dữ liệu các tệp JS, điều này cần thiết để hiển thị phù hợp.

Nếu trang web của bạn chứa đầy hình ảnh và tìm kiếm hình ảnh rất quan trọng đối với chiến lược SEO của bạn, báo cáo này cũng sẽ giúp ích rất nhiều – bạn có thể thấy Googlebot có thể thu thập thông tin hình ảnh của bạn tốt như thế nào.

5. Loại Googlebot

Cuối cùng, báo cáo thống kê thu thập thông tin cung cấp bảng phân tích chi tiết về loại Googlebot đang được sử dụng để thu thập thông tin trang web của bạn.

Bạn có thể xem tỷ lệ phần trăm yêu cầu được thực hiện bởi Googlebots trên thiết bị di động hoặc máy tính để bàn và các bot hình ảnh, video và quảng cáo.

Thông tin hữu ích khác

Cần lưu ý rằng Báo cáo thống kê thu thập thông tin có thông tin vô giá mà bạn sẽ không tìm thấy trong nhật ký máy chủ của mình:

  1. Lỗi DNS.
  2. Thời gian chờ của trang.
  3. Sự cố máy chủ lưu trữ chẳng hạn như sự cố tải tệp robots.txt.

Sử dụng thống kê thu thập thông tin trong công cụ kiểm tra URL

Bạn cũng có thể truy cập một số dữ liệu thu thập thông tin chi tiết bên ngoài Báo cáo thống kê thu thập thông tin trong Công cụ kiểm tra URL.

quảng cáo

Đọc bên dưới

Gần đây tôi đã làm việc với một trang web thương mại điện tử lớn và sau một số phân tích ban đầu, tôi đã xác định được hai vấn đề cấp bách:

  1. Nhiều trang sản phẩm không được lập chỉ mục trên Google.
  2. Không có liên kết nội bộ giữa các sản phẩm. Cách duy nhất để Google khám phá nội dung mới là thông qua sơ đồ trang web và các trang danh mục được phân trang.

Bước tiếp theo tự nhiên là truy cập nhật ký máy chủ và xác minh rằng Google đã thu thập dữ liệu các trang danh mục được phân trang.

Tuy nhiên, việc truy cập nhật ký máy chủ thường rất khó khăn, đặc biệt nếu bạn làm việc với một tổ chức lớn.

Báo cáo thống kê thu thập thông tin của Google Search Console đã giải quyết vấn đề này.

Hãy để tôi hướng dẫn bạn qua quy trình tôi đã sử dụng mà bạn có thể sử dụng nếu gặp phải vấn đề tương tự:

1. Đầu tiên, hãy tìm một URL trong công cụ kiểm tra URL. Tôi đã chọn một trong những trang được phân trang từ một trong những danh mục chính trên trang web.

2. Sau đó điều hướng đến Mức độ phù hợp> Báo cáo thu thập thông tin.

Bạn có thể sử dụng công cụ kiểm tra URL của Google Search Console để tra cứu ngày thu thập thông tin cuối cùng của một URL cụ thể.

Trong trường hợp này, URL được thu thập thông tin lần cuối cách đây ba tháng.

quảng cáo

Đọc bên dưới

Hãy nhớ rằng, đây là một trong những trang danh mục chính trên trang web đã không được thu thập thông tin trong hơn ba tháng!

Tôi đã đi sâu hơn và kiểm tra một ví dụ về các trang danh mục khác.

Hóa ra là Googlebot không bao giờ truy cập nhiều trang danh mục chính. Nhiều người trong số họ vẫn chưa được biết đến với Google.

Tôi không nghĩ rằng tôi cần giải thích tầm quan trọng của việc có thông tin này khi bạn đang làm việc để cải thiện khả năng hiển thị của một trang web.

Báo cáo thống kê thu thập thông tin cho phép bạn kiểm tra những thứ như vậy trong vài phút.

Gói (lại

Như bạn có thể thấy, báo cáo thống kê thu thập thông tin là một công cụ SEO mạnh mẽ, mặc dù bạn có thể đã sử dụng Google Search Console trong nhiều năm mà không bao giờ tìm thấy nó.

Nó giúp bạn chẩn đoán các vấn đề lập chỉ mục và tối ưu hóa ngân sách thu thập thông tin để Google có thể nhanh chóng tìm và lập chỉ mục nội dung có giá trị của bạn, điều này đặc biệt quan trọng đối với các trang web lớn.

Tôi đã cho bạn một vài trường hợp sử dụng, nhưng bây giờ quả bóng là của bạn.

quảng cáo

Đọc bên dưới

Bạn sẽ sử dụng dữ liệu này như thế nào để cải thiện khả năng hiển thị của trang web của mình?

Nhiêu tai nguyên hơn:


tín ảnh

Tất cả ảnh chụp màn hình do tác giả chụp, tháng 4 năm 2021

Nguồn:searchenginejournal.com

Trả lời

Chat Zalo