Bạn có đang giúp các công cụ tìm kiếm dễ dàng thu thập dữ liệu trang web của bạn không?

Sau khi theo dõi sự phát triển của tiếp thị tìm kiếm không phải trả tiền trong những năm qua, thật thú vị khi đánh giá xem mọi thứ đã thay đổi như thế nào.

Chúng tôi đã chuyển từ bị ám ảnh bởi các từ khóa sang tối ưu hóa chuyển đổi – theo nghĩa đen là từ lần hiển thị đầu tiên đến cuối kênh chuyển đổi. Tuy nhiên, có một trọng tâm rất quan trọng: bắt đầu với trang web.

Mặc dù người dùng luôn là yếu tố quan trọng nhất của cuộc trò chuyện, nhưng chúng tôi với tư cách là người làm SEO cần phải xem xét những gì chúng tôi đang làm để khiến các công cụ tìm kiếm quan tâm đến việc nhận được nhiều ấn tượng đầu tiên hơn với người dùng trong kết quả tìm kiếm.

Từ quan điểm của nhà tiếp thị tìm kiếm, trước khi người dùng truy cập trang web, các công cụ tìm kiếm cần bắt đầu dễ dàng – thu thập dữ liệu trang web một cách nhanh chóng mà không gặp trục trặc, vấp váp hoặc nhầm lẫn.

Nếu bạn đang thực hiện các bước để cải thiện chất lượng đường dẫn trang web cho các công cụ tìm kiếm, bạn cũng đang làm điều tương tự đối với người dùng. Bài viết này biên soạn một danh sách ngắn gọn về các cân nhắc và các điểm kiểm tra trang web mà bạn nên sử dụng để giữ cho cánh cửa trang web của bạn luôn mở để công cụ tìm kiếm thu thập thông tin.

Chúng ta hãy xem xét những gì cần tìm và những công cụ nào có thể giúp bạn với nó.

Sự kết nối

Dụng cụ: Kiểm tra tốc độ trang web Pingdom

mccoy1-pingdom-speed-test

Trước khi chúng tôi có thể nghĩ về việc một công cụ tìm kiếm truy cập vào trang web của bạn, chúng tôi cần phải xem xét trang web của bạn đang giao tiếp tốt như thế nào với máy chủ của bạn và các tệp trang thuộc tính nào yêu cầu.

Cân nhắc đầu tiên tôi muốn thực hiện là kiểm tra ping và theo dõi để biết liệu có bất kỳ sự cố kết nối mạng nào không.

Trong khi sử dụng công cụ này, tôi cũng muốn kiểm tra Máy chủ tên miền (DNS) để xem liệu có bất kỳ vấn đề ủy quyền miền nào đang gây khó khăn cho các công cụ tìm kiếm trước khi chúng vào cửa hay không.

Một lĩnh vực khác mà bạn có thể muốn kiểm tra là dữ liệu trực tiếp từ nguồn thông qua Google Analytics. Khi xem trong phần Hành vi >> Tốc độ trang web >> Thời gian trang, bạn nên tìm kiếm các số liệu như Trung bình. Thời gian chuyển hướng, trung bình Tên miền Tìm kiếm Tên miền, Tr.bình Thời gian kết nối máy chủ và trung bình Thời gian phản hồi của máy chủ.

jmccoy-analytics

Rõ ràng

Công cụ: Google Search Console và Sitemap Writer Pro

Tôi gọi đây là “điều hiển nhiên” bởi vì nó thực sự là điểm khởi đầu cho các công cụ tìm kiếm trên một trang web. Đó là nền tảng cho SEO.

Tuy nhiên, nếu bạn chưa quen với nó, điều này có thể giúp bạn bắt đầu khá nhanh từ quan điểm SEO.

mccoy3

Bạn nên xem qua Google Search Console >> Thu thập thông tin >> Robots.txt Tester để đánh giá cách Google hiểu tệp robots.txt của bạn và những gì bạn không nên nhìn thấy nó.

Đây cũng là cơ hội tuyệt vời để bạn xem xét các loại trừ của mình và hiểu liệu bạn có đang xa lánh nội dung nhạy cảm với tìm kiếm khỏi chế độ xem trình thu thập thông tin hay không.

Hãy để người kiểm tra chạy các trang quan trọng nhất của bạn và đảm bảo rằng bạn không mắc phải bất kỳ lỗi SEO cơ bản nào.

Ngoài ra, hãy đảm bảo bạn có sơ đồ trang XML cập nhật cho các trang, hình ảnh và video của trang web để các công cụ tìm kiếm, thông qua Google Search Console và Bing Webmaster Tools, luôn có bản ghi của tất cả các trang mà họ truy cập thường xuyên. .

Đang tải trang

Công cụ: Kiểm tra tốc độ trang web Pingdom và Google PageSpeed ​​Insights

Thời gian tải trang đã là một yếu tố xếp hạng trong nhiều năm. Khi tải trang, cách tốt nhất là đảm bảo rằng mã hóa CSS và JavaScript được giữ trong các tệp được tham chiếu bên ngoài để truy cập và trong càng ít tệp càng tốt.

Tôi thấy rằng rất nhiều người làm theo các phương pháp hay nhất này, nhưng một lĩnh vực thường bị lãng quên là các tệp trang trong trình tự tải trang, đó là các tệp 404 đã chết hoặc các tệp chuyển hướng đến một URL khác.

Chuyển hướng không phải là điều tồi tệ nhất, nhưng nó vẫn mất thời gian từ việc thu thập dữ liệu của công cụ tìm kiếm. Đối với các tệp đã chết được yêu cầu, đây chỉ là một cú hích để kích hoạt công cụ tìm kiếm.

mccoy4

Chúng tôi lại đang sử dụng công cụ kiểm tra tốc độ của Pingdom vì nó có tính năng tải trang tuyệt vời với công cụ thác nước.

Trong khi một số yêu cầu tải trang nhất định mất nhiều thời gian, bạn có thể tìm tên tệp được mã hóa màu cho biết tệp đã chết hoặc tệp được chuyển hướng được ghi chú trong mã.

Vì chúng tôi đang giải quyết chủ đề về các tệp được chuyển hướng, một cách khác để giúp các trang web thu thập thông tin dễ dàng hơn là chuyển hướng các liên kết nội bộ. Các công cụ như Xenus Link Sleuth và SEMrush Site Audits có thể giúp bạn hiểu sâu hơn về các liên kết nội bộ bị hỏng hoặc chuyển hướng.

Kết xuất trang

Dụng cụ: Google Search Console (được truy xuất dưới dạng Googlebot và các tài nguyên bị chặn)

Bạn đã làm được điều đó đến thời điểm này và trang web của bạn đang giao tiếp tốt với các yêu cầu và tải tệp một cách hiệu quả. Điều gì về các công cụ tìm kiếm? Chỉ vì nó được tải vào nội dung của bạn không có nghĩa là nó sẽ không ảnh hưởng đến trình thu thập thông tin.

Trong phần Truy xuất dưới dạng Googlebot của Google Search Console, bạn muốn xem việc hiển thị trang của mình có giống nhau đối với các công cụ tìm kiếm và đối với người dùng hay không.

Bằng cách kiểm tra phần này, cũng như phần “Tài nguyên bị chặn”, bạn có cách thứ hai để kiểm tra xem các yêu cầu tải lại trang có hết thời gian chờ do máy chủ không hiệu quả hoặc có bất kỳ loại trừ robots.txt nào liên quan hay không.

kết xuất tìm nạp mccoy

Nội dung trùng lặp hoặc thu thập dữ liệu lãng phí

Công cụ: SEMrush Site Audit, SiteLiner và đánh giá thủ công

Các trình thu thập thông tin đang ở ngưỡng cửa không có rào chắn và có thể thu thập thông tin qua trang web.

Tôi đã đề cập đến việc cân nhắc chuyển hướng hoặc liên kết nội bộ bị hỏng và chúng tôi có thể đi sâu vào liên kết các điều hướng, nhưng một điểm tôi muốn giải quyết là thu thập dữ liệu rác và nội dung vô tình trùng lặp.

Nghĩ về cách trình thu thập dữ liệu dành thời gian của họ trên trang web của bạn Bạn có muốn thực hiện thời gian này nhanh nhất có thể hay bạn muốn làm phiền họ với các trang trùng lặp với nội dung đã được thu thập thông tin trước đó?

Có một số công cụ có thể xác định nội dung trùng lặp từ SiteLiner đến SEMrush. Tuy nhiên, tôi thường thích thực hiện tìm kiếm “site:” và thêm số nhận dạng bằng cách loại bỏ các bộ sao chép hoặc phần tử tiêu đề.

Bạn thường có thể tìm thấy nội dung trùng lặp trên nhiều trang trong một miền hoặc nội dung trùng lặp trên các miền phụ của thuộc tính miền.

tốt nghiệp

Rõ ràng, chúng tôi không thể đề cập đến đầy đủ các yếu tố cần xem xét khi mở hoặc đóng cánh cửa cho một công cụ tìm kiếm, nhưng tôi đã xem xét các khu vực chung mà các trang web đã hoạt động sai.

Hy vọng rằng bây giờ bạn đang nghĩ đến việc thu thập thông tin của công cụ tìm kiếm đang cố gắng tiếp cận trang web, gõ cửa, mở nó và cho họ tham quan trang web của bạn một cách trọn vẹn.

Josh McCoy là Nhà chiến lược SEO / PPC / Truyền thông xã hội cấp cao tại Vizion Interactive. Bạn có thể kết nối với Josh trên LinkedIn.

Nguồn: www.searchenginewatch.com

Trả lời

Chat Zalo