Nội dung
- shares
- Facebook Messenger
- Gmail
- Viber
- Skype
Bạn có gặp lỗi thu thập dữ liệu trong Google Search Console của Google (trước đây gọi là Webmaster Tools) và bạn thấy rất nhiều lỗi thu thập dữ liệu mà bạn không biết nên bắt đầu từ đâu. Lỗi 404, 500, 400..
Lỗi thu thập dữ liệu là điều mà bình thường bạn có thể tránh được và chúng không nhất thiết có ảnh hưởng tiêu cực ngay lập tức đến hiệu suất SEO của bạn. Tuy nhiên, lỗi này bạn nên giải quyết. Số lượng lỗi thu thập dữ liệu thấp trong Search Console là một tín hiệu tích cực cho Google, vì nó phản ánh tình trạng tốt cho một trang web. Ngoài ra, nếu bot Google gặp ít lỗi thu thập dữ liệu trên trang của bạn, người dùng sẽ ít thấy lỗi trang web và máy chủ hơn.
Đầu tiên, đánh dấu tất cả các lỗi thu thập dữ liệu là đã sửa
Điều này có vẻ như là một lời khuyên ngu ngốc, nhưng nó thực sự sẽ giúp bạn giải quyết các lỗi thu thập dữ liệu của mình theo cách có cấu trúc hơn. Khi lần đầu tiên bạn xem báo cáo lỗi thu thập dữ liệu, bạn có thể thấy hàng trăm và hàng ngàn lỗi thu thập dữ liệu. Sẽ rất khó để bạn tìm ra cách vượt qua những danh sách dài các lỗi này.
Cách tiếp cận này sẽ đánh dấu mọi thứ là đã sửa và sau đó bắt đầu từ mẩu tin mới: Lỗi thu thập dữ liệu không liên quan sẽ không hiển thị lại và những lỗi thực sự cần sửa sẽ sớm xuất hiện trong báo cáo của bạn.
Kiểm tra báo cáo lỗi thu thập dữ liệu: mỗi tuần một lần
Chọn một ngày cố định mỗi tuần và đi đến báo cáo lỗi thu thập dữ liệu của bạn. Bây giờ bạn sẽ tìm thấy một số lỗi có thể quản lý được. Khi chúng chưa xuất hiện vào tuần trước, bạn sẽ biết rằng bot gần đây đã bắt gặp lỗi. Dưới đây, là những lỗi có thể xẩy ra trong báo cáo lỗi thu thập dữ liệu mỗi tuần một lần:
Lỗi 404 khi thu thập dữ liệu
Đây có lẽ là lỗi thu thập dữ liệu phổ biến nhất trên các trang web và cũng dễ khắc phục nhất. Đối với lỗi 404 mà bot Google gặp phải, Google cho bạn biết nó được liên kết từ đâu: Một trang web khác, một URL khác trên trang web của bạn hoặc sơ đồ trang web của bạn. Chỉ cần nhấp vào lỗi thu thập dữ liệu trong báo cáo và một popup sẽ mở ra:
Xin lưu ý rằng thông tin trong tab “Linked from” không phải lúc nào cũng được cập nhật. Nó có thể chứa các URL không còn tồn tại nữa.
Lỗi 404 do liên kết bị lỗi từ các trang web khác
Nếu URL được liên kết đến từ một trang web khác, bạn chỉ cần thực hiện chuyển hướng 301 từ URL bị lỗi sang URL chính xác. Bạn có thể liên hệ với người quản trị trang web & yêu cầu điều chỉnh, nhưng trong hầu hết các trường hợp, điều đó sẽ không quá quan trọng.
Lỗi 404 do liên kết nội bộ bị lỗi hoặc lỗi trong sitemap
Nếu một URL gây ra lỗi 404 cho bot Google được liên kết từ một trong các trang của riêng bạn hoặc từ sơ đồ trang web, bạn nên sửa liên kết hoặc LINK đó trong sơ đồ trang web. Trong trường hợp này, bạn có thể sử dụng chuyển hướng 301 cho URL 404 đến URL mới sửa để khắc phục lỗi.
Lỗi 404 do Google thu thập dữ liệu JavaScript
Đôi khi bạn sẽ gặp phải các lỗi 404 kỳ lạ trong Google Search Console, một số hoặc tất cả các trang của bạn liên kết đến. Khi bạn tìm kiếm các liên kết trong mã nguồn, bạn sẽ thấy chúng thực sự là các URL tương đối được bao gồm trong các tập lệnh như thế này:
Theo Google, đây hoàn toàn không phải là vấn đề và kiểu lỗi 404 này có thể bị bỏ qua.
Lỗi 404 bí ẩn
Trong một số trường hợp, nguồn của liên kết vẫn là một bí ẩn. Dữ liệu mà Google cung cấp trong các báo cáo lỗi thu thập dữ liệu không phải lúc nào cũng đáng tin cậy 100%. Ví dụ: thông tin trong tab “Linked from” không phải lúc nào cũng được cập nhật hoặc không liên kết với các URL bị lỗi nữa. Trong những trường hợp như vậy, bạn vẫn có thể thiết lập chuyển hướng 301 cho URL đó.
Hãy nhớ luôn luôn đánh dấu tất cả các lỗi thu thập dữ liệu 404 mà bạn đã xử lý như đã sửa trong báo cáo lỗi thu thập dữ liệu. Nếu có lỗi 404 thu thập dữ liệu mà bạn không biết phải làm gì, bạn vẫn có thể đánh dấu chúng là đã sửa và thu thập chúng trong danh sách của bạn. Nếu chúng tiếp tục xuất hiện trở lại, thì bạn sẽ phải tìm hiểu sâu hơn về lỗi thực sự đó.
Bây giờ chúng ta hãy xem vấn đề lỗi “Soft 404”.
Lỗi “Soft 404” là gì?
Lỗi “Soft 404” là một trang trống mà bot Google gặp phải & trả về mã 200.
Vì vậy, về cơ bản, đó là một trang mà Google nghĩ nên là một trang 404, nhưng không phải. Vào năm 2014, các quản trị web đã bắt đầu nhận được lỗi “Soft 404” đối với một số trang có nội dung của họ. Đây là cách Google cho chúng ta biết rằng bạn có ít nội dung trên các trang.
Xử lý các lỗi “Soft 404” cũng đơn giản như xử lý các lỗi 404 thông thường:
- Nếu URL có lỗi “Soft 404” mà không tồn tại, cần chuyển hướng 301 đến một trang hiện có. Đồng thời đảm bảo rằng bạn khắc phục sự cố URL không tồn tại không trả lại mã lỗi 404.
- Nếu URL có lỗi “Soft 404” là một trong những trang có nội dung thực tế, điều này có nghĩa là Google sẽ xem đó là trang nội dung mỏng. Trong trường hợp này, hãy đảm bảo rằng bạn thêm nội dung có giá trị vào trang web của mình.
Sau khi xử lý các lỗi “Soft 404”, hãy nhớ đánh dấu tất cả chúng là đã sửa. Tiếp theo, chúng ta sẽ bàn về lỗi máy chủ 500.
Lỗi máy chủ 500 và cách sử lý
lỗi máy chủ 500 có lẽ là loại lỗi thu thập dữ liệu duy nhất bạn có thể lo lắng. Nếu bot Google gặp lỗi máy chủ thường xuyên trên trang của bạn, đây là một tín hiệu rất mạnh cho Google biết rằng có gì đó không ổn với trang của bạn và cuối cùng sẽ dẫn đến giảm thứ hạng một cách tồi tệ.
Loại lỗi thu thập dữ liệu này có thể hiển thị vì nhiều lý do. Đôi khi, đó có thể là một tên miền phụ, thư mục hoặc phần mở rộng tệp khiến máy chủ của bạn trả lại mã trạng thái 500 thay vì 200. Nhà thiết kế trang web của bạn sẽ có thể khắc phục điều này nếu bạn gửi cho anh ấy hoặc cô ấy danh sách URL bị obotlỗi 500 gần đây từ Công cụ quản trị trang web của Google.
Đôi khi lỗi máy chủ 500 xuất hiện trong Google Search Console do sự cố tạm thời. Máy chủ có thể đã ngừng hoạt động trong một thời gian do bảo trì, quá tải. Bạn có thể tìm chúng bằng cách kiểm tra tệp nhật ký của mình và liên hệ với nhà phát triển trang web của bạn. Trong trường hợp như thế này, bạn nên cố gắng đảm bảo rằng một vấn đề như vậy không xảy ra nữa trong tương lai.
Hãy chú ý đến các lỗi máy chủ hiển thị trong Google Webmaster Tools của bạn và cố gắng hạn chế sự xuất hiện của chúng càng nhiều càng tốt. Bot Google sẽ luôn có thể truy cập lại các trang của bạn để loại trừ lỗi này.
Hãy cùng xem một số lỗi thu thập dữ liệu khác mà bạn có thể gặp phải trong Công cụ quản trị trang web của Google.
Lỗi tìm nạp: 400, 503,..
Chúng tôi đã xử lý các lỗi thu thập thông tin quan trọng và phổ biến nhất trong bài viết này: 404, Soft 404 và 500. Thỉnh thoảng, bạn có thể tìm thấy các loại lỗi thu thập dữ liệu khác, như 400, 503, “Access denied”, “Faulty redirects” (cho điện thoại thông minh).
Trong nhiều trường hợp, Google cung cấp một số giải thích và ý tưởng về cách xử lý các loại lỗi khác nhau.
Nói chung, nên xử lý mọi loại lỗi thu thập dữ liệu mà bạn tìm thấy và cố gắng tránh nó xuất hiện lại trong tương lai. Càng ít lỗi thu thập dữ liệu mà bot Google gặp phải, Google càng tin tưởng vào trang web của bạn. Các trang liên tục gây ra lỗi thu thập dữ liệu sẽ được cho là cũng cung cấp trải nghiệm người dùng kém và sẽ được xếp hạng thấp hơn.
Bạn sẽ tìm thấy thêm thông tin về các loại lỗi thu thập dữ liệu khác nhau trong phần tiếp theo của bài viết này:
Danh sách các lỗi thu thập thông tin
Lỗi máy chủ 500
Trong báo cáo này, Google liệt kê các URL trả về lỗi 500 khi bot Google cố gắng thu thập dữ liệu trang.
Soft 404
Đây là các URL trả về mã trạng thái 200, nhưng sẽ trả về lỗi 400, theo Google.
Access denied (403)
Tại đây, Google liệt kê tất cả các URL trả về lỗi 403 khi bot Google cố gắng thu thập chúng. Hãy chắc chắn rằng bạn không liên kết với các URL có yêu cầu xác thực. Bạn có thể bỏ qua các lỗi “Access denied” của các trang mà bạn đã đưa vào tệp robots.txt của mình vì bạn không muốn Google truy cập chúng. Mặc dù vậy, có thể là một ý tưởng tốt khi sử dụng các liên kết nofollow khi bạn liên kết đến các trang này, để Google không thu thập dữ liệu chúng nhiều lần.
Not found (404 / 410)
“Not found” là lỗi 404 cơ bản.
Not followed (301)
Lỗi “not followed”, là các URL mà chuyển hướng đến một URL khác, nhưng chuyển hướng bị lỗi. Cần sửa lại các chuyển hướng này!
Lỗi 400 / 405 / 406
Tôi khuyên bạn nên xử lý các lỗi này giống như bạn sẽ xử lý các lỗi 404 bình thường.
Flash content (Smartphone)
Báo cáo này chỉ đơn giản là liệt kê các trang có nhiều nội dung flash có hoạt động trên hầu hết các điện thoại thông minh. bạn nên loại bỏ nội dung flash!
Blocked (Smartphone)
Lỗi này đề cập đến các trang có thể được truy cập bởi bot Google, nhưng đã bị chặn cho bot Google di động trong tệp robot.txt của bạn. Hãy chắc chắn rằng bạn cho phép tất cả các bot Google truy cập nội dung mà bạn muốn lập chỉ mục!
Nếu bạn có bất kỳ ý tưởng bổ sung nào về cách xử lý lỗi thu thập dữ liệu trong Công cụ quản trị trang web của Google, hãy cho mình biết bằng cách để lại bình luận dưới bài viết này nhé. Xin cảm ơn!
Hãy cho mình biết suy nghĩ của bạn trong phần bình luận bên dưới bài viết này. Hãy theo dõi kênh chia sẻ kiến thức WordPress của Hoangweb trên Twitter và Facebook
- shares
- Facebook Messenger
- Gmail
- Viber
- Skype
Nam Hải says
thật sự khi lỗi 404 là không biết lỗi gì luôn, giờ mới hiểu và thông trí ra, cảm ơn bạn.