Ads Top

Hệ thống Khách sạn gần Sân bay giá rẻ | Phòng chờ bay

404 vs Lỗi Soft 404: sự khác biệt & Cách nào để Fix Cả hai

Mỗi trang tải trong trình duyệt web đều có mã phản hồi bao gồm trong tiêu đề HTTP, có thể hoặc không thể nhìn thấy trên trang web.

Có rất nhiều mã đáp ứng khác nhau mà máy chủ cung cấp cho việc truyền tải trạng thái tải của trang; Một trong những mã nổi tiếng nhất là mã phản hồi 404.

Nói chung, bất kỳ mã nào trong 400 đến 499 chỉ ra rằng trang đã không tải. Mã 404 phản hồi là mã duy nhất mang ý nghĩa cụ thể - rằng trang thực sự đã biến mất và có lẽ sẽ không quay trở lại bất cứ lúc nào.

Lỗi Soft 404 là gì?

Lỗi 404 mềm không phải là mã phản hồi chính thức được gửi đến trình duyệt web. Đó chỉ là một nhãn Google bổ sung vào một trang trong chỉ mục của họ.

Khi Google thu thập dữ liệu các trang, nó phân bổ các nguồn lực cẩn thận đảm bảo rằng không có thời gian lãng phí bằng cách thu thập thông tin các trang bị thiếu mà không cần phải được lập chỉ mục.
404 vs Lỗi Soft 404: sự khác biệt & Cách nào để Fix Cả hai

Tuy nhiên, có một số máy chủ được cấu hình kém và trang bị thiếu tải 200 mã khi nó hiển thị mã phản hồi 404. Nếu tiêu đề HTTP vô hình hiển thị mã 200 ngay cả khi trang web đã nêu rõ rằng trang không được tìm thấy, thì trang đó có thể được lập chỉ mục, đây là một sự lãng phí tài nguyên cho Google.

Để chống lại vấn đề này, Google ghi nhận các đặc tính của 404 trang và cố gắng phân biệt xem trang 404 thực sự là trang 404 hay không. Nói cách khác, Google đã học được rằng nếu nó trông giống như một chiếc 404, có mùi giống như 404, và hoạt động giống như 404, thì đó có lẽ là trang 404 chính hãng.

Có thể xác định sai là Soft 404

Ngoài ra còn có trường hợp trang đó không thực sự thiếu, nhưng một số đặc điểm đã kích hoạt Google phân loại nó như một trang bị thiếu.

Một số đặc điểm này bao gồm một lượng nhỏ hoặc thiếu nội dung trên trang và có quá nhiều trang tương tự trên trang web.

Những đặc điểm này cũng tương tự như các yếu tố mà thuật toán Panda khắc phục. Bản cập nhật Panda coi nội dung mỏng và trùng lặp là các yếu tố xếp hạng tiêu cực.

Vì vậy, khắc phục những vấn đề này sẽ giúp tránh cả các phiên bản 404 mềm và Panda.

404 lỗi có hai nguyên nhân chính:
  • Lỗi trong liên kết, hướng người dùng đến một trang không tồn tại.
  • Một liên kết đến một trang đã từng tồn tại và đột nhiên biến mất.
Lỗi liên kết

Nếu nguyên nhân gây ra lỗi 404 là lỗi liên kết, bạn chỉ cần sửa các liên kết.

Phần khó khăn của nhiệm vụ này là tìm tất cả các liên kết bị hỏng trên một trang web.

Nó có thể là nhiều thách thức đối với các trang web lớn, phức tạp có hàng ngàn hoặc hàng triệu trang. Trong những trường hợp như thế này, các công cụ thu thập thông tin có ích. Bạn có thể thử sử dụng phần mềm như Xenu, DeepCrawl, Screaming Frog, hoặc Botify.

Một trang không còn tồn tại nữa

Khi một trang không còn tồn tại, bạn có hai lựa chọn:
  • Khôi phục trang nếu đã vô tình xóa.
  • 301 chuyển hướng nó đến trang liên quan gần nhất nếu nó bị xóa vì mục đích.
Trước tiên, bạn phải xác định tất cả các lỗi liên kết trên trang web. Tương tự như việc tìm kiếm tất cả các lỗi trong liên kết cho một trang web có quy mô lớn, bạn có thể sử dụng công cụ thu thập dữ liệu. Tuy nhiên, các công cụ thu thập dữ liệu không thể tìm thấy các trang mồ côi, đó là những trang không được liên kết từ bất cứ đâu trong liên kết điều hướng hoặc từ bất kỳ trang nào.

Các trang mồ côi có thể tồn tại nếu họ từng là một phần của trang web, sau đó sau khi thiết kế lại trang web, liên kết tới trang cũ này đã biến mất, nhưng liên kết bên ngoài từ các trang web khác có thể vẫn liên kết với chúng. Để kiểm tra lại xem các loại trang này tồn tại trên trang web của bạn, bạn có thể sử dụng nhiều công cụ khác nhau.

Google Search Console

Bảng điều khiển tìm kiếm sẽ báo cáo 404 trang vì trình thu thập thông tin của Google đi qua tất cả các trang mà nó có thể tìm thấy. Điều này có thể bao gồm các liên kết từ các trang web khác đến trang đã từng tồn tại trên trang web của bạn.

Google Analytics

Bạn sẽ không tìm thấy báo cáo trang bị thiếu trong Google Analytics theo mặc định. Tuy nhiên, bạn có thể theo dõi chúng theo một số cách.

Đối với một, bạn có thể tạo báo cáo tùy chỉnh và phân đoạn các trang có tiêu đề trang đề cập đến Lỗi 404 - Không tìm thấy trang.

Một cách khác để tìm các trang mồ côi trong Google Analytics là tạo các nhóm nội dung tuỳ chỉnh và chỉ định tất cả 404 trang cho một nhóm nội dung.

Trang web: Lệnh Tìm kiếm Nhà điều hành

Tìm kiếm Google cho "site: example.com" sẽ liệt kê tất cả các trang của example.com được Google lập chỉ mục. Sau đó, bạn có thể kiểm tra từng trang đang tải hoặc nếu họ đang cho 404.

Để làm điều này theo quy mô, tôi thích sử dụng WebCEO, có một tính năng để điều hành trang web: điều hành không chỉ trên Google mà còn trên Bing, Yahoo, Yandex, Naver, Baidu và Seznam.

Vì tất cả các công cụ tìm kiếm chỉ cung cấp cho bạn một tập hợp con, chạy nó trên nhiều công cụ tìm kiếm có thể giúp đưa ra một danh sách lớn các trang trong trang của bạn. Danh sách này có thể được xuất khẩu và chạy trên các công cụ để kiểm tra khối lượng 404. Tôi chỉ cần làm điều này bằng cách thêm tất cả URL dưới dạng các liên kết trong một tệp HTML và tải nó lên Xenu để kiểm tra ồ ạt cho 404 lỗi.

Các công cụ nghiên cứu backlink khác
Các công cụ nghiên cứu backlink như Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, LinkResearchTools và CognitiveSEO cũng có thể trợ giúp.

Hầu hết các công cụ này sẽ xuất danh sách các liên kết ngược liên kết với tên miền của bạn. Từ đó, bạn có thể kiểm tra tất cả các trang đang được liên kết và tìm lỗi 404.

Làm thế nào để Sửa Lỗi Soft 404

Các công cụ thu thập thông tin sẽ không phát hiện ra phần mềm 404 vì nó không thực sự là lỗi 404. Nhưng bạn có thể sử dụng các công cụ thu thập thông tin để phát hiện ra một thứ khác. Dưới đây là một vài điều cần tìm:
  • Nội dung mỏng: Một số công cụ thu thập dữ liệu không chỉ báo cáo các trang có nội dung mỏng mà còn hiển thị tổng số từ. Từ đó, bạn có thể sắp xếp URL dựa trên số từ của nội dung. Bắt đầu với các trang có ít số từ và đánh giá xem trang có nội dung mỏng hay không.
  • Nội dung trùng lặp: Một số công cụ thu thập thông tin đủ phức tạp để phân biệt tỷ lệ phần trăm của trang là nội dung mẫu. Nếu nội dung chính gần như nhiều trang khác, bạn nên xem xét các trang này và xác định tại sao lại có nội dung trùng lặp trên trang web của bạn.
Bên cạnh các công cụ thu thập dữ liệu, bạn cũng có thể sử dụng Google Search Console và kiểm tra dưới các lỗi thu thập thông tin để tìm các trang được liệt kê dưới dạng 404 mềm.

Thu thập thông tin toàn bộ trang web để tìm các sự cố gây ra phần mềm 404 cho phép bạn xác định vị trí và khắc phục sự cố trước khi Google thậm chí phát hiện chúng.

Sau khi phát hiện ra các vấn đề 404 mềm, bạn sẽ cần phải sửa chúng.

Hầu hết thời gian, các giải pháp có vẻ là thông thường. Điều này có thể bao gồm những điều đơn giản như mở rộng các trang có nội dung mỏng hoặc thay thế nội dung trùng lặp bằng những nội dung mới và duy nhất.

Trong suốt quá trình này, dưới đây là một vài điều cần xem xét:
  • Hợp nhất trang: Đôi khi nội dung mỏng là do quá cụ thể với chủ đề trang, có thể để lại cho bạn với ít để nói. Kết hợp nhiều trang mỏng vào một trang có thể phù hợp hơn nếu các chủ đề có liên quan. Không chỉ giải quyết vấn đề nội dung mỏng, mà nó còn có thể khắc phục các vấn đề nội dung trùng lặp. Ví dụ: một trang web thương mại điện tử bán giày có nhiều màu sắc và kích cỡ khác nhau có thể có URL khác nhau cho mỗi kích thước và sự kết hợp màu sắc. Điều này để lại một số lượng lớn các trang có nội dung mỏng và tương đối giống nhau. Phương pháp tiếp cận hiệu quả hơn là đặt tất cả vào một trang và liệt kê các tùy chọn khả dụng.
  • Tìm các vấn đề kỹ thuật gây ra nội dung trùng lặp: Sử dụng ngay cả công cụ thu thập dữ liệu web đơn giản nhất như Xenu (không nhìn vào nội dung mà chỉ URL, mã phản hồi và thẻ tiêu đề), bạn vẫn có thể tìm thấy các vấn đề về nội dung trùng lặp bằng cách xem URL. Điều này bao gồm những thứ như URL www và không phải URL, http và https, với index.html và không có, có thông số theo dõi và không có thông tin, vv. Có thể tìm thấy bản tóm tắt tốt về những vấn đề chung về nội dung trùng lặp này trong các mẫu URL trên trang trình bày 6 của Bài trình bày này.
Google 404 Lỗi & Lỗi 404 Giữ theo cách tương tự

Một phần mềm 404 không phải là lỗi thực 404, nhưng Google sẽ deindex các trang đó nếu chúng không được cố định nhanh chóng. Tốt nhất nên thu thập dữ liệu trang web của bạn thường xuyên để xem có xảy ra lỗi 404 hoặc mềm 404 không. Các công cụ thu thập thông tin phải là một thành phần chính của kho dự án SEO của bạn.
Được tạo bởi Blogger.