13 mẹo thực hành tốt nhất để tạo và tối ưu hóa sơ đồ trang web XML

Tạo sơ đồ trang web là một phần quan trọng trong việc tối ưu hóa bất kỳ trang web nào.

Không chỉ sơ đồ trang web cung cấp công cụ tìm kiếm với bản thiết kế chi tiết cách trang web của bạn được đặt ra, nhưng chúng cũng có thể bao gồm các siêu dữ liệu có giá trị như:
  • Tần suất mỗi trang được cập nhật.
  • Khi chúng được thay đổi lần cuối.
  • Các trang quan trọng có liên quan đến nhau như thế nào.
Sơ đồ trang web đặc biệt quan trọng đối với các trang web:
  • Bao gồm nhiều nội dung lưu trữ không được liên kết với nhau.
  • Thiếu liên kết bên ngoài.
  • Có hàng trăm hoặc thậm chí hàng nghìn trang.
Như tên của nó, các tệp này cung cấp các chương trình có bản đồ trang web của bạn giúp họ khám phá và lập chỉ mục các trang quan trọng nhất.
13 mẹo thực hành tốt nhất để tạo và tối ưu hóa sơ đồ trang web XML
Trong bài viết này, chúng tôi sẽ thảo luận các mẹo quan trọng nhất bạn cần biết để tạo và tối ưu hóa sơ đồ trang web cho các công cụ tìm kiếm và khách truy cập như nhau.

1. Sử dụng Công cụ & Trình cắm để tạo Sơ đồ trang web của bạn tự động

Tạo sơ đồ trang web rất dễ dàng khi bạn có các công cụ phù hợp, chẳng hạn như kiểm tra phần mềm bằng bộ tạo sẵn XML Sitemap hoặc plugin phổ biến như Google XML Sitemaps.

Trên thực tế, các trang web WordPress đã sử dụng Yoast SEO có thể cho phép Sơ đồ trang web XML trực tiếp trong plugin.

Ngoài ra, bạn có thể tự tạo ra một sơ đồ trang bằng cách làm theo cấu trúc mã trang web XML. Về mặt kỹ thuật, sơ đồ trang web của bạn thậm chí không cần phải ở định dạng XML - tệp văn bản với một dòng mới tách từng URL sẽ đủ.

Tuy nhiên, bạn sẽ cần phải tạo ra một sơ đồ trang XML hoàn chỉnh nếu bạn muốn thực hiện thuộc tính hreflang , do đó dễ dàng hơn nhiều chỉ để cho một công cụ làm việc cho bạn.

Truy cập trang chính thức của GoogleBing để biết thêm thông tin về cách thiết lập sơ đồ trang web theo cách thủ công.

2. Gửi Sơ đồ trang web của bạn tới Google

Bạn có thể gửi sơ đồ trang web của mình tới Google từ Bảng điều khiển tìm kiếm của Google . Từ trang tổng quan của bạn, hãy nhấp vào Thu thập thông tin> Sơ đồ trang web> Thêm Sơ đồ trang web Thử nghiệm .

Kiểm tra sơ đồ trang web của bạn và xem kết quả trước khi bạn nhấp vào Gửi Sơ đồ trang web để kiểm tra lỗi có thể ngăn các trang đích chính được lập chỉ mục.

Lý tưởng nhất là bạn muốn số trang được lập chỉ mục bằng với số trang được gửi.

Lưu ý rằng việc gửi sơ đồ trang web cho Google biết những trang nào bạn cho là chất lượng cao và xứng đáng lập chỉ mục, nhưng nó không đảm bảo rằng chúng sẽ được lập chỉ mục.

Thay vào đó, lợi ích của việc gửi sơ đồ trang web của bạn là:
  • Giúp Google hiểu cách trang web của bạn được trình bày ra sao.
  • Khám phá lỗi bạn có thể sửa để đảm bảo các trang của bạn được lập chỉ mục đúng cách.

3. Ưu tiên các trang có chất lượng cao trong Sơ đồ trang web của bạn

Khi nói đến xếp hạng, chất lượng trang web tổng thể là một yếu tố quan trọng.

Nếu sơ đồ trang web của bạn chỉ dẫn đến hàng nghìn trang chất lượng thấp, các công cụ tìm kiếm sẽ giải thích các trang này như là một dấu hiệu cho thấy trang web của bạn có lẽ không phải là một khách truy cập muốn ghé thăm - ngay cả khi trang đó là cần thiết cho trang web của bạn, chẳng hạn như các trang đăng nhập.

Thay vào đó, cố gắng chỉ đạo các chương trình đến các trang quan trọng nhất trên trang web của bạn. Lý tưởng nhất là những trang như sau:
  • Tối ưu hóa cao.
  • Bao gồm hình ảnh và video.
  • Có nhiều nội dung độc đáo.
  • Thỏa thuận cam kết của người dùng thông qua nhận xét và đánh giá.

4. Phân lập các vấn đề lập chỉ mục

Google Search Console có thể hơi bực bội nếu nó không lập chỉ mục tất cả các trang của bạn bởi vì nó không cho bạn biết trang nào là vấn đề.

Ví dụ: nếu bạn gửi 20.000 trang và chỉ có 15.000 người trong số đó được lập chỉ mục, bạn sẽ không được biết về 5000 "trang vấn đề" là gì.

Điều này đặc biệt đúng với các trang web thương mại điện tử lớn có nhiều trang cho các sản phẩm rất giống nhau.

Chuyên gia tư vấn SEO Michael Cottam đã viết một hướng dẫn hữu ích để cô lập các trang có vấn đề. Ông đề xuất chia các trang sản phẩm thành các sơ đồ trang XML khác nhau và thử nghiệm từng trang.

Tạo các sơ đồ trang web sẽ khẳng định các giả thuyết, chẳng hạn như "các trang không có hình ảnh sản phẩm không được lập chỉ mục" hoặc "các trang không có bản sao duy nhất không được lập chỉ mục".

Khi bạn đã tách những vấn đề chính, bạn có thể làm việc để khắc phục sự cố hoặc đặt các trang đó thành "noindex", do đó chúng không làm giảm chất lượng trang web tổng thể của bạn.

5. Chỉ bao gồm các phiên bản Canonical của URL trong Sơ đồ trang web của bạn

Khi bạn có nhiều trang giống nhau, chẳng hạn như các trang sản phẩm cho các màu khác nhau của cùng một sản phẩm, bạn nên sử dụng thẻ "liên kết rel = canonical" để cho Google biết trang nào là trang "chính" họ nên thu thập thông tin và lập chỉ mục.

Bots có một thời gian dễ dàng hơn trong việc khám phá các trang chính nếu bạn không bao gồm các trang có URL theo tiêu chuẩn chỉ các trang khác .

6. Sử dụng Robots Meta Tag trên Robots.txt Bất cứ khi nào có thể

Khi bạn không muốn trang được lập chỉ mục, bạn thường muốn sử dụng thẻ meta "noindex, follow".

Điều này ngăn Google chỉ mục trang nhưng nó giữ nguyên giá trị liên kết của bạn và đặc biệt hữu ích cho các trang tiện ích quan trọng đối với trang web của bạn nhưng không được hiển thị trong kết quả tìm kiếm.

Lần duy nhất bạn muốn sử dụng robots.txt để chặn các trang là khi bạn ăn cắp ngân sách thu thập dữ liệu của mình .

Nếu bạn nhận thấy rằng Google đang thu thập lại và lập chỉ mục những trang tương đối không quan trọng (ví dụ như các trang sản phẩm cá nhân) với chi phí của các trang cốt lõi, bạn có thể muốn sử dụng robots.txt.

7. Không Bao gồm URL 'noindex' trong Sơ đồ trang web của bạn

Phát biểu về ngân sách thu thập dữ liệu bị lãng phí, nếu các robot của các công cụ tìm kiếm không được phép lập chỉ mục các trang nhất định thì họ không có kinh doanh trong sơ đồ trang web của bạn.

Khi bạn gửi một sơ đồ trang bao gồm các trang bị chặn và "noindex", bạn đang nói với Google đồng thời "điều quan trọng là bạn lập chỉ mục trang này" và "bạn không được phép lập chỉ mục trang này".

Thiếu tính nhất quán là một sai lầm phổ biến.

8. Tạo các sơ đồ XML động cho các trang web lớn

Gần như không thể theo kịp tất cả các robot meta của bạn trên các trang web khổng lồ.

Thay vào đó, bạn nên thiết lập logic quy tắc để xác định khi một trang sẽ được bao gồm trong sơ đồ trang XML của bạn và / hoặc đã thay đổi từ noindex thành "chỉ mục, theo dõi".

Bạn có thể tìm hướng dẫn chi tiết về chính xác cách tạo sơ đồ trang XML động nhưng lại một lần nữa bước này được thực hiện dễ dàng hơn với sự trợ giúp của một công cụ tạo sitemaps động cho bạn.

9. Sử dụng Sơ đồ trang web XML và Nguồn cấp dữ liệu RSS / Atom

Nguồn cấp dữ liệu RSS / Atom thông báo cho các công cụ tìm kiếm khi bạn cập nhật trang hoặc thêm nội dung mới vào trang web của bạn.

Google khuyến cáo sử dụng cả sơ đồ trang web và nguồn cấp dữ liệu RSS / Atom để giúp các công cụ tìm kiếm hiểu những trang nào nên được lập chỉ mục và cập nhật.

Bằng cách chỉ đưa nội dung cập nhật gần đây trong nguồn cấp dữ liệu RSS / Atom của bạn, bạn sẽ tìm thấy nội dung tươi hơn dễ dàng hơn cho cả công cụ tìm kiếm và khách truy cập.

10. Chỉ cập nhật lần sửa đổi khi bạn thực hiện những thay đổi đáng kể

Đừng cố lừa các công cụ tìm kiếm vào việc lập chỉ mục các trang bằng cách cập nhật thời gian sửa đổi của bạn mà không thực hiện bất kỳ trang đáng kể nào cho trang của bạn.

Năm ngoái, tôi đã nói chuyện về những nguy cơ tiềm ẩn của SEO có nguy cơ . Tôi sẽ không nhắc lại tất cả các điểm của tôi ở đây nhưng đủ để nói rằng Google có thể bắt đầu tháo tem ngày của bạn nếu chúng được cập nhật liên tục mà không cung cấp giá trị mới.

11. Đừng lo lắng quá nhiều về cài đặt ưu tiên

Một số Sơ đồ trang web có cột "Ưu tiên" cho thấy công cụ tìm kiếm trang nào là quan trọng nhất.

Cho dù tính năng này thực sự hoạt động, tuy nhiên, từ lâu đã được tranh luận.

Đầu năm ngoái, Gary Illyes của Google đã tweet  rằng Googlebot bỏ qua cài đặt ưu tiên trong khi thu thập dữ liệu.

12. Giữ kích thước tệp là nhỏ nhất có thể

Sơ đồ trang web nhỏ hơn của bạn, ít căng thẳng hơn bạn đang đặt trên máy chủ của bạn.

Google và Bing đều tăng kích thước các tệp tin sơ đồ trang web được chấp nhận từ 10 MB lên 50 MB vào năm 2016 nhưng vẫn giữ nguyên sơ đồ trang web tốt nhất và ưu tiên các trang đích chính của bạn.

13. Tạo Nhiều Sơ đồ trang web Nếu Trang web bao gồm> 50.000 URL

Bạn được giới hạn tới 50.000 URL cho mỗi sơ đồ trang web.

Mặc dù điều này là quá đủ cho hầu hết các trang web, một số trang web sẽ cần phải tạo nhiều hơn một sơ đồ trang web.

Ví dụ: các trang web thương mại điện tử lớn có thể cần phải tạo các sơ đồ trang web bổ sung để xử lý các trang sản phẩm bổ sung.

Mời các bạn viết lời bình cho bài viết!

Nhấp bài bình luận SEO