Jan 29

Google Sitemap, Sitemap XML, Sitemap HTML cho Blog WordPress

Google Sitemap VietseoTrong bài trước, tôi đã hướng dẫn các bạn cách tối ưu hóa đường link URL Permalink tối ưu tiêu đề bài viết. Trong bài viết này chúng ta sẽ đề cập tới Google Sitemap. Một công cụ cần biết cho Webmaster.

Giới thiệu Google Sitemaps

Google Sitemaps là một công cụ cực hay của Google dành cho Webmaster trong phần công cụ Webmaster của máy tìm kiếm, vừa đơn giản vừa miễn phí giúp trang của bạn được Google khai thác tốt hơn. Hiểu được Google đánh giá thế nào về trang Web của bạn đồng thời trao đổi thông tin với máy tìm kiếm và làm cho cấu trúc trang của bạn rõ ràng hơn.

Google thấy gì trên trang của bạn và các vấn đề tiềm năng

Trước khi bắt tay vào việc cải thiện cấu trúc thêm rõ ràng bạn phải hiểu được bọ tìm kiếm của Google đã khai thác và đánh chỉ số trang của bạn như thế nào. Và Google Webmaster cung cấp cho bạn các thông tin Google khai thác trên site của bạn, nhận diện tệp tin ngoại trừ robots.txt, nội dung trang web của bạn.

Khai thác thế mạnh trên Website

Cũng trong phần công cụ Webmaster Google, hãng còn cung cập cho bạn các thông tin về lưu lượng :

  • Các từ khóa được tìm kiếm nhiều nhất mà mang lại khách cho trang của bạn và giúp bạn có vị trí cao trong trang kết quả. Và bằng cách nào người dùng Web tiếp cận trang của bạn.
  • Bạn cũng nắm bắt được thông tin về các trang đã được đánh chỉ số và các thống kê liên quan.

Tạo sơ đồ Web Sitemap cho Google

Nếu bạn sử dụng WordPress thì việc tạo Sitemap XML cho Google thật đơn giản vì, plugins Google (XML) Sitemaps Generator for WordPress cung cấp cho bạn hầu hết các tính năng cần thiết. Bạn hãy tiến hành theo các bước sau :

  • Tải Google (XML) Sitemaps Generator for WordPress xuống và upload plugin sau khi giải nén vào thư mục wp-content/plugins.
  • Tạo hai file sitemap.xml và sitemap.xml.gz tại ngay thư mục gốc của blog. CHMOD chúng dạng 777.
  • Kích hoạt plugin trong bảng quản trị của WordPress
  • Trong phần Options chọn Sitemap rồi nhấn “Rebuild Sitemap” –>Bạ đã hoàn thành cài đặt.

Giờ công việc còn lại chỉ là đăng ký sitemap.xml vừa tạo vào trong công cụ Webmaster Tools của Google. Bạn phải tạo một tài khoản Google để có thể sử dụng. Nếu bạn có rồi thì nhấn vào đây Google’s Webmaster Tools: Sitemap và làm theo chỉ dẫn (chọn add site).

Nếu bạn làm đúng theo các bước trên thì từ nay Google có thể tiếp cận cấu trúc sơ đồ Web của bạn một cách dễ dàng. Nó sẽ giúp cho việc trang Web của bạn được Google khai thác và đánh chỉ số tốt hơn. Tất cả các trang cho phép sẽ được Google biết tới và chắc chắn sẽ mang lại lưu lượng cho Website của bạn.

Ghi chú : Bạn không được nhầm lẫn hệ thống sitemap XML dành cho các máy tìm kiếm và hẹ thống sitemap HTML dành cho người dùng thường. Bạn có thể tham khảo bài viết Plugin cần thiết cho WordPress để biết thêm chi tiết (Phần Sitemap Generator).

Đây là phần 4 trong chuỗi bài viết SEO WordPress - Quảng bá Blog, Website. Nhấn vào liên kết sau để xem các phần khác :

  1. Khái quát chung SEO Blog WordPress.
  2. Tùy chọn và tối ưu Pemalinks cho WordPress.
  3. Tối ưu tiêu đề bài viết .
  4. Sơ đồ Website cho Google (Sitemap XML)
  5. Tăng cường liên kết trong.
Tags: search-engine, sitemap, google, plugin-wordpress, thu thuat blog, thu thuat WordPress, quang ba web, may tim kiem, seo wordpress, google sitemap

Chủ đề tượng tự

13 trả lời cho “Google Sitemap, Sitemap XML, Sitemap HTML cho Blog WordPress”
  1. Hoàng Says:

    Hi Vietseo,
    Đầu tiên xin tỏ lòng ngưỡng mộ web site của bạn, rất tuyệt! Những người như bạn làm vẻ đẹp của internet!
    Tớ có câu hỏi thế này, mong bạn giúp đỡ.
    Dạo này tớ cũng mày mò dùng WordPress và bắt đầu tạo sitemap.xml. Lúc trước tớ tạo sitemap bằng phần mềm SOFTplus GSiteCrawler. Phần mềm này chạy độc lập, tạo file sitemap.xml trên máy và rồi ta phải tự up lên host. Sau khi submit lên google webmaster thì mọi thứ khá trơn tru, các url của trang web được indexed nhanh chóng.
    Nhưng dạo gần đây phần mềm GSiteCrawler bị lỗi và tớ chuyển sang dùng plug-in Google (XML) Sitemaps Generator for WordPress (http://www.arnebrachhold.de/). Kết quả sitemap tạo ra bằng plug-in này có vẻ khá tốt (tớ kiểm tra trực tiếp bằng cách gõ link vào browser để xem), nhưng trang google webmaster thông báo là không index URLs được, mặc dù URLs submited thì vẫn nhận được.
    Vậy là hiện giờ khi thử google với site:nhiethuyet.org, tớ nhận được các kết quả từ 1 tháng trước, các kết quả mới hơn không indexed được. Thật là chán!
    Bạn có đề xuất gì không?
    Cảm ơn rất nhiều! :)

    –Hoàng

  2. admin Says:

    @Hoàng : Trước hết cám ơn cậu đã quan tâm tới bài viết. Cậu đã quá khen tớ rồi, đây chỉ là chút sở thích thôi, chứ chẳng dám so sánh này nò với ai, hi vọng có ích cho cộng đờng Webmaster.
    Quay trở lại vấn đề sitemap, có khá nhiều vấn đề :
    - Việc cậu tạo và sumit thành công là một việc nhưn Google có index được không lại phụ thuộc vào nhiều tố khác. Tớ lấy vị dụ : Site của cậu quá chậm, quá tải, hay cậu đặt tường lửa hoặc file robots.txt cấm chặn các URL hoặc tệ hơn là các Header trả về lỗi 500 hay 401 …
    - Tớ vừa vào trang của cậu, trang đang bị lỗi, nếu cậu muốn lời khuyên hiệu quả hơn thì đưa chính xác địa chỉ trang Web cũng như sitemap XML, tớ sẽ cố gắng giúp cậu trong phạm vi kiến thức khiêm tốn của mình.

    Chúc thành công.
    vietSEO.net

  3. Hoàng Says:

    Cảm ơn hồi đáp nhanh của VietSEO,
    Đúng là server trang của mình đang cập nhật nên hiện giờ không connect được. :( Có lẽ phải vài giờ hoặc 1 ngày nữa thì site mới hoạt động lại bình thường.
    Sitemap của tớ hiện đặt tại thư mục gốc http://nhiethuyet.org/sitemap.xmlhttp://nhiethuyet.org/sitemap.xml.gz. Trong file robots.txt thì tớ không chặn URL hay Search Engine nào, có lúc tớ đã cũng thử xóa luôn.
    Chắc khi nào site của tớ hoạt động lại bình thường thì mới nhờ cậu tiếp được.
    Cảm ơn nhiều!

    –Hoàng

  4. admin Says:

    Tớ đã xem qua trang của cậu tất cả đều bình thường từ server, sitemap XML cho đến robots.txt. Tớ xem các trang đánh chỉ mục và số trang trong sitemap. NhietHuyet.org có 115/159 trang được đánh chỉ số. Đó là con số không tồi nếu cậu xem số bài viết thật sự (Post) của trang.

    Vấn đề cậu mắc phải theo tớ nghĩ là trùng nội dung quá nhiều (Duplicate Content). Cùng một nội dung có thể tìm thấy tại ít nhất 4 chỗ :
    - Trang permanent link, ví dụ : http://nhiethuyet.org/index.php/2008/01/25/giao-trinh-kinh-te/
    - Trang tag (http://nhiethuyet.org/index.php/tag/mac-lenin/, nhiethuyet.org/index.php/tag/xac-suất/, … rất nhiều tags)
    -Trang Feed toàn cụ, và feed từng bài

    Thực ra việc dùng tag có thể chấp nhận được và việc trùng lặp nội dung trên blog cũng được Google nhân nhượng, tuy nhiên phải dùng đúng cách. Cậu dùng quá nhiều thẻ tag cho một bài viết. Mà mỗi tag URL lại chứa lại toàn bộ bài viết, vì thế khi trang tag này được đánh chỉ số thì đương nhiên trang permenant link bị coi là nội dung kép nên không được đánh chỉ số.

    Tớ đề nghị cậu thêm nofollow hay noindex cho các trang tag (sử dụng plugin All in One SEO http://wp.uberdose.com/2007/05/11/all-in-one-seo-pack-help/, phần Use noindex for Tag Archives). Hoặc đơn giản nhất là cậu nên sử dụng thẻ < ! --more-- > để chỉ hiện thị một phần bài viết trong các trang đơn thay vì toàn bộ bài viết. Chú ý thẻ này đặt càng cao trên bài viết thì càng tốt. Ngoài ra nên dùng robots.txt để chặn đánh chỉ số các trang feed; ví dụ : Disallow: */feed*

    Chúc cậu thành công.

  5. Hoàng Says:

    Cảm ơn những đề xuất của VietSEO.
    Giải thích của bạn có vẻ rất chuẩn xác. Có lẽ là các trang tag đã bị lạm dụng quá nhiều đến nỗi các bài post bình thường cũng không thể có priority cao hơn (khi google). Mình sẽ không index các trang tag nữa, và sẽ cố gắng dùng các thẻ more nhiều hơn. :)
    Mình sẽ thông báo tình hình sau.

  6. Mr.Solo Says:

    @admin: bạn nói đặt nó o thư mực CHMOD 777, mình dùng windows thi thiết lập như thế nào ?

  7. quang ba Web Says:

    @ Mr.Solo : CHMOD một file hay thư mục được thiết kế cho môi trường Unix, Linux. Muốn thực hiện được thì từ máy tính cá nhân, bạn truy cập vào server Linux qua FTP hay file manager hoặc Hosting Pannel, khi đó bạn sẽ có thể set CHMOD cho file hoặc thư mục.
    Bạn tham khảo thêm cách dùng FTP hay Hosting Pannel nếu có. Cái này cũng khá đơn giản mà.

    Chúc thành công.

  8. Chung Says:

    1.Em muốn tạo sitemap cho người dùng xem (ko phải cho các SE) giống như thế này http://www.vietseo.net/sitemap/ thì làm sao
    2.Sau khi submit sitemap thì khoảng bao lâu mới được google index

  9. Linda Nhi Says:

    Sitemap có giúp Google nó dò trang A nhiều, theo 1 tần số nhất định như 3 lần/ngày… ko bạn ơi?

  10. quang ba Web Says:

    @Chung: Bạn nên phân biệt sitemap XML cho Google và Sitemap HTML cho người dùng. Câu hỏi thứ nhất của cậu liên quan tới Sitemap HTML (cho bọ tìm kiếm và người dùng thường), bạn có thể tìm thấy Sitemap HTML như của quang ba Web tại bài viết về các Plugins của WordPress
    - Còn câu hỏi thứ hai của cậu lại là Sitemap XML (cho Google). Cậu có thể đọc lại kỹ bài viết trên. Sau khi submit thì tùy thuộc vào độ tin cậy của site, khá nhiều yếu tố thì sitemap của bạn sẽ có nhiều khả năng được scan sớm. Thường tớ để ý chỉ từ 1 tuần, nhưng để được cập nhật trong Webmaster Tools của Google thì phải mất đến ba tuần lận.

  11. quang ba Web Says:

    @Linda Nhi :
    Vì câu hỏi của bạn khá rộng và không chỉ chính xác sitemap XML hay sitemap HTML nên tớ trả lời cả hai :

    1. Đầu tiên tớ nói về Sitemap XML, nó có nhiều ích lợi nhưng chủ yếu là kiểu như, nói ví von thế này : Trang Web của bạn như là nhà của bạn, Sitemap thì như bản đồ trong khi Google là khách đến thăm. Bản đồ Sitemap là cách cậu liên lạc với Google và hướng dẫn nó thăm quan nhà, trong khi giới thiệu, mô tả cụ thể về từng phòng (phòng to, nhỏ), ngóc ngách. Nó còn chứa các thông tin liên quan tới các công trình mới và thông báo gửi lời mời tới ngài M. Google đến thăm lại (qua lệnh ping). Vì thế mức độ thường xuyên hay không lại phụ thuộc chủ yếu vào mức độ thường xuyên cập nhật sitemap XML và số lần bạn ping cho Google để thông báo thay đổi này.
      • Về sitemap HTML thì đó cũng giống như một trang khác trên Website thôi. Cũng giống như Sitemap XML đã nói ở trên thì nó chứa bản đồ nhà của bạn.
      • Nhưng đối tượng khách viếng thăm lại không giới hạn riêng cho VIP Google mà cho cả người dùng thường và được viết dưới dạng HTML với đường liên kết URL tới các mục quan trọng khác nhau của trang.
      • Ngoài ra nó còn đóng vai trò rất quan trọng, đảm bảo tất cả các mục quan trọng trên trang của bạn đều được tìm thấy dễ dàng của người dùng.
      • Sitemap HTML nên được tìm thấy từ bất kể trang nào trên Website. Nó giúp giảm tỷ lệ nhấn chuột để di chuyển tới mục cần thiết và giúp người dùng có cái nhìn bao quát về nội dung, thành phần trang của bạn.
      • Mức độ thường xuyên viếng thăm của Google bot trong trường hợp này phụ thuộc vào mức độ phổ biến và tin cậy, cập nhật thường xuyên … trang Web của bạn như tất cả các trang bình thường khác.

    Hi vọng trả lời được các câu hỏi của bạn.<
    Thân - quảng bá Web.

  12. PhongCachTre.Net Says:

    Em không hiểu vì sao mà em đã tạo sitemap rồi nhưng khi submit vào google nó lại ra not found
    Đây là link sitemap của em http://phongcachtre.net/sitemap.xml
    Mấy ngày trứơc mọi việc vẫn rất bình thường, tự nhiên hôm nay em login vào lại thấy error, submit lại mà nó vẫn báo là error
    Khi em nhờ 1 người bạn ở bên USA vào cái link sitemap trên thì nó cũng bảo là ko vào đựơc, nó hiện ra thông báo là :
    canThe following tags were not closed: urlset. Error processing resource ‘http://phongcachtre.net/sitemap.xml’.

  13. quang ba Web Says:

    Chào phong cách trẻ :
    Sau khi xem qua site map của bạn và câu hỏi với chi tiết lỗi thì mình khẳng định :

    1. Sitemap của cậu truy cập bỉnh thường, status luôn là 200 (OK) vì thế không có vấn đề gì.
    2. Theo thông báo lỗi của bạn cậu thì là do thẻ < / urlset> không được đóng. Tuy nhiên khi mình xem code source thì thấy được khai báo rất đầy đủ như một sitemap valid bình thường.

    Tớ nghĩ vấn đề có thể đến từ server, vì cậu không trích rõ lỗi của Google Webmaster Tools, nên tớ không thể nói chính xác. Tuy nhiên có thể do server bị down hoặc quá tải trong khi Google Bot đánh chỉ số. Cậu chỉ việc submit lại chắc là OK thôi.

    Chúc vui.

2 Trackbacks “Google Sitemap, Sitemap XML, Sitemap HTML cho Blog WordPress”
  1. SEO Blog WordPress - Quảng bá Website - Khái quát chung « Mr.Lonely - Chu Tuấn Tài
  2. Top 10 WordPress Plugins for CMS - Plugins hay nhất cho hệ thống quản trị nội dung » Hai Tuan Co.,Ltd
Leave a Reply