<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Comments on: Robots.txt disallows Web Robot, User-agent</title>
	<atom:link href="http://www.vietseo.net/indexability/robots-txt-search-indexing/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/</link>
	<description>Quảng bá Website, Thủ thuật SEO (Search Engine Optimization), tối ưu hóa Website cho máy tìm kiếm</description>
	<lastBuildDate>Sun, 14 Mar 2010 10:40:44 +0100</lastBuildDate>
	<generator>http://wordpress.org/?v=2.8.4</generator>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
	<item>
		<title>By: Daitop</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-15977</link>
		<dc:creator>Daitop</dc:creator>
		<pubDate>Tue, 08 Dec 2009 18:24:38 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-15977</guid>
		<description>Em Đang Sử dụng host free của byethost để làm một forum nhưng mà không hiểu sao mỗi khi em vào trang theo domain của em nó lại hiện ra trang http://4sql.net/notify/1.php hoặc http://ifastnet.com/notify/1.php 
EM có lên mạng tìm hiểu thì được biết có thể là  do file robots.txt . Mong anh sớm có câu trả lời</description>
		<content:encoded><![CDATA[<p>Em Đang Sử dụng host free của byethost để làm một forum nhưng mà không hiểu sao mỗi khi em vào trang theo domain của em nó lại hiện ra trang <a href="http://4sql.net/notify/1.php" rel="nofollow">http://4sql.net/notify/1.php</a> hoặc <a href="http://ifastnet.com/notify/1.php" rel="nofollow">http://ifastnet.com/notify/1.php</a><br />
EM có lên mạng tìm hiểu thì được biết có thể là  do file robots.txt . Mong anh sớm có câu trả lời</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Top 10 thủ thuật SEO Webmaster cần tránh at Tiếp Thị Trực Tuyến</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-2355</link>
		<dc:creator>Top 10 thủ thuật SEO Webmaster cần tránh at Tiếp Thị Trực Tuyến</dc:creator>
		<pubDate>Sun, 21 Jun 2009 12:10:32 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-2355</guid>
		<description>[...] Robots.txt disallows Web Robot, User-agent [...]</description>
		<content:encoded><![CDATA[<p>[...] Robots.txt disallows Web Robot, User-agent [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Thủ thuật SEO, quảng bá Website cơ bản &#171; Affiliate &#8211; Hướng dẫn kiếm tiền với Affiliate</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-1790</link>
		<dc:creator>Thủ thuật SEO, quảng bá Website cơ bản &#171; Affiliate &#8211; Hướng dẫn kiếm tiền với Affiliate</dc:creator>
		<pubDate>Fri, 12 Jun 2009 14:59:01 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-1790</guid>
		<description>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh “nofollow” để hạn chế nội dung trùng lặp [...]</description>
		<content:encoded><![CDATA[<p>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh “nofollow” để hạn chế nội dung trùng lặp [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Chỉ dẫn của Google cho webmaster &#171; Tôi thấy, tôi nghĩ và tôi ghi lại</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-1281</link>
		<dc:creator>Chỉ dẫn của Google cho webmaster &#171; Tôi thấy, tôi nghĩ và tôi ghi lại</dc:creator>
		<pubDate>Mon, 16 Mar 2009 13:37:52 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-1281</guid>
		<description>[...] dụng tệp tin loại trừ robots.txt trên site của bạn. Tệp tin này cho máy dò tìm biết thư mục nào được hoặc [...]</description>
		<content:encoded><![CDATA[<p>[...] dụng tệp tin loại trừ robots.txt trên site của bạn. Tệp tin này cho máy dò tìm biết thư mục nào được hoặc [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: hoang</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-1084</link>
		<dc:creator>hoang</dc:creator>
		<pubDate>Sat, 13 Dec 2008 09:50:30 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-1084</guid>
		<description>chào anh

Trường hợp mình tạo link cho bài viết dạng http://www.vietseo.net/indexability/robots-txt-search-indexing/ như của anh tức là domain.com/catogory/post

Thì dùng lệnh như dưới đây có đúng không ạ? 

Disallow: /category/

Vì em có blog wordpress.com thấy google có index cả:

www.domain.com//category/tên catogory.

cảm ơn a.</description>
		<content:encoded><![CDATA[<p>chào anh</p>
<p>Trường hợp mình tạo link cho bài viết dạng <a href="http://www.vietseo.net/indexability/robots-txt-search-indexing/" rel="nofollow">http://www.vietseo.net/indexability/robots-txt-search-indexing/</a> như của anh tức là domain.com/catogory/post</p>
<p>Thì dùng lệnh như dưới đây có đúng không ạ? </p>
<p>Disallow: /category/</p>
<p>Vì em có blog wordpress.com thấy google có index cả:</p>
<p><a href="http://www.domain.com//category/tên" rel="nofollow">http://www.domain.com//category/tên</a> catogory.</p>
<p>cảm ơn a.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: quang ba Web</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-1047</link>
		<dc:creator>quang ba Web</dc:creator>
		<pubDate>Sun, 16 Nov 2008 13:43:49 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-1047</guid>
		<description>Việc đặt file robots.txt tại thư mục gốc của diễn đàn giúp cho bạn ngăn chặn một số robots và spam ngoài ý muốn, gây tốn băng thông. Tuy nhiên không phải spammer nào cũng tuân thủ theo robots.txt. Các spammer khó chịu nhất là loại tự động; tự động đăng ký khi giải mã hay qua mặt được mã kiểm tra. Bạn nên tăng cường bảo mật phần đăng ký bằng việc cải thiện thêm mã kiểm tra.

Ngoài ra còn loại spammer thủ công, spam quảng cáo, bạn nên dọn dẹp một mục quảng cáo và đặt nội qui trên các box để người ta đăng bài đúng mục. Ngoài ra việc cập nhật các lỗi của vbulletin cũng giúp giảm bớt nạn spam kết hợp với đội ngũ moderator sẽ giải quyết triệt để hơn.

Thân.</description>
		<content:encoded><![CDATA[<p>Việc đặt file robots.txt tại thư mục gốc của diễn đàn giúp cho bạn ngăn chặn một số robots và spam ngoài ý muốn, gây tốn băng thông. Tuy nhiên không phải spammer nào cũng tuân thủ theo robots.txt. Các spammer khó chịu nhất là loại tự động; tự động đăng ký khi giải mã hay qua mặt được mã kiểm tra. Bạn nên tăng cường bảo mật phần đăng ký bằng việc cải thiện thêm mã kiểm tra.</p>
<p>Ngoài ra còn loại spammer thủ công, spam quảng cáo, bạn nên dọn dẹp một mục quảng cáo và đặt nội qui trên các box để người ta đăng bài đúng mục. Ngoài ra việc cập nhật các lỗi của vbulletin cũng giúp giảm bớt nạn spam kết hợp với đội ngũ moderator sẽ giải quyết triệt để hơn.</p>
<p>Thân.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Le thanh Hiep</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-1045</link>
		<dc:creator>Le thanh Hiep</dc:creator>
		<pubDate>Sun, 16 Nov 2008 03:54:46 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-1045</guid>
		<description>Anh ơi diễn đàn của em toàn bị spam thôi, em đã đặt file robot.txt lên bên trong diễn đàn ngang hàng với admincp rồi mà vẫn bị. Hay là file robot.txt của em viết sai ở đâu anh nhỉ?
Anh có thể viết lại cho em một file robot.txt được ko?
Em cám ơn anh nhiều. Anh làm ơn gửi cho em vao email với nhé</description>
		<content:encoded><![CDATA[<p>Anh ơi diễn đàn của em toàn bị spam thôi, em đã đặt file robot.txt lên bên trong diễn đàn ngang hàng với admincp rồi mà vẫn bị. Hay là file robot.txt của em viết sai ở đâu anh nhỉ?<br />
Anh có thể viết lại cho em một file robot.txt được ko?<br />
Em cám ơn anh nhiều. Anh làm ơn gửi cho em vao email với nhé</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Thủ Thuật Seo Quảng Bá Website Cho Webmaster Việt Nam &#171; Life&#8217;s connection and share</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-852</link>
		<dc:creator>Thủ Thuật Seo Quảng Bá Website Cho Webmaster Việt Nam &#171; Life&#8217;s connection and share</dc:creator>
		<pubDate>Sat, 30 Aug 2008 02:12:39 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-852</guid>
		<description>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh “nofollow” để hạn chế nội dung trùng lặp [...]</description>
		<content:encoded><![CDATA[<p>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh “nofollow” để hạn chế nội dung trùng lặp [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Googlebot v</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-800</link>
		<dc:creator>Googlebot v</dc:creator>
		<pubDate>Wed, 13 Aug 2008 07:07:37 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-800</guid>
		<description>[...] v</description>
		<content:encoded><![CDATA[<p>[...] v</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Googlebot v</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-799</link>
		<dc:creator>Googlebot v</dc:creator>
		<pubDate>Wed, 13 Aug 2008 07:06:02 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-799</guid>
		<description>[...] v</description>
		<content:encoded><![CDATA[<p>[...] v</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Thủ thuật SEO - quảng bá Website &#171; SEO Blog Google</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-687</link>
		<dc:creator>Thủ thuật SEO - quảng bá Website &#171; SEO Blog Google</dc:creator>
		<pubDate>Sat, 26 Jul 2008 01:47:07 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-687</guid>
		<description>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh &#8220;nofollow&#8221; để hạn chế nội dung [...]</description>
		<content:encoded><![CDATA[<p>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh &#8220;nofollow&#8221; để hạn chế nội dung [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Robots, HTML Meta và Google, Yahoo, Microsoft &#171; SEO Blog Google</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-629</link>
		<dc:creator>Robots, HTML Meta và Google, Yahoo, Microsoft &#171; SEO Blog Google</dc:creator>
		<pubDate>Wed, 23 Jul 2008 20:35:10 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-629</guid>
		<description>[...] lên máy tìm kiếm. Trong trường hợp này họ sẽ sử dụng tệp tin loại trừ robots.txt (Robots Exclusion Protocol - REP) để hướng dẫn bọ tìm kiếm tiếp cận tài nguyên [...]</description>
		<content:encoded><![CDATA[<p>[...] lên máy tìm kiếm. Trong trường hợp này họ sẽ sử dụng tệp tin loại trừ robots.txt (Robots Exclusion Protocol &#8211; REP) để hướng dẫn bọ tìm kiếm tiếp cận tài nguyên [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Báo lá cải &#187; Blog Archive &#187; Thủ thuật SEO - quảng bá Website</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-590</link>
		<dc:creator>Báo lá cải &#187; Blog Archive &#187; Thủ thuật SEO - quảng bá Website</dc:creator>
		<pubDate>Tue, 15 Jul 2008 04:38:48 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-590</guid>
		<description>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh “nofollow” để hạn chế nội dung trùng lặp [...]</description>
		<content:encoded><![CDATA[<p>[...] trang Web của mình, bạn có thể sử dụng tệp tin robots.txt hay các meta tag robots cũng như lệnh “nofollow” để hạn chế nội dung trùng lặp [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: quang ba Web</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-393</link>
		<dc:creator>quang ba Web</dc:creator>
		<pubDate>Mon, 19 May 2008 09:02:05 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-393</guid>
		<description>Cám ơn Phong cách trẻ đã quan tâm tới vấn đề robots.

Quay trở lại câu hỏi của bạn, thì đúng là khi làm robots.txt mình cũng không xem rõ các bản ghi (record) cho bọ tìm kiếm nên có bị trùng lặp.

Về nghĩa thì như sau : Tên Googlebot-Image và Mediapartners-Google là các spider hay Bot, User-Agent Names riêng biệt của Google, tương ứng dùng để quét  các file ảnh, các thông tin phục vụ cho dịch vụ quảng cáo Adsense mà trang Web đó dùng. Do lệnh dùng bị lặp nên cậu không hiểu là đúng. File robots.txt mới được chỉnh sửa lại chính xác hơn.

Còn các User Agent Names khác như ia_archiver hay ia_archiver là các spider đến từ các trang lưu trữ internet (cho phép giữ lại hình ảnh các trang), đây là lựa chọn cá nhân. Mình cấm các con bọ đến từ trang này được đánh chỉ số trang. 

Thực ra về cú pháp, mình nghĩ chỉ nên dùng cú pháp cấm thư mục chứ không có cho phép như đã đề cập trong bài viết.

Cám ơn cậu. 
Thân.</description>
		<content:encoded><![CDATA[<p>Cám ơn Phong cách trẻ đã quan tâm tới vấn đề robots.</p>
<p>Quay trở lại câu hỏi của bạn, thì đúng là khi làm robots.txt mình cũng không xem rõ các bản ghi (record) cho bọ tìm kiếm nên có bị trùng lặp.</p>
<p>Về nghĩa thì như sau : Tên Googlebot-Image và Mediapartners-Google là các spider hay Bot, User-Agent Names riêng biệt của Google, tương ứng dùng để quét  các file ảnh, các thông tin phục vụ cho dịch vụ quảng cáo Adsense mà trang Web đó dùng. Do lệnh dùng bị lặp nên cậu không hiểu là đúng. File robots.txt mới được chỉnh sửa lại chính xác hơn.</p>
<p>Còn các User Agent Names khác như ia_archiver hay ia_archiver là các spider đến từ các trang lưu trữ internet (cho phép giữ lại hình ảnh các trang), đây là lựa chọn cá nhân. Mình cấm các con bọ đến từ trang này được đánh chỉ số trang. </p>
<p>Thực ra về cú pháp, mình nghĩ chỉ nên dùng cú pháp cấm thư mục chứ không có cho phép như đã đề cập trong bài viết.</p>
<p>Cám ơn cậu.<br />
Thân.</p>
]]></content:encoded>
	</item>
	<item>
		<title>By: Phong Cách Trẻ</title>
		<link>http://www.vietseo.net/indexability/robots-txt-search-indexing/comment-page-1/#comment-392</link>
		<dc:creator>Phong Cách Trẻ</dc:creator>
		<pubDate>Sun, 18 May 2008 23:47:41 +0000</pubDate>
		<guid isPermaLink="false">http://www.vietseo.net/?p=116#comment-392</guid>
		<description>Anh có thể giải thích về file robot.txt của vietseo đựơc không ạ ?
Khúc đầu em đọc bài này thì em có thể hiểu, còn khúc sau thì không hiểu ý nghĩa là gì
# Google Image
User-agent: Googlebot-Image
Disallow:
Allow: /*

# Google AdSense
User-agent: Mediapartners-Google*
Disallow:
Allow: /*

# Internet Archiver Wayback Machine
User-agent: ia_archiver
Disallow: /

# digg mirror
User-agent: duggmirror
Disallow: /

# BEGIN XML-SITEMAP-PLUGIN
Sitemap: http://www.vietseo.net/sitemaps.xml.gz
# END XML-SITEMAP-PLUGIN</description>
		<content:encoded><![CDATA[<p>Anh có thể giải thích về file robot.txt của vietseo đựơc không ạ ?<br />
Khúc đầu em đọc bài này thì em có thể hiểu, còn khúc sau thì không hiểu ý nghĩa là gì<br />
# Google Image<br />
User-agent: Googlebot-Image<br />
Disallow:<br />
Allow: /*</p>
<p># Google AdSense<br />
User-agent: Mediapartners-Google*<br />
Disallow:<br />
Allow: /*</p>
<p># Internet Archiver Wayback Machine<br />
User-agent: ia_archiver<br />
Disallow: /</p>
<p># digg mirror<br />
User-agent: duggmirror<br />
Disallow: /</p>
<p># BEGIN XML-SITEMAP-PLUGIN<br />
Sitemap: <a href="http://www.vietseo.net/sitemaps.xml.gz" rel="nofollow">http://www.vietseo.net/sitemaps.xml.gz</a><br />
# END XML-SITEMAP-PLUGIN</p>
]]></content:encoded>
	</item>
</channel>
</rss>
