Thảo luận Webmaster sau phỏng vấn Matt Cutts về trùng lặp nội dung
- Nội dung tranh luận Webmaster.
- Chỉ mục bổ sung (supplemental index).
- Các trang Web chứa Flash.
- Đường liên kết từ mạng xã hội.
- Các trang Web DoorWay và sitemap.
- Những trang Web nhồi nhét đầy từ khóa.
- Xu hướng phát triển công cụ tìm kiếm với nhiều tác vụ của con người hơn.
- Lỗi trong thẻ “Nofollow”.
- Mua bán liên kết để phạt đối thủ.
- Thẻ robot =”nocontent” của Yahoo.
- Giới hạn 100 liên kết trong một trang
- Liệu trong bảng quản trị Webmaster Tools sẽ có những giải thích về việc phạt PageRank không ?
- Nhận định của vietSEO
Sau cuộc phỏng vấn Matt Cutts về trùng lặp nội dung kéo dài khoảng nửa tiếng đồng hồ, rất nhiều ý kiến đã được nêu ra cùng nhiều tranh luận, tất cả đều đáng được tổng hợp.
Thay vì dịch 12 trang tranh luận, tôi sẽ tổng hợp và tóm lại lại các ý kiến cùng với câu trả lời của Matt Cutts
Nội dung tranh luận Webmaster.
Chỉ mục bổ sung (supplemental index).
Google không tiết hộ nhiều hơn bởi vì nó không cần thiết. Trước đó kết quả tìm kiếm với chỉ mục bổ sung trên trang kết quả tìm kiếm (SERP : search engine results page ) chỉ xuất hiện với những cú pháp tìm kiếm phức tạp thông qua thuật toán của Google. Nhưng nay, những kết quả bổ sung trở nên tự động sau mỗi lệnh tìm kiếm.
Các trang Web chứa Flash.
Google không thể chuyển các file Flash thành dạng Text. Ngược lại, công cụ SDK của Macromedia Adobe, chúng ta của thể tạo text cho công cụ tìm kiếm. Google đang cố gắng phát triển theo hướng này.
Đường liên kết từ mạng xã hội.
Sau khi được hỏi, liệu các liên kết từ các mạng xã hội, ngày càng dễ dàng có hơn, sẽ được tính toán khác đi trong thuật toán của Google. Matt Cutts đã khẳng định rằng đối với Google, liên kết nào thì bản chất vẫn là liên kết. Nên những liên kết đến từ các mạng xã hội sẽ không bị đánh giá nhẹ hơn các liên kết khác.
Ngoài ra, nhưng đường liên kết đến từ các tên miên .edu hay .gov cũng không được đánh giá cao hơn các liên kết khác. Chỉ việc xem số lượng các trang Web với từ khóa Viagra có tên miến .edu là đủ hiểu. Đúng là chất lượng các trang .edu và .gov thường tốt hơn các trang khác nhưng tốt hơn là có một đường liên kết tốt với tên miền .com hơn là một đường dẫn tồi từ tên miền .edu.
Các trang Web DoorWay và sitemap.
Câu hỏi : Theo Google chỉ định về trang Doorway1 (Phần Guidelines Webmaster), liệu một trang sitemap lập trình tồi có nguy cơ nào bị qui vào trang DoorWay không ?
Trả lời : Chúng tôi rất thận trọng với điều đó bởi có rất nhiều người xây dựng sitemap từ tất cả các đường dẫn URL trên trang Web của họ.
Những trang Web nhồi nhét đầy từ khóa.
Một trang chứ bốn hay năm từ khóa là chuyện bình thường, nhưng nhiều hơn thế thì thuật toán của chúng tôi sẽ giảm nhẹ “trọng lượng” của những từ khóa trên. Nếu có khoảng 15 từ khóa trong đường dẫn URL, thì có thể sẽ bị cảnh báo là spam và khi ai đi theo đường dẫn và xem xét thì nó rất có thể bị liệt kê vào spam.
Matt Cutts có khuyên là không nên thêm cả tấn từ khóa trong đường dẫn URL mà chỉ nên thêm các thông tin có ích cho người dùng.
Xu hướng phát triển công cụ tìm kiếm với nhiều tác vụ của con người hơn.
Về cơ bản, Google là tổ hợp của nhiều thuật toán, nó đã phát triển như vậy từ những ngày đầu tiên. Google vẫn sẽ giữ bản chất là như thế nhưng nhiều công đoạn con người hơn để xử lý những cảnh báo spammer.
Matt Cutts cho rằng những dự án như Wikia (giống với DMOZ) rất là thú vị. Google rất cởi mở với hướng phát triển xếp hạng theo đánh giá của con người. Đó là cách tuyệt vời để loại bỏ các trang site Spam.
Lỗi trong thẻ “Nofollow”.
Thể rel=”nofollow” cho phép Google không gán thứ hạng PageRank cho trang liên quan. Thế nhưng nhiều người đã nhận định thấy rằng những text miêu tả liên kết2 (anchor text) lại có được gán cho trang nói trên. Lỗi trên đã được sửa. Những đường dẫn với khóa nofollow sẽ không được google đánh chỉ số trên Web nữa.
Mua bán liên kết để phạt đối thủ.
Câu hỏi : Nhiều người nghĩ rằng việc họ mua liên kết tới trang của các đối thủ, rồi sao đó tố cáo đổi thủ cạnh tranh để họ bị Google phạt.
Trả lời : Tôi không nghĩ rằng những người cạnh tranh không ngoan lại cố làm chuyện đó. Rất nhiều khả năng họ sẽ bi thua thiệt nhiều hơn là hưởng lợi từ việc này.
Chúng tôi rất thận trọng trong kỹ thuật chống spam, trong việc một trang này có thể chơi xấu trang khác.
Thẻ robot =”nocontent” của Yahoo.
Cho đến hiện tại chỉ có khoảng 500 trang sử dụng thẻ này. Google không tin đến thẻ này trong điều kiện như bây giờ.
Giới hạn 100 liên kết trong một trang
Được khuyến cáo không nên vượt quá giới hạn này nhưng Google đánh chỉ số hàng mega một trang nên đó không phải là một giới hạn “cứng nhắc”. Nhưng mọi người nên tạo nhiều trang với ít liên kết hơn là một trang với hơn 100 liên kết.
Liệu trong bảng quản trị Webmaster Tools sẽ có những giải thích về việc phạt PageRank không ?
Tại sao lại không ? Nó đã có cho các trang Web bị phát hiện là có chứa spy. Những người đã từng có nhiều ý định không trung thực thì không thể cảnh báo mỗi lần anh ta đi quá giới hạn. Ngược lại những trang web chủ quản thì có nhiều khả năng được thông báo mỗi lần trang cua họ bị lây nhiễm .
Nhận định của vietSEO
- Trong phần liên kết từ các mạng xã hội, tôi đã có cơ hội thử nghiệm và thấy rằng Google tính đến những liên kết này, vì thế bạn hãy xây dựng cho mình một hệ thống liên kết tốt từ các mạng xã hội.
- Trong phần giới hạn từ khóa trong URL, quan sát thấy rất nhiều trang nhét rất nhiều từ khóa, nhiều hơn 4 hay 5 trong đường dẫn URL nhưng vẫn nhận được thứ hạng rất cao. Bản thân vietSEO cũng có khá nhiều từ khóa trong một URL. Phần này tôi không được thuyết phục cho lắm.
- Phần hướng phát triển công cụ tìm kiếm theo con người, tôi thấy đấy là một hướng mở hay. Tuy nhiên những chương trình như DMOZ sẽ tỏ rõ hạn chế về mặt thời hạn và công bằng. Tớ biết rằng rất nhiều trang bị từ chối nhưng không hề biết được lý do hay một câu trả lời nào. Những trang được xếp vào cũng chưa phải những trang tốt nhất. Biết rằng công việc của một editer khá nhiều và mang nhiều tính cảm tính.
- Trang Web được tạo ra với mục đích spam và chuyển hướng người dùng tới một trang khác. Bạn có thể tham khảo thêm tại đây [↩]
- Chính là nhóm từ nằm giữa hai thẻ <a> và </a> để miêu tả nội dung trang liên kết [↩]
Bài viết cùng chủ đề liên quan
- Phỏng vấn Matt Cutts về trùng lặp nội dung
Hội nghị PubCon Trong hội nghị PubCon (một diễn đàn lớn cho những chuyên gia về SEO) , Matt Cutts - sếp, nhân viên nổi tiếng của Google, chi... - Chỉ mục bổ sung và nội dung trùng lặp
Nhiều webmaster nghĩ rằng nội dung cuối cùng cũng chẳng có giá trị gì trong chỉ mục bổ sung (supplemental index) nhưng giảm số lượng trang trong chỉ mục...

March 13th, 2008 at 8:34 pm
[...] bài viết, trang đơn hay tag cũng như trang tìm kiếm. Plugins này cũng giúp tránh nội dung kép trên blog, quản lý trang lỗi 404. Khi có dịp mình sẽ quay trở lại bài viết về [...]
July 14th, 2008 at 6:14 am
[...] có quá nhiều site (Matt Cutts có lần nói rằng còn số này không được vượt quá 2000 sites) [...]
July 14th, 2008 at 6:54 am
[...] sẽ tìm cách chống lại việc mua bán liên kết và họ rất ưu tiên việc này. Matt Cutts, kỹ sư của Google cũng đã khẳng định rằng các thuật toán của Google đã rất [...]
July 15th, 2008 at 10:39 am
[...] Thảo luận Webmaster sau phỏng vấn Matt Cutts về trùng lặp nội dung : Thảo luận trên các diễn đàn Webmasters về trung nội dung, nhận định của vietSEO. [...]
July 20th, 2008 at 3:34 pm
[...] có quá nhiều site (Matt Cutts có lần nói rằng còn số này không được vượt quá 2000 sites) [...]