Vì sao bạn cần phải chặn Google Index website ?
Lí do 1: Website đang xây dựng chưa hoàn thành, do vậy chủ website chưa muốn Google index
Lí do 2: Chặn một số trang không cần thiết ví dụ như chặn index category, chặn index các thẻ tag, …
Lí do 3: Chặn các trang subpages, trùng lặp nội dung
Hướng Dẫn chặn Google Index nhanh nhất
Cách 1 : Sử dụng file robots.txt
Tạo một file với tên robots.txt và đặt trong thư mục gốc trên hosting. Sau đó, cho đoạn sau vào trong file:
User-agent: googlebot
Disallow: /directory1/
Disallow: /directory2/
Allow: /directory2/subdirectory1/
Trong đó Disallow là những link/ path mà bạn muốn chặn và Allow là cho phép.
Cách 2: Sử dụng thẻ noindex
Để chặn không cho trình thu thập dữ liệu web của công cụ tìm kiếm(như Google , Bing, Yahoo…) lập chỉ mục một trang trên trang web của bạn, ta có thể chặn bằng cách đặt thẻ sau vào phần <head> thuộc trang của bạn:
<meta name=”robots” content=”noindex, follow”>
Hãy yên tâm là nó chỉ có tác dụng chặn lập chỉ mục (noindex
) mà thôi, còn bots tìm kiếm vẫn có thể truy cập các trang này hoàn toàn bình thường (follow
).
Nhưng một vài công cụ tìm kiếm sẽ ko sử dụng thẻ meta này nên có thể trang bạn sẽ xuất hiện trên công cụ đó.
Cách 3 Chặn Index trên bằng Plugin/ Module
3.1. Đối với WordPress
Thêm đoạn code dưới vào file functions.php của theme hoặc plugin trong trường hợp bạn không dùng plugin.
add_action('wp_head', 'robot_meta_subpage_fix', 1);
function robot_meta_subpage_fix() {
if(is_paged()) {
echo "<meta name='robots' content='noindex, follow'/>", "\n";
}
}
Nếu bạn sử dụng plugin Yoast SEO , bạn có thể sử dụng tính năng có sẵn. Nếu ko muốn index bài viết nào bạn chỉ cần kéo xuống phần cuối bài viết chọn Advanced => Chọn phần “Allow search engines to show this Post in search results?” => Chọn là “No”.