Robots.txt Nedir? Ne İşe Yarar?

Robots.txt Nedir? Ne İşe Yarar?

Robots.txt, bir web sitesinin kök dizininde bulunan ve arama motoru botlarına hangi sayfaları tarayıp hangilerini taramamaları gerektiğini bildiren basit bir metin dosyasıdır. Arama motorları bir siteye geldiğinde, genellikle ilk olarak robots.txt dosyasına bakar ve burada belirtilen kurallara göre hareket eder. Bu sistem, sitenin kontrolünü web yöneticisinin elinde tutmasına yardımcı olur.

Örnek Robots.txt Dosyası

Dosyada en sık kullanılan iki komut vardır: Disallow ve Allow.

  • Disallow, botlara belirli bir sayfa veya klasöre erişmemelerini söyler.
  • Allow ise, özellikle bazı gelişmiş botlar için, erişime izin verilen bölümleri belirtmekte kullanılır.
User-agent: *
Disallow: /admin/
Disallow: /taslak/
Allow: /taslaklar/hakkinda.html

Bu örnekte, tüm botlara (*) /admin/ ve /taslak/ klasörleri yasaklanmıştır. Ancak /taslaklar/ içindeki hakkinda.html sayfasının taranmasına izin verilmiştir.

Robots.txt dosyası, özellikle site içeriğinin arama motorlarında nasıl görüneceğini şekillendirmek için önemlidir. Ancak bu dosya sadece taramayı sınırlar, içeriklerin dizine eklenmesini tamamen engellemez. Sayfanın arama sonuçlarında hiç görünmemesi isteniyorsa, sayfa içinde <meta name="robots" content="noindex"> etiketi de kullanılmalıdır.

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir