Robots.txt test aracı
Bir alan adı girin; biz onun robots.txt dosyasını getirir, her kural grubunu ayrıştırır ve seçtiğiniz bir tarayıcı için belirli bir yola izin verilip verilmediğini test etmenize olanak tanırız. Eşleştiricimiz, eski kütüphanelerin gevşek varsayılanını değil, Google'ın gerçek en uzun eşleşme mantığını izler.
Robots.txt test aracı nasıl çalışır
robots.txt, bir sitenin kök dizininde bulunan ve tarayıcılara hangi yolları isteyebileceklerini veya isteyemeyeceklerini bildiren düz bir metin dosyasıdır. Her grup, bir veya daha fazla User-agent satırıyla başlar ve ardından Allow ve Disallow kuralları gelir. Bu araç dosyayı indirir, her grubu ayrıştırır ve yolunuzu tam olarak gerçek bir tarayıcının yapacağı şekilde değerlendirir.
Çoğu test aracının yanlış yaptığı en önemli ayrıntı önceliktir. Google ilk eşleşen kuralı kullanmaz; en spesifik olanı kullanır, yani en uzun eşleşen yol kalıbı kazanır ve bir Allow ile bir Disallow aynı uzunlukta olduğunda Allow kazanır. Eşleştiricimiz bunu, * joker karakterini ve $ URL sonu çapasını uygular, böylece sonuç Googlebot ile eşleşir.
robots.txt içinde bir URL'yi engellemek yalnızca taramayı durdurur, dizine eklemeyi değil. Engellenen bir sayfa, başka sayfalar ona bağlantı verirse yine de arama sonuçlarında parça olmadan görünebilir. Bir sayfayı dizinin dışında tutmak için taramaya izin verin ve bunun yerine bir noindex meta etiketi veya başlığı kullanın.
Yaygın robots.txt hataları
- Disallow: / tüm siteyi engeller - bir hazırlık (staging) dağıtımı canlıya geçtiğinde sık karşılaşılan bir kazadır.
- CSS veya JS klasörlerini engellemek, Google'ın sayfayı doğru şekilde oluşturmasını engeller.
- Bir sayfayı aramadan gizlemek için robots.txt kullanmak - bunun yerine noindex kullanın, çünkü engellenen sayfalar yine de dizine eklenebilir.
- Dosyayı alan adı kökü dışında bir yere koymak - /robots.txt konumunda olmalıdır.
Sıkça sorulan sorular
Bu robots.txt test aracı ücretsiz mi?
Evet, tamamen ücretsiz ve hesaba gerek yok. Bir alan adı ile isteğe bağlı bir yol ve tarayıcı girin; ayrıştırılmış kuralları ve anında izin verildi veya engellendi sonucunu alırsınız.
Googlebot'un robots.txt'yi okuma şekliyle eşleşiyor mu?
Evet. Google'ın en uzun eşleşme önceliğini, * joker karakterini ve $ çapasını uyguluyoruz; en spesifik kural kazanır ve Allow eşitlikleri çözer. Birçok kütüphane ilk eşleşmeyi kullanır ve yanlış cevap verir.
robots.txt içinde bir URL'yi engellemek onu Google'dan kaldırır mı?
Hayır. robots.txt yalnızca taramayı kontrol eder. İzin verilmeyen bir URL, başka bir yerden bağlantı veriliyorsa yine de parça olmadan dizine eklenebilir. Bir sayfayı dizinden kaldırmak için bir noindex etiketi veya başlığı kullanın.
robots.txt nerede bulunmalıdır?
Ana makinenin kökünde, HTTPS üzerinden /robots.txt konumunda. Bir alt klasördeki robots.txt yok sayılır. Her alt alan adının kendi dosyasına ihtiyacı vardır.
Yalnızca robots.txt'den fazlasını izleyin
robots.txt, sağlıklı bir sitenin yalnızca bir parçasıdır. ePulz.io, çalışma süresini, SSL'i, DNS'i ve alan adı sona ermesini günün her saati izler ve bir şey bozulduğunda saniyeler içinde sizi uyarır.
Ücretsiz izlemeye başlaBu araç hakkında
Robots.txt test aracı, ePulz.io'nun birkaç ücretsiz ağ ve SEO aracından biridir. Herhangi bir sitenin robots.txt dosyasını getirir ve ayrıştırır ve Google'ın gerçek eşleştirme kurallarını kullanarak tarama iznini değerlendirir.