Robots.txt tesztelő
Adjon meg egy domaint, mi pedig letöltjük a robots.txt fájlját, elemezzük az összes szabálycsoportot, és lehetővé tesszük, hogy tesztelje, egy adott útvonal engedélyezett-e a kiválasztott keresőrobot számára. Az illesztőnk a Google valódi leghosszabb egyezés logikáját követi, nem a régebbi könyvtárak laza alapértelmezését.
Hogyan működik a robots.txt tesztelő
A robots.txt egy egyszerű szöveges fájl a webhely gyökerében, amely megmondja a keresőrobotoknak, mely útvonalakat kérhetik le és melyeket nem. Minden csoport egy vagy több User-agent sorral kezdődik, amelyeket Allow és Disallow szabályok követnek. Ez az eszköz letölti a fájlt, elemzi az összes csoportot, és pontosan úgy értékeli ki az útvonalát, ahogy egy valódi keresőrobot tenné.
A legtöbb tesztelő a precedenciát rontja el. A Google nem az első egyező szabályt használja, hanem a legpontosabbat, ami azt jelenti, hogy a leghosszabb egyező útvonalminta nyer, és az Allow nyer, ha egy Allow és egy Disallow azonos hosszúságú. Az illesztőnk ezt valósítja meg, plusz a * helyettesítő karaktert és a $ URL-végi horgonyt, így a verdikt megegyezik a Googlebottal.
Egy URL robots.txt-ben való tiltása csak a bejárást állítja le, az indexelést nem. Egy tiltott oldal továbbra is megjelenhet a keresési találatok között részlet nélkül, ha más oldalak hivatkoznak rá. Ahhoz, hogy egy oldal kimaradjon az indexből, engedélyezze a bejárást, és helyette használjon noindex meta címkét vagy fejlécet.
Gyakori robots.txt hibák
- A Disallow: / blokkolja az egész webhelyet - gyakori baleset, miután egy teszt környezet (staging) telepítése élesbe kerül.
- CSS vagy JS mappák blokkolása, ami megakadályozza, hogy a Google helyesen jelenítse meg az oldalt.
- A robots.txt használata egy oldal keresésből való elrejtésére - helyette használjon noindexet, mivel a tiltott oldalak továbbra is indexelhetők.
- A fájl elhelyezése a domain gyökerén kívül bárhol máshol - a /robots.txt helyen kell lennie.
Gyakran ismételt kérdések
Ingyenes ez a robots.txt tesztelő?
Igen, teljesen ingyenes, és nincs szükség fiókra. Adjon meg egy domaint, valamint opcionálisan egy útvonalat és keresőrobotot, és azonnal megkapja az elemzett szabályokat, plusz egy engedélyezett vagy tiltott verdiktet.
Megegyezik azzal, ahogy a Googlebot olvassa a robots.txt fájlt?
Igen. A Google leghosszabb egyezés precedenciáját, a * helyettesítő karaktert és a $ horgonyt valósítjuk meg, ahol a legpontosabb szabály nyer, és az Allow dönti el a holtversenyt. Sok könyvtár első egyezést használ, és rossz választ ad.
Egy URL robots.txt-ben való tiltása eltávolítja azt a Google-ből?
Nem. A robots.txt csak a bejárást szabályozza. Egy tiltott URL továbbra is indexelhető részlet nélkül, ha máshonnan hivatkoznak rá. Használjon noindex címkét vagy fejlécet egy oldal indexből való eltávolításához.
Hol kell elhelyezni a robots.txt fájlt?
A host gyökerében, a /robots.txt helyen, HTTPS-en keresztül. Az almappában lévő robots.txt figyelmen kívül marad. Minden aldomainnek saját fájlra van szüksége.
Figyeljen többet, mint csak a robots.txt fájlt
A robots.txt csak egy darabja egy egészséges webhelynek. Az ePulz.io éjjel-nappal figyeli az elérhetőséget, az SSL-t, a DNS-t és a domain lejáratát, és másodperceken belül riaszt, ha valami elromlik.
Kezdje el a figyelést ingyenErről az eszközről
A robots.txt tesztelő az ePulz.io számos ingyenes hálózati és SEO eszközének egyike. Letölti és elemzi bármely webhely robots.txt fájlját, és a Google valódi illesztési szabályaival értékeli ki a bejárási engedélyt.