Robots.txt tesztelő

Adjon meg egy domaint, mi pedig letöltjük a robots.txt fájlját, elemezzük az összes szabálycsoportot, és lehetővé tesszük, hogy tesztelje, egy adott útvonal engedélyezett-e a kiválasztott keresőrobot számára. Az illesztőnk a Google valódi leghosszabb egyezés logikáját követi, nem a régebbi könyvtárak laza alapértelmezését.

Adjon meg egy domaint, például example.com. Mindig a https://example.com/robots.txt fájlt töltjük le.

Hogyan működik a robots.txt tesztelő

A robots.txt egy egyszerű szöveges fájl a webhely gyökerében, amely megmondja a keresőrobotoknak, mely útvonalakat kérhetik le és melyeket nem. Minden csoport egy vagy több User-agent sorral kezdődik, amelyeket Allow és Disallow szabályok követnek. Ez az eszköz letölti a fájlt, elemzi az összes csoportot, és pontosan úgy értékeli ki az útvonalát, ahogy egy valódi keresőrobot tenné.

A legtöbb tesztelő a precedenciát rontja el. A Google nem az első egyező szabályt használja, hanem a legpontosabbat, ami azt jelenti, hogy a leghosszabb egyező útvonalminta nyer, és az Allow nyer, ha egy Allow és egy Disallow azonos hosszúságú. Az illesztőnk ezt valósítja meg, plusz a * helyettesítő karaktert és a $ URL-végi horgonyt, így a verdikt megegyezik a Googlebottal.

Egy URL robots.txt-ben való tiltása csak a bejárást állítja le, az indexelést nem. Egy tiltott oldal továbbra is megjelenhet a keresési találatok között részlet nélkül, ha más oldalak hivatkoznak rá. Ahhoz, hogy egy oldal kimaradjon az indexből, engedélyezze a bejárást, és helyette használjon noindex meta címkét vagy fejlécet.

Gyakori robots.txt hibák

Gyakran ismételt kérdések

Ingyenes ez a robots.txt tesztelő?

Igen, teljesen ingyenes, és nincs szükség fiókra. Adjon meg egy domaint, valamint opcionálisan egy útvonalat és keresőrobotot, és azonnal megkapja az elemzett szabályokat, plusz egy engedélyezett vagy tiltott verdiktet.

Megegyezik azzal, ahogy a Googlebot olvassa a robots.txt fájlt?

Igen. A Google leghosszabb egyezés precedenciáját, a * helyettesítő karaktert és a $ horgonyt valósítjuk meg, ahol a legpontosabb szabály nyer, és az Allow dönti el a holtversenyt. Sok könyvtár első egyezést használ, és rossz választ ad.

Egy URL robots.txt-ben való tiltása eltávolítja azt a Google-ből?

Nem. A robots.txt csak a bejárást szabályozza. Egy tiltott URL továbbra is indexelhető részlet nélkül, ha máshonnan hivatkoznak rá. Használjon noindex címkét vagy fejlécet egy oldal indexből való eltávolításához.

Hol kell elhelyezni a robots.txt fájlt?

A host gyökerében, a /robots.txt helyen, HTTPS-en keresztül. Az almappában lévő robots.txt figyelmen kívül marad. Minden aldomainnek saját fájlra van szüksége.

Figyeljen többet, mint csak a robots.txt fájlt

A robots.txt csak egy darabja egy egészséges webhelynek. Az ePulz.io éjjel-nappal figyeli az elérhetőséget, az SSL-t, a DNS-t és a domain lejáratát, és másodperceken belül riaszt, ha valami elromlik.

Kezdje el a figyelést ingyen

Erről az eszközről

A robots.txt tesztelő az ePulz.io számos ingyenes hálózati és SEO eszközének egyike. Letölti és elemzi bármely webhely robots.txt fájlját, és a Google valódi illesztési szabályaival értékeli ki a bejárási engedélyt.