Domů / Blog / Pojmy

Robots.txt: Co je soubor robots txt a jak ho nastavit

Robots.txt je soubor, který říká vyhledávacím robotům, které části webu smí procházet. Kompletní průvodce syntaxí, direktivami a nejčastějšími chybami.

Jan Pospisil
3 min čtení
Technické SEOSEO
Souhrn článku
  • Robots.txt řídí přístup crawlerů k webu pomocí direktiv User-agent, Disallow a Allow, ale jde pouze o doporučení, které škodliví boti mohou ignorovat.
  • Zablokování stránky v robots.txt nezabrání její indexaci — pokud na ni vedou zpětné odkazy, Google ji může indexovat i bez procházení.
  • Pro skutečné vyloučení z indexu je nutný noindex meta tag.

Robots.txt je jednoduchý textový soubor umístěný v kořenovém adresáři webu (example.com/robots.txt), který obsahuje instrukce pro vyhledávací roboty (crawlery). Definuje, které části webu smí robot procházet a které ne. Jde o jeden ze základních prvků technického SEO.

Syntaxe a direktivy

Soubor robots.txt používá jednoduchou syntaxi s několika klíčovými direktivami:

DirektivaFunkcePříklad
User-agentUrčuje, pro jakého robota pravidla platíUser-agent: Googlebot
DisallowBlokuje přístup k cestěDisallow: /admin/
AllowPovoluje přístup k cestě (přepisuje Disallow)Allow: /admin/public/
SitemapOdkazuje na XML sitemapSitemap: https://example.com/sitemap.xml
Crawl-delayNastavuje prodlevu mezi požadavky (ne Google)Crawl-delay: 10
* (wildcard)Platí pro všechny roboty / cestyUser-agent: *

Robots.txt je pouze doporučení, nikoli bezpečnostní opatření. Seriózní vyhledávače (Google, Bing) jej respektují, ale škodliví boti ho mohou ignorovat. Pro skutečné zabezpečení obsahu použijte autentizaci nebo server-side blokování.

Nejčastější chyby v robots.txt

  • Blokace důležitého obsahu — nechtěné zablokování CSS, JS nebo obrázků, které Google potřebuje k vykreslení stránky
  • Blokace celého webuDisallow: / pro všechny roboty znemožní indexaci
  • Chybné umístění — soubor musí být v kořenovém adresáři domény, ne v podsložce
  • Záměna s noindex — robots.txt neodstraní stránku z indexu, pouze zabrání jejímu procházení
  • Chybějící Sitemap direktiva — vynechání odkazu na XML sitemap

Jak Google interpretuje robots txt

Google respektuje direktivy User-agent, Disallow a Allow. Nepodporuje Crawl-delay — rychlost procházení nastavíte v Google Search Console. Důležité je, že blokace stránky v robots.txt nezabrání její indexaci — pokud na ni vedou zpětné odkazy, Google ji může indexovat i bez procházení. Pro vyloučení z indexu použijte noindex meta tag.

Testovat soubor robots.txt můžete přímo v Google Search Console pomocí nástroje pro testování robots.txt.

Často kladené otázky

Musí mít každý web soubor robots.txt?

Není to povinné, ale je to doporučené. Bez robots.txt vyhledávače předpokládají, že mohou procházet celý web. Soubor je užitečný pro řízení crawlování a odkazování na XML sitemap.

Odstraní Disallow stránku z výsledků vyhledávání?

Ne. Disallow zabrání procházení, ale stránka může zůstat v indexu, pokud na ni vedou zpětné odkazy. Pro odstranění z indexu použijte noindex meta tag nebo nástroj pro odstranění URL v Google Search Console.

Jak rychle Google zareaguje na změny v robots.txt?

Google cachuje robots.txt a aktualizuje ho obvykle jednou za 24 hodin. Změny se tedy neprojeví okamžitě. V urgentních případech můžete vynutit opětovné načtení prostřednictvím Google Search Console.

Chcete podobné výsledky?

Pomůžu vám s online marketingem a SEO. Ozvěte se mi a probereme to.

Nezávazná konzultace

Podobné články

SEO copywriting a tvorba optimalizovaných textů

SEO copywriting: Texty pro vyhledávače i lidi

Co je SEO copywriting a jak psát texty, které se umístí ve vyhledávačích? Průvodce optimalizací obsahu, nástroji a cenami..

Přečíst →
SEO kurzy

SEO kurzy: Kde se naučit SEO v Česku

Přehled SEO kurzů v Česku.

Přečíst →
SEO on-page optimalizace

SEO on-page: Průvodce on-page optimalizací

Kompletní průvodce on-page SEO.

Přečíst →

Související pojmy

Co je CRM

CRM systém centralizuje data o zákaznících a zefektivňuje prodej i marketing.

Direct marketing

Co je direct marketing? Přehled kanálů přímého marketingu -- e-mail, SMS, direct mail.

Event marketing

Co je event marketing a jak využít události pro růst značky? Přehled typů eventů, plánování, propagace a měření úspěšnosti..

Guerilla marketing

Co je guerilla marketing a jak funguje? Přehled typů, příkladů, výhod a rizik nekonvenčních marketingových taktik..

← Všechny pojmy