Soubor sitemap.xml je podobný souboru robots.txt. Oba slouží ke komunikaci s roboty. Ti určují, jaké stránky vašeho webu se mají častěji indexovat a pomáhají aktualizovat obsah webu. Aby ale robot pracoval ve váš prospěch, musí vědět kde má vaši sitemapu hledat a jak ji nalézt.
Sitemap lze jednoduše přeložit jako „mapa stránky“. Je to soubor, ve kterém by se měly nacházet informace o obsahu, který chcete, aby byl ve vyhledávači k nalezení. Můžou to být vstupní stránky webu, ale také různé soubory, obrázky nebo videa.
Pomocí této „mapy“ se v moři obsahu internetového světa prodírají roboti vyhledávačů a snaží se nacházet relevantní stránky. Internetový vyhledávač se pomocí nich dokáže lépe vyznat na vašich stránkách a hledat takové, na které se dosud skrze interní prolinkování nedostal.
Nejčastěji má sitemap podobu .xml souboru, výjimečně se můžeme setkat i s .html či .php variantou. Soubor je uložen v kořenovém adresáři webu a slouží jako doplněk souboru robots.txt. Rozdíl mezi těmito soubory leží v tom, že zatímco robots.txt vylučuje některé stránky webu z vyhledávání, tak naopak sitemap.xml stránky do vyhledávače přidává.
Pokud jsou vaše stránky optimálně prolinkované, potom vyhledávačům v zásadě nemusí dělat problém váš web nalézt. Správné prolinkování znamená, že všechny stránky vašeho webu, kterým přikládáte prioritu, jsou dosažitelné skrze příslušnou navigaci – např. menu, nebo linky umístěné na úvodní stránce. Vyhledávače skrze tyto prolinkované odkazy prochází a skrze ně nachází stále nové stránky.
V případě, že provozujete nový web, nemá historii zpětných odkazů, stoprocentní prolinkovanost, ani na něj nevedou externí linky z cizích webů, je správná chvíle začít se sitemapou pracovat. Pomocí sitemap.xml přiřazujete prioritu vstupním stránkám a říkáte tak robotům, co mají procházet. Robot si stránky ze sitemapy zařadí do indexu a začne zobrazovat ve výsledcích vyhledávání. Šance, že vyhledávač vámi specifikované důležité vstupní stránky projde a zaindexuje se výrazně zvyšuje.
Provozujete-li již zajetý, velký web s mnoha stránkami, ale stále nemáte dost dobře řešené prolinkování, je pro vás sitemap.xml také důležitý. Budete-li do něj dynamicky přidávat nové vstupní stránky, zajistíte tak, že je robot při orientaci webem nepřehlédne.
Pokud používáte pro správu vašeho webu redakční systém (CMS), bude pro vás vytvoření sitemapy hračka. V případě, že si web řešíte sami, budete muset zvolit crawlera, který vám sitemapu vygeneruje na základě vašich vstupních stránek.
Po vytvoření sitemapy je potřeba soubor v .xml formátu odeslat do příslušného vyhledávače, aby ho jeho robot co nejdříve objevil.
Sitemapa nemusí obsahovat pouze odkazy na vstupní stránky, ale můžete ji využít k poskytování informací o specifickém obsahu na vašem webu. Dobrou praxí je do sitemap.xml zahrnout informace o multimediálních souborech, jako jsou obrázky, videa nebo i zprávy.
Příklad zápisu adresy souboru sitemap.xml v souboru robots.txt
Sitemap: https://www.zonercloud.cz/sitemap.xml
UPOZORNĚNÍ: URL sitemapy v robots.txt musí být absolutní.
Příklad odkazu na komprimovaný soubor sitemap.gz v souboru robots.txt
Sitemap: https://www.yahoo.com/news/sitemaps/news-sitemap_index_US_en-US.xml.gz
Záznam o videu v souboru sitemap.xml může obsahovat specifikace o jeho délce, tematické kategorii nebo přístupnosti věku. V případě Google vyhledavače se tak video hravě zpřístupní do služby Videa Google.
Příklad sitemapy pro video
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″>
<url>
<loc>http://www.example.com/videa/vstupni_stranka_videa.html</loc>
<video:video>
<video:thumbnail_loc>http://www.example.com/miniatury/123.jpg</video:thumbnail_loc>
<video:title>Název ukázky videa</video:title>
<video:description>Popis ukázky videa</video:description>
<video:content_loc>
http://streamserver.example.com/video123.mp4</video:content_loc>
<video:player_loc>
http://www.example.com/videoplayer.php?video=123</video:player_loc>
<video:duration>600</video:duration>
<video:expiration_date>2021-11-05T19:20:30+08:00</video:expiration_date>
<video:rating>4.2</video:rating>
<video:view_count>12345</video:view_count>
<video:publication_date>2007-11-05T19:20:30+08:00</video:publication_date>
<video:family_friendly>yes</video:family_friendly>
<video:restriction relationship=”allow”>IE GB US CA</video:restriction>
<video:price currency=”EUR”>1.99</video:price>
<video:requires_subscription>yes</video:requires_subscription>
<video:uploader
info=”http://www.example.com/uzivatele/janzonera”>Jan Zonera
</video:uploader>
<video:live>no</video:live>
</video:video>
</url>
</urlset>
Záznam o obrázku může obsahovat jeho rozměry, typ, předmět toho, co na něm nalezneme a licenci obrázku. Přidat jej můžeme buď přímou cestou pomocí URL, nebo jednoduše vyhledávači v souboru sitemap.xml o obrázku sdělit všechny relevantní doplňkové informace.
Příklad sitemapy pro obrázek
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″>
<url>
<loc>http://example.com/ukazka.html</loc>
<image:image>
<image:loc>http://example.com/obrazek.jpg</image:loc>
</image:image>
<image:image>
<image:loc>http://example.com/fotka.jpg</image:loc>
</image:image>
</url>
</urlset>
Záznam o zprávách v sitemapě může obsahovat např. nadpis článku a datum vydání.
Příklad sitemapy pro zprávy
<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″>
<url>
<loc>http://www.example.org/business/article55.html</loc>
<news:news> <news:publication> <news:name>The Example Times</news:name> <news:language>en</news:language> </news:publication> <news:genres>PressRelease, Blog</news:genres> <news:publication_date>2008-12-23</news:publication_date> <news:title>Companies A, B in Merger Talks</news:title> <news:keywords>business, merger, acquisition, A, B</news:keywords> <news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers> </news:news>
</url>
</urlset>
Další informace o formátu souboru sitemap.xml naleznete na stránkách sitemaps.org.
Ještě předtím než sitemap soubor přidáte do vyhledávače, je vhodné si jej nejprve otestovat, zdali neobsahuje nějaké chyby. K tomuto účelu doporučujeme např. tento nástroj.
Následně ho můžete přidat do vyhledávače pomocí následujících tools:
Google: https://www.google.com/webmasters/tools/sitemap-list
Bing: https://www.bing.com/toolbox/webmaster
Vyhledávač můžete o svém sitepamu informovat také tak, že cestu k souboru zadáte pomocí souboru robots.txt.
Sitemap: https://zonercloud.cz/sitemap.xml
Poslední možností je využití funkce ping a odeslat požadavek jako http GET: https://www.google.com/ping?sitemap=https://zonercloud.cz/sitemap.xml
Máte-li potíže s indexací stránek na vašem webu, jsou-li neaktuální a vyhledávače mají problém s jejich nalezením, měli byste se věnovat sitemap.xml souboru. V něm můžete vyhledávači poskytnout podstatné informace, které dopomohou k tomu, aby lépe procházel a hodnotil vaše stránky a tím vám polepšil ve výsledcích vyhledávání.