Martin Matějů

Programátor a specialista na Wordpress

Zásady pro vyhledávače

03.12.2011, 08:08:55

Pro dobré pochopní SEO musíme znát architekturu vyhledávačů a jak takový vyhledávač funguje. Všechny vyhledávače obsahují tyto hlavní prvky:

Spider – program, který se tváří jako webový prohlížeč a umí stáhnout webové stránky.

Crawler – program, který automaticky sleduje všechny odkazy na každé webové stránce.

Indexer – program, který analyzuje webové stránky stažené Spiderem a Crawlerem.

Databáze – uložiště pro stažené a zpracované stránky.

Výsledky – výpis výsledků hledání z databáze.

Webový server – který je zodpovědný za interakci mezi uživatelem a vyhledávačem.

Konkrétní implementace vyhledávacích algoritmů se mohou lišit a také se liší. Například často funguje jako jeden celek Spider + Crawler + Indexer, který stáhne webové stránky, analyzuje je, zaindexuje je a pak toho využívá k nalezení nových zdrojů. Nicméně uvedené komponenty sou vlastní všem vyhledávačům a na principu SEO to nemá vliv.

Spider. Tento program ke stažení webových stránek funguje jako webový prohlížeč. Rozdíl je v tom, že prohlížeč zobrazuje informace uživatelům většinou v grafické podobě, zatímco Spider žádné vizuální zobrazení nemá, pracuje přímo s HTML kódem stránky.

Crawler. Tento program najde všechny odkazy na každé stránce. Úkolem je zjistit, kde jsou jaké odkazy a kam tyto odkazy vedou. Cílem programu je, aby našel nové odkazy a tím i nové dokumenty, které ještě nejsou pro vyhledávači známé.

Indexer. Program analyzuje jednotlivé stránky a potom taky analyzuje jednotlivé prvky stránek, jako je text, záhlaví, zápatí, struktura stránky, stylistické rysy, speciální HTML tagy apod.

Databáze. Jedná se o prostor pro ukládání dat, ať se jedná o stažené stránky nebo o analýzy těchto stránek. Někdy se databáze nazývá indexem vyhledávače.

Výsledky. Jsou výpisem výsledků vyhledávání na základě uživatelova dotazu a požadavku. Určuje se zde v jakém pořadí se výsledky zobrazí na stránce. To vše se prování na základě vnitřních algoritmů vyhledávače včetně hodnocení page ranku.

Webový server. Vyhledávač obvykle obsahuje HTML stránku s vstupním polem, kde si uživatel může zadat vyhledávací dotaz a webový server takový dotaz zpracuje a je zodpovědný za korektní zobrazení výsledků hledání uživateli ve formě HTML stránky.