03.12.2011, 08:08:55
Pro dobré pochopní SEO musíme znát architekturu vyhledávačů a jak takový vyhledávač funguje. Všechny vyhledávače obsahují tyto hlavní prvky:
Spider – program, který se tváří jako webový prohlížeč a umí stáhnout webové stránky.
Crawler – program, který automaticky sleduje všechny odkazy na každé webové stránce.
Indexer – program, který analyzuje webové stránky stažené Spiderem a Crawlerem.
Databáze – uložiště pro stažené a zpracované stránky.
Výsledky – výpis výsledků hledání z databáze.
Webový server – který je zodpovědný za interakci mezi uživatelem a vyhledávačem.
Konkrétní implementace vyhledávacích algoritmů se mohou lišit a také se liší. Například často funguje jako jeden celek Spider + Crawler + Indexer, který stáhne webové stránky, analyzuje je, zaindexuje je a pak toho využívá k nalezení nových zdrojů. Nicméně uvedené komponenty sou vlastní všem vyhledávačům a na principu SEO to nemá vliv.
Spider. Tento program ke stažení webových stránek funguje jako webový prohlížeč. Rozdíl je v tom, že prohlížeč zobrazuje informace uživatelům většinou v grafické podobě, zatímco Spider žádné vizuální zobrazení nemá, pracuje přímo s HTML kódem stránky.
Crawler. Tento program najde všechny odkazy na každé stránce. Úkolem je zjistit, kde jsou jaké odkazy a kam tyto odkazy vedou. Cílem programu je, aby našel nové odkazy a tím i nové dokumenty, které ještě nejsou pro vyhledávači známé.
Indexer. Program analyzuje jednotlivé stránky a potom taky analyzuje jednotlivé prvky stránek, jako je text, záhlaví, zápatí, struktura stránky, stylistické rysy, speciální HTML tagy apod.
Databáze. Jedná se o prostor pro ukládání dat, ať se jedná o stažené stránky nebo o analýzy těchto stránek. Někdy se databáze nazývá indexem vyhledávače.
Výsledky. Jsou výpisem výsledků vyhledávání na základě uživatelova dotazu a požadavku. Určuje se zde v jakém pořadí se výsledky zobrazí na stránce. To vše se prování na základě vnitřních algoritmů vyhledávače včetně hodnocení page ranku.
Webový server. Vyhledávač obvykle obsahuje HTML stránku s vstupním polem, kde si uživatel může zadat vyhledávací dotaz a webový server takový dotaz zpracuje a je zodpovědný za korektní zobrazení výsledků hledání uživateli ve formě HTML stránky.