Ataxo / Informácie / Vyhľadávače a katalógy / Vyhľadávače
Vyhľadávače
Roboti a crawler alebo ako fungujú fulltextové vyhľadávače
Vyhľadávače predstavujú sofistikovaný spôsob, ako v obrovskom množstve webových stránok na internete nájsť to, čo potrebujeme. Pretože sa informácie, ktoré nás zaujímajú, nachádzajú predovšetkým v texte webových stránok, prechádzajú vyhľadávače celý ich text, nie len URL alebo titulky. Vyhľadávačom sa preto presnejšie hovorí fulltextové vyhľadávače.
Ak zadáte vyhľadávaču dotaz, fulltextový vyhľadávač v skutočnosti nehľadá daný výraz na internete, ale iba v databáze stránok na svojom serveri. Program fulltextového vyhľadávača (ktorému sa tiež hovorí indexovací robot) totiž funguje nasledovne: prechádza internet a pomocou odkazov sa dostáva na ďalšie a ďalšie stránky a ich náhľady si ukladá do svojej databázy. Robot sa po webe pohybuje ako po veľkej pavučine, lezie po jej vláknach, odkazoch, ktoré spájajú jednotlivé webové stránky medzi sebou. Preto sa pre označenie robota fulltextových vyhľadávačov používa aj výraz spider (spider - pavúk) alebo crawler (crawl - liezť).
Indexácia prebieha tak, že robot vyhľadávača prechádza zdrojový html kód stránky. Keď v ňom nájde odkaz na ďalšiu stránku, preskočí na ňu a v indexácii pokračuje tam.
Do fulltextových vyhľadávačov je možné stránky registrovať aj manuálne, väčšinou sú ale preferované (lepšie sa umiestňujú vo výsledkoch vyhľadávania) tie stránky, ktoré vyhľadávač našiel sám, prirodzenou cestou, tzn. pomocou odkazu z iného webu.
Robot pri indexácii zdrojový kód stránky spracováva a ukladá do databázy na serveri vyhľadávača. To je databáza, v ktorej potom ako užívatelia hľadáme. Hľadanie teda neprebieha v reálnom čase na internete, ale na serveri vyhľadávača, ktorý nám potom ako odpoveď na náš dotaz odošle do prehliadača výsledok tohto hľadania. Len tak je možné, aby sme výsledok hľadania dostali takmer okamžite po zadaní dotazu.
Vyhľadávací robot si pamätá, na ktorých stránkach už bol, a jeho program určuje, kedy sa na stránku opäť vráti, aby zaindexoval prípadné zmeny. Správanie robotov je plne automatické a nemožno ich takmer nijako ovplyvniť, napr. robotovi prikázať, ako často má našu stránku navštevovať. Robotom je možné iba zakázať indexovanie stránok, pri ktorých nechceme, aby sa objavovali vo výsledkoch vyhľadávania.
Chcete, aby si fulltextový vyhľadávač vašich stránok všimol?
Získajte spätné odkazy z iných webov! Množstvo odkazov z iných stránok má vplyv nielen na to, ako rýchlo robot Vaše stránky nájde. Počet a kvalita odkazov, ktoré vedú na Vaše stránky, predovšetkým ovplyvňuje ich hodnotenia a teda aj umiestnenie vo výsledkoch vyhľadávania a SEO.
Ako fulltextové vyhľadávače radia výsledky
Nikto, okrem samotných programátorov, nepozná presný princíp (algoritmus) podľa ktorého sú výsledky vyhľadávania vo fulltexte radené. Každá fulltextová technológia navyše používa na radenie výsledkov algoritmus úplne odlišný.
Je ale známe, že vyhľadávače posudzujú relevantnosť stránky k dotazu, ktorý užívateľ zadal, podľa týchto dvoch základných kritérií:
- On-page faktory - hustota výskytu hľadaného kľúčového slova alebo slovného spojenia (frázy) v texte stránky a vnútri dôležitých HTML tagov.
- Off-page faktory - predovšetkým počet odkazov smerujúcich na stránku z iných stránok.
Pre úspech stránok je kľúčové dosiahnuť čo najlepšieho hodnotenia podľa týchto kritérií. Stránky je možné upravovať tak, aby sa zlepšilo ich hodnotenie a zobrazovali sa tak na popredných miestach výsledkov vyhľadávania kľúčových slov. To je podstata optimalizácie pre vyhľadávače alebo SEO (Search Engine Optimization).
Slovenský a svetový fulltext
Medzi najvýznamnejšie a najväčšie zahraničné fulltextové vyhľadávacie technológie patrí Google.com, Yahoo! a MSN.com.
Relevantné zdroje informácií
Článok vyhľadávače - ako približne fungujú na weblogu Ako písať web







