Info mailom

Chcete pravidelne dostávať informácie o novinkách?

Návrh vyhľadávania na webových sídlach rešpektujúci odporúčania informačných architektov

Autor: Soňa Makulová
Číslo: 1/2007 - Interoperabilita
Rubrika: Krok za krokom
Kľúčové slová:

V minulom článku K niektorým problémom vyhľadávania na webových sídlach (Makulová 2006 c) sme bližšie charakterizovali dôležitý pilier informačnej architektúry vyhľadávania na webových sídlach. Zdôraznili sme nutnosť spolupráce medzi IT špecialistom a informačným architektom pri výbere vhodného vyhľadávacieho nástroja. V dnešnom príspevku si povieme niečo o možnosti monitorovania návštevnosti webového sídla, ktoré nám pomôže pri určení vyhľadávacích zón a odporúčaní informačných architektov pri návrhu systému vyhľadávania.

Úvod

Dobre navrhnutý systém vyhľadávania sa vráti predovšetkým v zvýšení návštevnosti webového sídla, ktorá úzko súvisí s jeho nájditeľnosťou. Nájditeľnosť webového sídla patrí k dôležitým kvalitatívnym atribútom, pretože veľké percento návštevníkov môže prichádzať na stránky z vyhľadávačov. Toto percento je závislé práve od kvality optimalizácie webového sídla pre vyhľadávače. Nájditeľnosť je o to dôležitejšia, že až 90 % používateľov neprejde pri listovaní vo výsledkoch cez tretiu ponúkanú stranu (iProspect Search Engine User Behavior Study 2006).

O tom, že na nájditeľnosť stránky má veľký vplyv informačná architektúra, sme hovorili vo viacerých príspevkoch (Makulová 2005 b). Okrem informačnej architektúry má veľký vplyv na nájditeľnosť aj optimalizácia webových stránok pre vyhľadávače. V súčasnosti existujú mnohé sofistikované nástroje umožňujúce zistiť, ako sa správajú používatelia pri návšteve webového sídla. Výsledky analýz môžeme potom využiť pri návrhu vhodnej štruktúry sídla v prípade redizajnu, pri optimalizácii stránok, ale aj pri tvorbe vyhľadávacích zón.

Systém NAJ.sk monitorujúci správanie používateľov na webe

Na Slovensku patrí k najznámejším systém NAJ.sk (www.naj.sk) na meranie a analýzu návštevnosti stránok. K dispozícii sú rozsiahle štatistiky zahrňujúce základné informácie o návštevnosti, ako napríklad počet návštev, počet návštevníkov, počet zobrazených stránok, počet aktívnych návštevníkov, informácie o tom, odkiaľ ľudia na stránky prichádzajú a ako sa správajú, aké používajú prehliadače, aké majú technické možnosti (podpora flash, java, cookies a pod.), ako a odkiaľ sa k internetu pripájajú a veľa ďalších ukazovateľov spracovaných v prehľadných tabuľkách a grafoch. Tieto údaje možno ďalej využiť na optimalizáciu webových sídiel pre prehliadače, zlepšenie informačnej architektúry, určenia vyhľadávacích zón a pod. Na nasledujúcom obrázku vidíme, z ktorých vyhľadávačov prichádzajú návštevníci najčastejšie na Portál ku katalógom a zbierkam slovenských knižníc, ktorý je jedným z výstupov projektu KIS3G (www.kis3g.sk).

mak1.jpg (213608 bytes)

Obr. 1 Z ktorých vyhľadávačov prichádzajú ľudia najviac na portál projektu KIS3G

Ako vidíme na obrázku, zo 6 185 návštev až 65,92 % používateľov prichádza z vyhľadávača Google Slovensko. K ďalším vyhľadávačom s menším zastúpením patria Google.com (8,5 %), Zoznam.sk (fulltext 7,18 %) a Zoznam.sk (katalóg 7,07 %).

K dispozícii sú aj mesačné správy poskytujúce celý rad užitočných informácií, ako napríklad počítače návštevníkov podľa regiónov v SR, podľa spôsobu pripojenia, podľa poskytovateľov pripojenia, informácie o tom, koľko času strávia na stránke a na webe, koľko stránok navštívia za jednu návštevu, ktoré sú najčastejšie hľadané spojenia a pod.

Oblasti spolupráce pri návrhu systému vyhľadávania

Jednou z najčastejších chýb pri návrhu systému vyhľadávania je, že sa úplne zveruje do rúk IT špecialistov a pri implementácii sa nekonzultuje s informačným architektom a neberie sa do úvahy správanie používateľa pri vyhľadávaní informácií. Preto je pri návrhu ideálna spolupráca medzi IT špecialistom a informačným architektom predovšetkým v nasledujúcich oblastiach (Rosenfeld – Morville, 2002, s. 137-144).

Výber oblastí vyhľadávania

Pri návrhu systému vyhľadávania sa často zindexuje celé webové sídlo, čo úplne nemusí vyhovovať požiadav-kám používateľov, ktorí majú často špecifické potreby. Preto sa odporúča vytvoriť vyhľadávacie zóny, ktoré tvoria súbory homogénneho obsahu a budú indexované zvlášť. Na nasledujúcom obrázku vidíme, ako má vyhľadávacie zóny na svojich stránkach pekne naimplementované spoločnosť DELL.

mak2.jpg (103245 bytes)
Obr. 2 Vyhľadávacie zóny spoločnosti DELL

Prvé vyhľadávacie zóny sú určené podľa typu používateľov (malí a strední podnikatelia, zdravotníctvo, vysoké školy a pod.). Ak používatelia neurčia svoj typ, prehľadáva sa celé sídlo. Navyše majú možnosť si zvoliť, či chcú vyhľadávať produkty, technickú podporu alebo články a riešenia. Ak hľadáme napríklad tlačiarne, systém ponúka úplne iné typy pre domácnosti a iné pre federálnu vládu. Tvorba správnych vyhľadávacích zón v spolupráci s informačným architektom umožní zúžiť počet nájdených záznamov, ktoré sú špeciálne určené konkrétnej cieľovej skupine. Pri návrhu vyhľadávacích zón sa často využívajú aj navrhnuté organizačné schémy. Vyhľadávacie zóny môžu byť podľa typu obsahu, používateľov, predmetu, zemepisného názvu, chronológie, autora, oddelenia a pod.

Indexovanie pre špecifické skupiny používateľov

Často sa odporúča vytvoriť vyhľadávacie zóny aj pre špecifické skupiny používateľov, ktoré majú iné informačné potreby. K pekným príkladom patrí napríklad Národná lekárska knižnica USA (http://www.nlm.nih.gov/), ktorá už v rámci úvodnej stránky ponúka špeciálne informácie pre verejnosť, lekárskych profesionálov, knihovníkov, výskumníkov a vydavateľov.

Indexovanie podľa predmetu

K typickým príkladom využívajúcim indexovanie podľa predmetu patria predmetové adresáre internetu (Yahoo!, Open Directory Project, Zoznam.sk a pod.). Veľmi pekné indexovanie podľa predmetu má prvý predmetový adresár internetu Yahoo! Ako vidíme na nasledujúcom obrázku, systém umožňuje vyhľadávať buď v celom webovom priestore, v predmetovom adresári Yahoo!, alebo už iba v konkrétnej skupine.

mak3.jpg (196441 bytes)

Obr. 3 Určenie vyhľadávacej zóny v systéme Yahoo!

 

V nasledujúcej tabuľke vidíme porovnanie počtu nájdených záznamov na požiadavku “information architecture” v jednotlivých vyhľadávacích zónach.

Vyhľadávacia zóna Počet nájdených záznamov na požiadavku
information architecture
Celý web 90 800 000
Celý adresár Yahoo! 645
Časť adresára Yahoo!   22

Ako vidíme, počet nájdených záznamov nám výrazne klesol pri určení špecifickej zóny. Po prezretí záznamov v časti adresára Yahoo! Library and Information Science vidíme, že sme našli skutočne relevantné a kvalitné záznamy.

Indexovanie nového obsahu

V praxi sa často stretávame s obsahom, ktorý je indexovaný chronologicky. V takomto prípade môžeme vyhľadávať buď najnovšie informácie, prípadne informácie dodané pred týždňom, mesiacom alebo v určitom časovom pásme. S uvedeným príkladom vyhľadávacích zón sa často stretávame v rozšírenom vyhľadávaní. Napríklad vyhľadávač Google umožňuje hľadať záznamy, ktoré boli aktualizované kedykoľvek, posledné 3 alebo 6 mesiacov, prípadne za posledný rok.

Výber prvkov záznamu zahrnutých do indexu

Často sa odporúča zahrnúť do indexu aj časti dokumentu, podľa ktorých môžu používatelia ďalej zjemňovať a ladiť rešerš. Veľmi pekne sú dané filtre nastavené v systéme Virtua v projekte KIS3G, kde si používateľ môže nastaviť filtre podľa obsahu, formátu, jazyka, miesta vydania, dátumu vydania, lokácie a pod.

Konvencie informačnej architektúry týkajúce sa vyhľadávania

Už sme spomínali, že vyhľadávanie patrí k jedným z najdôležitejších pilierov informačnej architektúry. Počas vývoja vyhľadávania sa ustálili dva typy vyhľadávania: základné vyhľadávanie alebo vyhľadávanie podľa kľúčových slov a rozšírené vyhľadávanie umožňujúce zjemňovať a ladiť rešeršnú požiadavku. Kvalita vyhľadávania záleží od viacerých faktorov, ale predovšetkým je to kvalita a aktualizáca indexu, ktorý vytvárajú roboty.

Počas viac ako desaťročnej existencii vyhľadávacích nástrojov sa vytvorili nasledujúce konvencie rešpektujúce výsledky prieskumov používateľov a odporúčania odborníkov.

Základné vyhľadávanie

  • Okienko základného vyhľadávania by malo byť na každej strane webového sídla a malo by byť dostatočne dlhé, minimálne 20 znakov.
  • Najvhodnejším fontom na písanie je Arial.
  • Veľkosť fontu vo vyhľadávacom okne by mala byť 10 bodov, nie menšia ako 8 bodov.
  • Vyhľadávanie by sa malo začať stlačením klávesu Enter alebo kliknutím na tlačidlo Hľadaj umiestneným vpravo od vyhľadávacieho okna.
  • Spojenie na rozšírené vyhľadávanie by malo byť umiestnené pod alebo vedľa okienka na vyhľadávanie.
  • Implicitne by sa mal prehľadať celý obsah webového sídla.
  • Základné vyhľadávanie by malo umožniť použitie boolovských operátorov, aj keď táto možnosť nemusí byť nikde vysvetlená.
  • Vyhľadávanie na webovom sídle by malo byť k dispozícii ako vyhľadávacie okienko a nie ako spojenie.

Rozšírené vyhľadávanie

  • Políčko na rozšírené vyhľadávanie by malo byť väčšie ako políčko základného vyhľadávania, aby neodrádzalo používateľov zadať aj komplikovanejšie požiadavky.
  • Na stránke rozšíreného vyhľadávania by mala byť nápoveď typu Pomoc, ktorá vysvetľuje používanie možnosti rozšíreného vyhľadávania aj s príkladmi.
  • Ako doplnok k možnosti používania boolovských operátorov AND/OR v okienku rozšíreného vyhľadávania by používatelia mali mať k dispozícii preddefinovaný formulár s voľbami "všetky slová", "akékoľvek slovo" a "fráza". Výsledky prieskumov dokazujú, že väčšina používateľov nevie správne používať boolovské operátory.
  • Rozšírené vyhľadávanie by malo využívať informácie z metaprvkov (napr. dátum, krajina, typ produktu, autor a pod.)

Zobrazovanie výsledkov vyhľadávania

Stránka s výsledkami vyhľadávania by mala obsahovať iba údaje vzťahujúce sa na výsledok vyhľadávania.

  • Výsledky vyhľadávania by mali byť zobrazené v jednom stĺpci.
  • Počet nájdených dokumentov by mal byť zobrazený medzi okienkom vyhľadávania a výsledkami vyhľadávania.
  • Nájdené záznamy by mali byť usporiadané podľa relevancie s požiadavkou, v prípade obchodov podľa ceny a pod.
  • Kľúčové slová použité pri informačnej požiadavke by mali ostať zobrazené v okienku vyhľadávania.
  • Zobrazené záznamy by nemali obsahovať žiadne duplikáty. To sa týka aj viacerých URL, ktoré odkazujú na rovnaký obsah.
  • Každý záznam nájdených výsledkov by mal mať nasledujúce usporiadanie:
    • hľadané kľúčové slová alebo fráza by mali byť v zobrazenom zázname vyznačené tučným fontom,
    • názov dokumentu by mal byť zobrazený 10 bodovým fontom a zároveň by mal byť spojením na daný dokument,
    • ostatný text by mal byť zobrazený 8 bodovým fontom,
    • je vhodné zobraziť abstrakt (summary) dokumentu (mali by sa využiť informácie z metaprvkov),
    • URL adresa dokumentu by mala byť zobrazená na ďalšom riadku, nie však ako spojenie.
  • Výsledky vyhľadávania by mali byť delené po desať na jednej strane.
  • V spodnej časti stránky s nájdenými záznamami by mali byť spojenia na ďalšie skupiny záznamov až po 10. stranu s výsledkami (napr. 1 2 3 4 5 6 7 8 9 10).
  • Prvá strana s nájdenými záznamami by nemala byť spojením, môže byť zvýraznená inou farbou, aby užívateľ vedel, na ktorej strane s vyhľadanými záznamami sa nachádza.
  • Mali by byť k dispozícii spojenia “Predchádzajúce” a “Ďalšie”. Spojenie “Predchádzajúce” odkazuje na predošlú stránky s výsledkami a spojenie “ďalšie” vedie na ďalšiu stranu s vyhľadanými záznamami.

Záver

Návrh vyhľadávacieho systému je jednou z najťažších oblastí vývoja sídla. Je chybou, že sa často podceňuje a zveruje sa do rúk iba IT špecialistom. Ak sa pri návrhu vychádza z výsledkov výskumov správania používateľov, odrazí sa to na vyššej návštevnosti webového sídla a ich spokojnosti. Pri zle navrhnutom systéme vyhľadávania riskujeme stratu dôležitých informácií, a preto by sme si mali uvedomiť, že informáciu, ktorú nikto nenájde, ani nikto neprečíta.

Literatúra

iProspect Search Engine User Behavior Study. April 2006. [cit. 2007-01-22]. Dostupné na internete: <http://www.iprospect.com/premiumPDFs/WhitePaper_2006_SearchEngineUserBehavior.pdf> MAKULOVÁ, Soňa. 2002. Vyhľadávanie informácií v internete. Problémy, východiská, postupy. Bratislava : EL&T, 2002. 376 s. ISBN 80-88812-16-X.

MAKULOVÁ, Soňa. 2006 a. Analýza faktorov vplývajúcich na nájditeľnosť webových sídiel. In Information Use in Information Society. International Conference. Bratislava, Slovakia, October 10-11, 2006. Bratislava : Centrum VTI SR, 2006, s. 109-118.

MAKULOVÁ, Soňa. 2006 b. Prečo musíme optimalizovať webové sídla pre vyhľadávače, alebo čo je SEO. In Newsletter.

2. február 2006 [online], [cit. 2007-01-22]. Dostupné na internete: <  http://www.elet.sk/?newsletter&sprava=preco-musime-optimalizovat-webove-sidla-pre-vyhladavace-alebo-co-je-seo> MAKULOVÁ, Soňa. 2006 c. K niektorým problémom vyhľadávania na webových sídlach. In ITlib. Informačné technológie

a knižnice [online], 2006, č. 4 [cit. 2007-01-22]. Dostupné na internete: <  http://www.cvtisr.sk/itlib/itlib064/makulova.htm>. ISSN 1336-0779. McGOVERN, Gerry; NORTON, Rob. 2002. Content Critical. London : Pearson Education Limited, 2002. 241 s. ROSENFELD, L., MORVILLE, P. 2002. Information Architecture for the World Wide Web. 2. vyd. Sebastopol : O´Reilly&Associates, 2002, 461 s. ISBN 0-596-00035-9.

Príspevok bol spracovaný v rámci vedeckého grantového projektu VEGA 1/2481/05 Využívanie informácií pri informačnom správaní vo vzdelávaní a vede.

Tlačiť Facebook Twitter LinkdeIN

Hodnotenie

Počet hodnotení: 0

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License

Ak sa neuvádza inak, obsah článkov podlieha licencii https://creativecommons.org/licenses/by/4.0/


ISSN 1336-0779 (online vydanie)  ISSN 1335-793X (tlačené vydanie)
© Centrum vedecko - technických informácií SR