Návrh vyhľadávania na webových sídlach rešpektujúci odporúčania informačných architektov

Krok za krokom

V minulom článku K
niektorým problémom vyhľadávania na webových sídlach
(Makulová 2006 c) sme
bližšie charakterizovali dôležitý pilier informačnej architektúry vyhľadávania na
webových sídlach. Zdôraznili sme nutnosť spolupráce medzi IT špecialistom a
informačným architektom pri výbere vhodného vyhľadávacieho nástroja. V dnešnom
príspevku si povieme niečo o možnosti monitorovania návštevnosti webového sídla,
ktoré nám pomôže pri určení vyhľadávacích zón a odporúčaní informačných
architektov pri návrhu systému vyhľadávania.

Úvod

Dobre navrhnutý systém vyhľadávania sa vráti
predovšetkým v zvýšení návštevnosti webového sídla, ktorá úzko súvisí s jeho nájditeľnosťou.
Nájditeľnosť webového sídla patrí k dôležitým kvalitatívnym atribútom, pretože
veľké percento návštevníkov môže prichádzať na stránky z vyhľadávačov. Toto
percento je závislé práve od kvality optimalizácie webového sídla pre
vyhľadávače. Nájditeľnosť je o to dôležitejšia, že až 90 % používateľov
neprejde pri listovaní vo výsledkoch cez tretiu ponúkanú stranu (iProspect Search
Engine User Behavior Study 2006).

O tom, že na nájditeľnosť stránky má veľký
vplyv informačná architektúra, sme hovorili vo viacerých príspevkoch (Makulová 2005
b). Okrem informačnej architektúry má veľký vplyv na nájditeľnosť aj
optimalizácia webových stránok pre vyhľadávače. V súčasnosti existujú mnohé
sofistikované nástroje umožňujúce zistiť, ako sa správajú používatelia pri
návšteve webového sídla. Výsledky analýz môžeme potom využiť pri návrhu vhodnej
štruktúry sídla v prípade redizajnu, pri optimalizácii stránok, ale aj pri tvorbe
vyhľadávacích zón.

Systém NAJ.sk monitorujúci správanie
používateľov na webe

Na Slovensku patrí k najznámejším systém NAJ.sk
(www.naj.sk) na meranie a analýzu návštevnosti
stránok. K dispozícii sú rozsiahle štatistiky zahrňujúce základné informácie o
návštevnosti, ako napríklad počet návštev, počet návštevníkov, počet
zobrazených stránok, počet aktívnych návštevníkov, informácie o tom, odkiaľ
ľudia na stránky prichádzajú a ako sa správajú, aké používajú prehliadače, aké
majú technické možnosti (podpora flash, java, cookies a pod.), ako a odkiaľ sa k
internetu pripájajú a veľa ďalších ukazovateľov spracovaných v prehľadných
tabuľkách a grafoch. Tieto údaje možno ďalej využiť na optimalizáciu webových
sídiel pre prehliadače, zlepšenie informačnej architektúry, určenia vyhľadávacích
zón a pod. Na nasledujúcom obrázku vidíme, z ktorých vyhľadávačov prichádzajú
návštevníci najčastejšie na Portál ku katalógom a zbierkam slovenských
knižníc
, ktorý je jedným z výstupov projektu KIS3G (www.kis3g.sk).

mak1.jpg (213608 bytes)

Obr. 1 Z ktorých vyhľadávačov prichádzajú ľudia
najviac na portál projektu KIS3G

Ako vidíme na obrázku, zo 6 185 návštev až
65,92 % používateľov prichádza z vyhľadávača Google Slovensko. K ďalším
vyhľadávačom s menším zastúpením patria Google.com (8,5 %), Zoznam.sk (fulltext
7,18 %) a Zoznam.sk (katalóg 7,07 %).

K dispozícii sú aj mesačné správy poskytujúce
celý rad užitočných informácií, ako napríklad počítače návštevníkov podľa
regiónov v SR, podľa spôsobu pripojenia, podľa poskytovateľov pripojenia, informácie
o tom, koľko času strávia na stránke a na webe, koľko stránok navštívia za jednu
návštevu, ktoré sú najčastejšie hľadané spojenia a pod.

Oblasti spolupráce pri návrhu systému
vyhľadávania

Jednou z najčastejších chýb pri návrhu systému
vyhľadávania je, že sa úplne zveruje do rúk IT špecialistov a pri implementácii sa
nekonzultuje s informačným architektom a neberie sa do úvahy správanie používateľa
pri vyhľadávaní informácií. Preto je pri návrhu ideálna spolupráca medzi IT
špecialistom a informačným architektom predovšetkým v nasledujúcich oblastiach
(Rosenfeld – Morville, 2002, s. 137-144).

Výber oblastí vyhľadávania

Pri návrhu systému vyhľadávania sa často
zindexuje celé webové sídlo, čo úplne nemusí vyhovovať požiadav-kám
používateľov, ktorí majú často špecifické potreby. Preto sa odporúča vytvoriť
vyhľadávacie zóny, ktoré tvoria súbory homogénneho obsahu a budú indexované
zvlášť. Na nasledujúcom obrázku vidíme, ako má vyhľadávacie zóny na svojich
stránkach pekne naimplementované spoločnosť DELL.

mak2.jpg (103245 bytes)
Obr. 2 Vyhľadávacie zóny spoločnosti DELL

Prvé vyhľadávacie zóny sú určené podľa typu
používateľov (malí a strední podnikatelia, zdravotníctvo, vysoké školy a pod.). Ak
používatelia neurčia svoj typ, prehľadáva sa celé sídlo. Navyše majú možnosť si
zvoliť, či chcú vyhľadávať produkty, technickú podporu alebo články a riešenia.
Ak hľadáme napríklad tlačiarne, systém ponúka úplne iné typy pre domácnosti a
iné pre federálnu vládu. Tvorba správnych vyhľadávacích zón v spolupráci s
informačným architektom umožní zúžiť počet nájdených záznamov, ktoré sú
špeciálne určené konkrétnej cieľovej skupine. Pri návrhu vyhľadávacích zón sa
často využívajú aj navrhnuté organizačné schémy. Vyhľadávacie zóny môžu byť
podľa typu obsahu, používateľov, predmetu, zemepisného názvu, chronológie, autora,
oddelenia a pod.

Indexovanie pre špecifické skupiny
používateľov

Často sa odporúča vytvoriť vyhľadávacie zóny
aj pre špecifické skupiny používateľov, ktoré majú iné informačné potreby. K
pekným príkladom patrí napríklad Národná lekárska knižnica USA (http://www.nlm.nih.gov/), ktorá už v rámci úvodnej
stránky ponúka špeciálne informácie pre verejnosť, lekárskych profesionálov,
knihovníkov, výskumníkov a vydavateľov.

Indexovanie podľa predmetu

K typickým príkladom využívajúcim indexovanie
podľa predmetu patria predmetové adresáre internetu (Yahoo!, Open Directory Project,
Zoznam.sk a pod.). Veľmi pekné indexovanie podľa predmetu má prvý predmetový
adresár internetu Yahoo! Ako vidíme na nasledujúcom obrázku, systém umožňuje
vyhľadávať buď v celom webovom priestore, v predmetovom adresári Yahoo!, alebo už
iba v konkrétnej skupine.

mak3.jpg (196441 bytes)

Obr. 3 Určenie vyhľadávacej zóny
v systéme Yahoo!

 

V nasledujúcej tabuľke vidíme porovnanie počtu
nájdených záznamov na požiadavku “information architecture” v jednotlivých
vyhľadávacích zónach.

Vyhľadávacia zóna Počet nájdených záznamov na požiadavku
information architecture
Celý web 90 800 000
Celý adresár Yahoo! 645
Časť adresára Yahoo!   22

Ako vidíme, počet nájdených
záznamov nám výrazne klesol pri určení špecifickej zóny. Po prezretí záznamov v
časti adresára Yahoo! Library and Information Science vidíme, že sme našli skutočne
relevantné a kvalitné záznamy.

Indexovanie nového obsahu

V praxi sa často stretávame s obsahom, ktorý je
indexovaný chronologicky. V takomto prípade môžeme vyhľadávať buď najnovšie
informácie, prípadne informácie dodané pred týždňom, mesiacom alebo v určitom
časovom pásme. S uvedeným príkladom vyhľadávacích zón sa často stretávame v
rozšírenom vyhľadávaní. Napríklad vyhľadávač Google umožňuje hľadať záznamy,
ktoré boli aktualizované kedykoľvek, posledné 3 alebo 6 mesiacov, prípadne za
posledný rok.

Výber prvkov záznamu zahrnutých do indexu

Často sa odporúča zahrnúť do indexu aj časti
dokumentu, podľa ktorých môžu používatelia ďalej zjemňovať a ladiť rešerš.
Veľmi pekne sú dané filtre nastavené v systéme Virtua v projekte KIS3G, kde si
používateľ môže nastaviť filtre podľa obsahu, formátu, jazyka, miesta vydania,
dátumu vydania, lokácie a pod.

Konvencie informačnej architektúry
týkajúce sa vyhľadávania

Už sme spomínali, že vyhľadávanie patrí k
jedným z najdôležitejších pilierov informačnej architektúry. Počas vývoja
vyhľadávania sa ustálili dva typy vyhľadávania: základné vyhľadávanie alebo
vyhľadávanie podľa kľúčových slov a rozšírené vyhľadávanie umožňujúce
zjemňovať a ladiť rešeršnú požiadavku. Kvalita vyhľadávania záleží od
viacerých faktorov, ale predovšetkým je to kvalita a aktualizáca indexu, ktorý
vytvárajú roboty.

Počas viac ako desaťročnej existencii
vyhľadávacích nástrojov sa vytvorili nasledujúce konvencie rešpektujúce výsledky
prieskumov používateľov a odporúčania odborníkov.

Základné vyhľadávanie

  • Okienko základného vyhľadávania by malo byť na každej strane
    webového sídla a malo by byť dostatočne dlhé, minimálne 20 znakov.
  • Najvhodnejším fontom na písanie je Arial.
  • Veľkosť fontu vo vyhľadávacom okne by mala byť 10 bodov, nie
    menšia ako 8 bodov.
  • Vyhľadávanie by sa malo začať stlačením klávesu Enter alebo
    kliknutím na tlačidlo Hľadaj umiestneným vpravo od vyhľadávacieho okna.
  • Spojenie na rozšírené vyhľadávanie by malo byť umiestnené pod
    alebo vedľa okienka na vyhľadávanie.
  • Implicitne by sa mal prehľadať celý obsah webového sídla.
  • Základné vyhľadávanie by malo umožniť použitie boolovských
    operátorov, aj keď táto možnosť nemusí byť nikde vysvetlená.
  • Vyhľadávanie na webovom sídle by malo byť k dispozícii ako
    vyhľadávacie okienko a nie ako spojenie.

Rozšírené vyhľadávanie

  • Políčko na rozšírené vyhľadávanie by malo byť väčšie ako
    políčko základného vyhľadávania, aby neodrádzalo používateľov zadať aj
    komplikovanejšie požiadavky.
  • Na stránke rozšíreného vyhľadávania by mala byť nápoveď typu
    Pomoc, ktorá vysvetľuje používanie možnosti rozšíreného vyhľadávania aj s
    príkladmi.
  • Ako doplnok k možnosti používania boolovských operátorov AND/OR
    v okienku rozšíreného vyhľadávania by používatelia mali mať k dispozícii
    preddefinovaný formulár s voľbami "všetky slová", "akékoľvek
    slovo" a "fráza". Výsledky prieskumov dokazujú, že väčšina
    používateľov nevie správne používať boolovské operátory.
  • Rozšírené vyhľadávanie by malo využívať informácie z
    metaprvkov (napr. dátum, krajina, typ produktu, autor a pod.)

Zobrazovanie výsledkov vyhľadávania

Stránka s výsledkami vyhľadávania by mala
obsahovať iba údaje vzťahujúce sa na výsledok vyhľadávania.

  • Výsledky vyhľadávania by mali byť zobrazené v jednom stĺpci.
  • Počet nájdených dokumentov by mal byť zobrazený medzi okienkom
    vyhľadávania a výsledkami vyhľadávania.
  • Nájdené záznamy by mali byť usporiadané podľa relevancie s
    požiadavkou, v prípade obchodov podľa ceny a pod.
  • Kľúčové slová použité pri informačnej požiadavke by mali
    ostať zobrazené v okienku vyhľadávania.
  • Zobrazené záznamy by nemali obsahovať žiadne duplikáty. To sa
    týka aj viacerých URL, ktoré odkazujú na rovnaký obsah.
  • Každý záznam nájdených výsledkov by mal mať nasledujúce
    usporiadanie:
    • hľadané kľúčové slová alebo fráza by mali byť v zobrazenom
      zázname vyznačené tučným fontom,
    • názov dokumentu by mal byť zobrazený 10 bodovým fontom a
      zároveň by mal byť spojením na daný dokument,
    • ostatný text by mal byť zobrazený 8 bodovým fontom,
    • je vhodné zobraziť abstrakt (summary) dokumentu (mali by sa
      využiť informácie z metaprvkov),
    • URL adresa dokumentu by mala byť zobrazená na ďalšom riadku, nie
      však ako spojenie.
  • Výsledky vyhľadávania by mali byť delené po desať na jednej
    strane.
  • V spodnej časti stránky s nájdenými záznamami by mali byť
    spojenia na ďalšie skupiny záznamov až po 10. stranu s výsledkami (napr. 1 2 3 4 5 6
    7 8 9 10).
  • Prvá strana s nájdenými záznamami by nemala byť spojením,
    môže byť zvýraznená inou farbou, aby užívateľ vedel, na ktorej strane s
    vyhľadanými záznamami sa nachádza.
  • Mali by byť k dispozícii spojenia “Predchádzajúce” a
    “Ďalšie”. Spojenie “Predchádzajúce” odkazuje na predošlú stránky s
    výsledkami a spojenie “ďalšie” vedie na ďalšiu stranu s vyhľadanými záznamami.

Záver

Návrh vyhľadávacieho systému je jednou z
najťažších oblastí vývoja sídla. Je chybou, že sa často podceňuje a zveruje sa
do rúk iba IT špecialistom. Ak sa pri návrhu vychádza z výsledkov výskumov
správania používateľov, odrazí sa to na vyššej návštevnosti webového sídla a
ich spokojnosti. Pri zle navrhnutom systéme vyhľadávania riskujeme stratu dôležitých
informácií, a preto by sme si mali uvedomiť, že informáciu, ktorú nikto nenájde,
ani nikto neprečíta.

Literatúra

iProspect Search Engine User Behavior Study. April 2006.
[cit. 2007-01-22]. Dostupné na internete: <http://www.iprospect.com/premiumPDFs/WhitePaper_2006_SearchEngineUserBehavior.pdf>
MAKULOVÁ, Soňa. 2002. Vyhľadávanie informácií v internete. Problémy,
východiská, postupy.
Bratislava : EL&T, 2002. 376 s. ISBN 80-88812-16-X.

MAKULOVÁ, Soňa. 2006 a. Analýza faktorov vplývajúcich
na nájditeľnosť webových sídiel. In Information Use in Information Society.
International Conference. Bratislava, Slovakia, October 10-11, 2006. Bratislava
:
Centrum VTI SR, 2006, s. 109-118.

MAKULOVÁ, Soňa. 2006 b. Prečo musíme optimalizovať
webové sídla pre vyhľadávače, alebo čo je SEO. In Newsletter.

2. február 2006 [online], [cit. 2007-01-22]. Dostupné
na internete: <  http://www.elet.sk/?newsletter&sprava=preco-musime-optimalizovat-webove-sidla-pre-vyhladavace-alebo-co-je-seo>
MAKULOVÁ, Soňa. 2006 c. K niektorým problémom vyhľadávania na webových sídlach. In
ITlib. Informačné technológie

a knižnice [online], 2006, č. 4 [cit. 2007-01-22].
Dostupné na internete: <  http://www.cvtisr.sk/itlib/itlib064/makulova.htm>.
ISSN 1336-0779. McGOVERN, Gerry; NORTON, Rob. 2002. Content Critical. London :
Pearson Education Limited, 2002. 241 s. ROSENFELD, L., MORVILLE, P. 2002. Information
Architecture for the World Wide Web
. 2. vyd. Sebastopol : O´Reilly&Associates,
2002, 461 s. ISBN 0-596-00035-9.

Príspevok bol spracovaný v rámci vedeckého
grantového projektu VEGA 1/2481/05 Využívanie informácií pri informačnom správaní
vo vzdelávaní a vede.

Zdieľať: