Interaktívne systémy informačného prieskumu

From Slovakia

Ľudský prvok je v prieskumovom systéme rozhodujúci a od neho sa odvíja aj vývoj interaktívnych prieskumových systémov. Teoretické výskumy v oblasti sa začali formovať už v 50. rokoch 20. storočia. 60. roky už boli obdobím prvých expertných systémov, ktoré dokázali riešiť problémy na jednoduchej úrovni (napr. DENDRAL) (1).

Interaktívne systémy informačného prieskumu môžeme v súčasnosti rozdeliť na dve skupiny:

  • systémy neprístupné pre verejnosť,
  • systémy prístupné pre verejnosť (dostupné na internete).

Systémy neprístupné pre verejnosť

Prvé systémy interaktívneho informačného prieskumu (70. – 80. roky) fungovali väčšinou na princípe dialógu s používateľom, pri ktorom zisťovali informácie o ňom a jeho požiadavke. Takto si vytvárali model (obraz) používateľa.

V 70. rokoch vznikol jeden z prvých systémov tohto druhu – systém THOMAS vytvorený Oddym. Na začiatku prieskumu zadal používateľ kľúčové slová a prostredníctvom dialógu (ponuky na obrazovke) ho viedol k nájdeniu zaujímavých informácií. Na základe tohto dialógu si systém vytváral obraz používateľa (jeho vnemy a požiadavky) a podľa neho zobrazoval informácie. Podľa používateľových reakcií (relevantná spätná väzba) systém výsledky stále modifikoval, pričom akceptoval aj protirečivé odpovede. Problémom bola nemožnosť aplikácie systému fungujúceho na báze asociácií vo veľkom informačnom prostredí (2). Môžeme si však všimnúť, že prvky tohto systému sa objavujú v aktuálnych personalizovaných systémoch.

Druhým zaujímavým systémom bol systém GRUNDY vytvorený Richom v roku 1979. Spôsobom interakcie sa podobal na spomenutý systém THOMAS, avšak fungoval na inom princípe. Používateľa modeloval na základe atribútov rôznych stereotypov. Podľa toho používateľovi odporúčal knihy – beletriu, ktorá by ho mohla najviac zaujímať. Ak sa mu ponúknutý titul nepáčil, snažil sa kritériá modifikovať. Ukázalo sa, že používatelia boli so systémom celkom spokojní. Stereotypy použité v systéme však nie je možné aplikovať na všetky druhy problémov, ktoré používateľ rieši (2). Systém však môžeme považovať za predchodcu dnešných nástrojov na odporúčanie informácií.

V 80. rokoch vznikli okrem iných dva zaujímavé projekty – HYPERCATalog a MONSTRAT.

HYPERCATalog vytvoril švédsky autor Hjerppe v roku 1986. Tento elektronický katalóg prekonával obmedzenia tradičného katalógu ako produktu determinovaného dovtedajším papierovým formátom, ktorý bol určený výhradne pre knihovníka. Okrem toho, že tento katalóg využíval interaktívne metódy hypertextu a navigácie, mal ešte dostupné modely stereotypov používateľov (1).

Projekt a model interaktívneho sprostredkovateľského systému MONSTRAT bol vytvorený kolektívom autorov (Belkin, Brooks, Borgmanová, Ingwersen, Spark Jonesová, Fox a iní) v roku 1987. Funkciami MONSTRAT-u bolo zisťovanie stavu používateľovho poznania problému, vytvorenie modelu typu používateľa a problému a podľa toho voľba najvhodnejšieho dialógu, odozvy a stratégie prieskumu. Výsledkom tohto projektu boli dva systémy – CODER a I3R. I3R bol systém vytvorený Croftom a Thomsonom. Z interakcie vo forme dialógu stroj – počítač analyzuje zadané dotazy a tým si vytvára model požiadavky. Pri analýze dotazu rozpoznáva pojmy a vzťahy medzi nimi, pričom používa pravdepodobnostné a zhlukové algoritmy. Model požiadavky sa hodnotením používateľa ďalej modifikuje. Systém CODER bol testovacím systémom na skúmanie možností aplikácie rôznych foriem umelej inteligencie v prieskume. Jeho cieľom bola reprezentácia a analýza dokumentov posielaných elektronickou poštou, ktoré sa porovnávali so zadanými dotazmi (2). Môžeme povedať, že projekt vykazuje isté vlastnosti inteligentných agentov.

Aj v 90. rokoch vytvoril Belkin spolu so Steinovou a Thielom interaktívny prieskumový systém na báze dialógu s názvom MERIT. MERIT pri komunikácii s používateľom využíval konkrétne prípady riešení problémov používateľov pri ich interakcii so systémom. Vzory informačného správania špecifických používateľov v rôznom čase a za rôznych okolností sa ukladali a mohli sa znova použiť pri ďalšom vyhľadávaní. Problematické bolo indexovanie týchto prípadov, aby ich systém vedel použiť vo vhodnom čase. Systém s používateľmi komunikuje prostredníctvom dialógu, pri ktorom ponúkal rôzne možnosti, z ktorých si používateľ mal vybrať (napr.: Potrebujete prehľad alebo detailné informácie?). Dialóg človek – systém pritom vychádza z modelu rolí v rozhovore načrtnutého v práci autorov (3). V ďalšej časti práce vidieť, že aj vyhľadávacie systémy na báze dialógu v súčasnosti našli uplatnenie v internetových vyhľadávačoch informácií.

Systém TIAPRI bol vyvinutý francúzskymi vedcami Mulhelmom a Nigayom, ktorí sa snažili integrovať poznatky vzťahu človek – počítač s poznatkami softvérového inžinierstva. Hlavným komponentom systému je “regulátor dialógu”, ktorý má za úlohu zmierniť rozdiely medzi používateľskými mentálnymi modelmi a reprezentáciou dokumentov. Ak teda používateľ zadal dotaz, ktorý obsahoval nesprávne slová, systém mu vo svojej odozve ponúkne iné, ktoré by mu mali byť blízke. Na ich identifikáciu má systém vytvorené spojenia, ktoré rozoznávajú rôzne úrovne abstrakcie spracovaných údajov o dokumentoch (4).

V súčasnosti zaznamenávame posun v oblasti interaktívnych prieskumových systémov od písomných dotazov smerom ku komunikácii založenej na hovorenej reči (systémy rozumejúce hovorenej reči) a na báze dotyku (systémy s dotykovými displejmi).

Aj keď je hovorená komunikácia najprirodzenejším typom komunikácie pre človeka, pri jej využití v oblasti vyhľadávania vznikajú dva problémy. Keďže hovorené slovo sa formuje priamo z mysle, používatelia menej selektujú slová, ktoré zadajú vo svojom dotaze. Preto vznikajú systémy, ktoré sa snažia objasniť dotazy pre potreby riešenia problémov pri vyhľadávaní informácií systémom. Systémy vyberajú optimálnu otázku, ktorú pomocou používateľskej odpovede modifikujú (5). ďalším problémom je, že súčasné systémy ešte nie sú schopné rozoznať všetky prvky ľudskej hovorenej reči. Pri komunikácii sa preto niekedy vyskytujú chyby, ktoré znižujú efektivitu systému. Crestani navrhuje pri výskyte tohto druhu chýb využiť hlavne klasickú metódu relevantnej odozvy vykonanú používateľom. Načrtáva však aj iné metódy, ktoré sú však ešte vo vývoji. Keďže zdôrazňovanie slov vo vetách sa ukazuje byť jedným z nositeľov významu reči, navrhuje ho využiť aj vo vyhľadávacích systémoch pri zisťovaní predmetu rozhovoru (6).

Interaktívne vyhľadávacie systémy v prostredí internetu

S rozvojom internetu a jeho rozšírením do oblastí bežného života sa aplikovali poznatky o interaktívnych prieskumových systémoch hlavne do tohto prostredia.

V súčasnosti asi v každom vyhľadávacom nástroji je integrovaný nejaký prvok interaktivity. Medzi najznámejšie a najprvotnejšie z nich patria automatická oprava chýb v dotaze a história vyhľadávania. Aj keď sú to veľmi jednoduché vlastnosti, výrazne používateľovi zjednodušujú vyhľadávanie. Opravy sa týkajú preklepov a gramatických chýb v dotaze, prípadne sú schopné navrhovať ďalšie slová na základe podobnosti. Bez nich by sa používateľovi nezobrazil žiaden výsledok, čo by mu mohlo spôsobiť zbytočný stres. História vyhľadávania pomáha používateľovi k tomu, aby nemusel viackrát zadávať rovnaký dotaz. Stačí, keď označí linku, ktorú systém uložil, a môže vyhľadávať v tej istej oblasti. Táto vlastnosť sa v súčasnosti využíva hlavne v online katalógoch knižníc, ale aj vo vyhľadávačoch ako nápoveď pri zadávaní dotazov.

Medzi zložitejšie interaktívne vyhľadávacie systémy môžeme zaradiť:

  • personalizované vyhľadávacie nástroje, čo sú nástroje prispôsobujúce výsledky automaticky podľa typov dotazov, ktoré konkrétny používateľ zadáva;
  • kustomizované vyhľadávacie nástroje, ktoré vyhľadávajú na základe informácií zadaných pri registrácii (podľa profilu);
  • nástroje na kolaboratívne vyhľadávanie, ktoré zoraďujú výsledky k zadanému dotazu podľa skúseností ostatných používateľov;
  • nástroje s podporou relevantnej spätnej väzby ponúkajúce používateľovi interakciu v podobe označenia relevantných/nerelevantných informácií;
  • nástroje na odporúčanie informácií, ktoré využívajú rôzne techniky (kolaboratívne vyhľadávanie, personalizácia, umelá inteligencia) na odporúčanie ďalších informácií používateľovi;
  • inteligentní agenti, ktorí sa učia na správaní používateľa pri informačnom prieskume;
  • vyhľadávacie nástroje na báze dialógu, s ktorými môžeme počas vyhľadávania komunikovať v prirodzenom jazyku.

V našej práci (6) sme hodnotili sedem interaktívnych vyhľadávacích systémov na internete, ktoré podporujú personalizáciu a kustomizáciu. Konkrétne sme analyzovali služby, ktoré sú súčasťou veľkých vyhľadávačov, t. j. MyYahoo a MyGoogle, ale aj alternatívne nástroje zamerané práve na personalizáciu a kustomizáciu: Eurekster, MyFeedz, Minekey, Collarity a Rollyo. Tieto nástroje sme si vybrali preto, lebo sú veľmi aktuálne, a teda by mali v sebe zahaňať všetky najnovšie poznatky. Aj keď ich zaraďujeme do jednej sku-piny, ich interakcia s používateľom prebieha veľmi rozdielne.

Trendy

Orientácia na sociálne siete a skupiny je zjavný trend v prostredí webu. Takmer všetky spomenuté vyhľadávacie nástroje tento trend sledujú a medzi svojimi službami ponúkajú aj komunitné vyhľadávanie. Google oficiálne neohlásil začlenenie podobnej vlastnosti do svojich služieb, no je takmer isté, že trend komunitného vyhľadávania sleduje. Vychádzame z poznatku, že sa spojil so sociálnymi sieťami ako Facebook, Orkut, You Tube… a poznatky o správaní svojich používateľov iste využíva. “Komunitná inteligencia” tak aspoň v šiestich zo siedmich sledovaných nástrojov umožňuje výrazne lepšie výsledky a jednoduchšiu interakciu používateľa so systémom.

Aj keď je komunitné vyhľadávanie populárne, veľmi často využívané sú aj formy interakcie s jedným používateľom. Jeden z týchto druhov interakcie sa prejavuje skryto – ak sa systém učí na jeho krokoch (4 nástroje). ďalší druh týchto interaktívnych nástrojov spolupracuje s používateľom viditeľne, keď prispôsobuje výsledky podľa informácií zadaných v profile (6 nástrojov) alebo na základne spätnej väzby, pri ktorej používateľ ohodnotí ponúknutý zdroj (1 nástroj). Môžeme si všimnúť, že viaceré nástroje (konkrétne 4) kombinujú skrytú a viditeľnú interakciu, aby dosiahli ešte lepšie výsledky. Prispôsobenie výsledkov pomocou informácií zadaných v profile ako oblasť záujmu, vek a pod. je v súčasnosti asi najčastejší spôsob, ako prebieha interakcia človek – počítač. Dá sa povedať, že je aj jedným z najjednoduchších a najúčinnejších.

V nástrojoch je vidieť aj vplyv prostredia web 2.0. Prejavuje sa v možnostiach samostatne si vytvárať záložky obľúbených zdrojov a vybrané oblasti organizovať mrakmi tagov. Nejaká z foriem vizualizácie sa nachádza v piatich zo siedmich skúmaných nástrojov. Tieto možnosti spolu s vizualizáciou nielen sprehľadňujú vyhľadávanie, ale aj ovplyvňujú výsledky vyhľadávania tak, že si to bežný používateľ ani neuvedomuje.

Posielanie výsledkov vyhľadávania na používateľov e-mail, ktoré kedysi ponúkal personalizovaný nástroj Kartoo (2006), už vymizlo. Takmer vo všetkých prípadoch je však táto vlastnosť nahradená RSS alebo inou formou notifikácie o zmenách v zdrojoch.

Problémy

Zaujímavé je zistenie, že na úkor moderných funkcií sa v sledovaných personalizovaných a kustomizovaných nástrojoch dostali do úzadia jednoduché funkcie interaktívneho vyhľadávania. Hovoríme o vlastnostiach ako automatická oprava gramatických chýb, ktorú majú v sebe zakomponovanú iba dva nástroje (Yahoo a Collarity), optimalizácia zobrazených výsledkov, ktorú využívajú iba veľké nástroje ako Google a Yahoo, a rozšírené vyhľadávanie. Rozšírené vyhľadávanie je prítomné iba v prípade dvoch nástrojov (Google a Eurekster), ale tento nedostatok je v podstate odstránený tým, že všetky nástroje ponúkajú iné pokročilé funkcie, ktoré našu požiadavku zužujú a výsledky ponúkajú prispôsobené našim potrebám.

Veľkým problémom pri vyhľadávaní v týchto typoch nástrojov je však fakt, že pole vyhľadávania je často málo viditeľné alebo zaradené do takých častí sídla, v ktorých by sme to mohli najmenej čakať. Tento nedostatok sa objavuje skôr v alternatívnejších nástrojoch ako Minekey a Eurekster. Tie síce ponúkajú množstvo funkcií pre jednoduchšie a interaktívnejšie vyhľadávanie, ale zdanlivý detail, ktorý však používateľ vníma ako prvý, interaktivite veľmi neprispieva.

Výsledky experimentu, ktorým bolo hodnotenie vyhľadávacích nástrojov s podporou personalizácie a kustomizácie, sú sprehľadnené v nasledujúcej tabuľke:

Hodnotenie vyhľadávacích nástrojov s podporou personalizácie a kustomizácie:

hrckova1.jpg (62598 bytes)

hrckova3.jpg (81725 bytes)

Použitá literatúra

  1. ALBERICO, Ralph, MICO, Mary. 1990. Expert Systems for Reference and Information Retrieval. London: Mecler, 1990 [cit. 2008-1-20]. 395 s. ISBN 0-88736-232-X
  2. STEINEROVÁ, Jela. 1996. Teória informačného prieskumu. Bratislava: SITK-CVTI SR, 1996 [cit. 2007-11-4]. 262 s. ISBN 80-85165-58-9
  3. BELKIN, Nicholas a kol. 1994. Cases, Scripts, and Information-Seeking Strategies. On the Design of Interactive Information Retrieval Systems. [online]. New Brunswick: Rutgers University, 1994 [cit. 2007-11-15]. Dostupné na: <www.scils.rutgers.edu/~belkin/articles/eswa.pdf>
  4. MULHEM, Philippe, NIGAY, Laurence. 1996. Interactive Information Retrieval Systems: From User Centered Interface Design to Software Design. Grenoble: Laboratoire CLIPS- IMAG [cit. 2007-12-10].
  5. MISU, Teruhisa, KAWAHARA, Tarsuya. 2005. Speech- based Information Retrieval System with Clarification Dialogue Strategy [online]. Kyoto: Kyoto University, 2005 [cit.2007-12-27]. Dostupné na: <http://research.microsoft.com/users/church/Audio/EMNLP-2005/slides/9C/Misu%20Teruhisa.ppt#334,1,Speechbased Information Retrieval System with Clarification Dialogue Strategy>
  6. CRESTANI, Fabio. 2001. Spoken Query Processing for Interactive Information Retrieval [online]. Glasgow: Strathclyde, 2001 [cit. 2008-2-3]. Dostupné na: <http://www.sciencedirect.com/science?_ob=ArticleURL&_ udi=B6TYX452WDGWZ3&_user=10&_rdoc=1&_fmt=&_orig=search&_sort=d&view=c&_acct=C000050221&_versi on=1&_urlVersion=0&_userid=10&md5=3359edbb1710e49cd2cd046e5314d7ed>  
  7. HRČKOVÁ, Andrea: Interaktívne aspekty vyhľadávania informácií. Bakalárska práca. Univerzita Komenského v Bratislave. Filozofická fakulta; Katedra knižničnej a informačnej vedy. Školiteľka: Mgr. Mirka Grešková. Bratislava: FiF UK, 2008.

Share: