Vyhľadávanie na báze inteligentných agentov
Predstavujeme
S dynamicky sa vyvíjajúcim internetom a hlavne prostredím WWW (World Wide Web) sú používatelia hľadajúci relevantné
informácie konfrontovaní s čoraz väčším počtom informačných zdrojov rôznej kvality. S cieľom získať žiadané informácie cez
jediné rozhranie a v čo najkratšom čase boli vyvinuté špeciálne vyhľadávacie nástroje na báze inteligentných agentov.
Inteligentní informační agenti sú počítačové programy, ktoré umožňujú pomocou množiny nástrojov prehľadať prostredie
WWW, roztriediť a prefiltrovať prichádzajúce údaje do ľahko spracovateľného a prehľadného množstva vybraných informácií,
ktoré zodpovedajú požiadavke používateľa.
Na využívanie takýchto programov sa orientuje i CVTI SR vo svojom oddelení informačných služieb, kde sú k dispozícii
dva výkonné vyhľadávacie nástroje – COPERNIC 2001 Pro a BullsEye Plus.
Vyhľadávací nástroj COPERNIC 2001 Pro je produktom firmy Copernic Technologies Inc., ktorého najnovšiu bezplatnú verziu
COPERNIC 2001 Basic je možné nájsť na adrese www.copernic.com v niekoľkých jazykových mutáciách. Základnou funkciou tohto
programu je, že zadanú požiadavku vytvorenú jedným alebo viacerými kľúčovými slovami zašle vybranej skupine vyhľadávačov,
ktoré nájdu relevantné webové stránky, pričom sa získa zotriedený súbor dokumentov, ktorý spravidla neobsahuje žiadne
duplicity. Konkrétne verzia určená pre profesionálov (Pro) ponúka vyhľadávanie v 93 špecializovaných kategóriách umožňujúcich
využívať viac než 1 000 svetových vyhľadávačov. Ide o kategórie napríklad z oblasti obchodu a financií, výchovy a
vzdelávania, zdravotníctva, vedy, nových technológií, počítačov, ale i najnovšieho diania vo svete. Je možné tiež prehľadávať
iba určitý druh dokumentov, ako sú knihy, encyklopédie, patenty, multimediálne dokumenty, či hľadať adresy elektronickej
pošty, diskusné skupiny alebo firemné informácie. Jednotlivé vyhľadávače určené na hľadanie dokumentov sú pravidelne
aktualizované každé tri dni a je možné si ich personálne nastaviť, pridať alebo odobrať podľa vlastného uváženia. Program
používa okrem iných i svetové prieskumové stroje ako Altavista, Excite, Fast Search, Google, adresáre Open Directory Project,
Yahoo, alebo špecializované vyhľadávače, napríklad Education World, Britannica.com, MedicineNet.com, Scirus, Sciseek, Yellow
Pages a podobne. Užitočné je i využívanie jazykovo špecifických vyhľadávačov, ktoré prehľadávajú určitý teritoriálne
vymedzený webový priestor. Z európskych krajín je tu zastúpené napr. Belgicko, Holandsko, Poľsko, Portugalsko, Švédsko,
Francúzsko, Nemecko, Veľká Británia, Španielsko, Taliansko a stále sa vytvárajú nové teritoriálne kategórie.
Samotné ovládanie programu je veľmi intuitívne a ľahko zvládnuteľné i bez manuálu. Vstupná obrazovka sa skladá z
niekoľkých častí – z navigačnej lišty na výber kategórie, z okna s aktuálnymi výsledkami vyhľadávania, okna s
predchádzajúcimi výsledkami a okna, v ktorom sa zobrazuje vybraný dokument. Práca prebieha tak, že po voľbe vhodnej kategórie
je možné zadať požiadavku ako otázku v prirodzenom jazyku, ako frázu, prípadne jednotlivé kľúčové slová. Program automaticky
ponúka i odstránenie tzv. ”mŕtvych liniek”, čím sa výrazne zvyšuje relevancia výsledku. Výslednú množinu dokumentov je
takisto možné automaticky uložiť na disk a neskôr s ňou kedykoľvek pracovať v režime offline. V prípade väčšieho množstva
vyhľadaných webových stránok program ponúka nové hľadanie zadaním spresňujúcich výrazov, ktoré zjemňujú rešerš a zabezpečujú
relevantnejší výsledok. Pri zjemňovaní požiadavky sú k dispozícii operátory, napr. AND, OR, EXCEPT, NEAR a podobne. Súčasťou
programu je i slovník výrazov, z ktorého je možné vyberať termíny opisujúce hľadanú problematiku.
Súpis dokumentov, ktorý sa nachádza v jednom z okien, sa skladá z názvu dokumentu, adresy, relevancie danej stránky a
nástroja, ktorým bol dokument vyhľadaný. Zároveň v ďalšom okne programu sa zobrazuje aktuálna stránka dokumentu, čo umožňuje
súčasné prezeranie súpisu dokumentov i webových stránok (obr. 1). Okrem toho sa nachádza výsledná množina dokumentov v HTML
formáte v integrovanom okne prehliadača (Internet Explorer), kde sa dá s ňou veľmi efektívne ďalej pracovať (obr. 2).
Výsledné dokumenty sú zotriedené podľa relevancie, ale je možná voľba i podľa názvu, adresy alebo dátumu, a to zostupne alebo
vzostupne. Kvôli lepšej orientácii v súbore sú hľadané kľúčové slová zvýraznené. Najnovšia verzia COPERNIC 2001 Pro obsahuje
i veľmi výhodnú funkciu na preklad vyhľadaných dokumentov prostredníctvom online prekladača do deviatich jazykov. Súčasťou
programu je i funkcia, ktorou sa dajú posielať výsledky rešerše ako textový alebo HTML súbor elektronickou poštou.
Obr. 1 Vyhľadávací nástroj COPERNIC 2001 Pro s výsledkami prieskumu
Obr. 2 Výsledok rešerše v HTML formáte
Obr. 3 Výsledok informačného prieskumu v programe BullsEye Plus
Obr. 4 Vyhľadávač pre "neviditeľný" web
Jednou zo základných vlastností inteligentných agentov je ich mobilnosť a autonómnosť. Nielenže sú schopné voľne sa
pohybovať počítačovými sieťami a vykonávať úlohy na vzdialených miestach, ale môžu úlohy definované používateľom programu
plniť samostatne, bez jeho prítomnosti alebo usmerňovania. Používateľ raz špecifikuje, čo a kde má agent vykonávať, a ten
potom robí danú úlohu podľa výskytu vhodných podmienok. Takéto možnosti má i COPERNIC 2001 Pro, ktorý obsahuje ”sledovacieho”
agenta. Ide vlastne o virtuálneho robota, ktorý automaticky vykonáva informačný prieskum v určitých pravidelných časových
intervaloch kvôli aktualizácii špecifickej požiadavky a identifikuje zmeny, ktoré sa vyskytli. Monitoruje nelimitovaný počet
subjektov a oznamuje stav dokumentov na webových stránkach, ktoré sú predmetom používateľovho záujmu. Využívanie takéhoto
agenta je veľmi efektívne z hľadiska úspory času i redukcie pripojenia na internet. Je vhodný hlavne vtedy, keď je potrebné
spracovávať súčasne veľa požiadaviek, alebo zachytiť nové strategické informácie. Výsledky sú zasielané používateľovi
automaticky do jeho vlastnej alebo do viacerých e-mailových schránok.
Štatistiky uvádzajú, že programové produkty COPERNIC už využíva vo svete viac ako 11 miliónov používateľov a v
poslednom čase sa na internete objavila i ponuka bezplatne si nainštalovať českú verziu prostredia programu na adrese http://
Podobné funkcie ako COPERNIC 2001 obsahuje i produkt BullsEye Plus firmy Intelliseek Inc., ktorá je vedúcim providerom
infraštruktúry pre inteligentné portály. I táto firma ponúka bezplatnú verziu na svojej domácej stránke
www.intelliseek.com.
Produkt BullsEye je budovaný na jedinečnej, patentovanej technológii inteligentného agenta, ktorý pomáha internetovým
používateľom efektívne nájsť a zorganizovať získané informácie.V priebehu niekoľkých minút spracuje informačnú požiadavku,
pričom využíva vyše 800 najlepších svetových vyhľadávačov a databáz vo webovom priestore. Požiadavku spracuje s vysokou
relevantnosťou, pričom poskytuje rôzne hľadiská vyhľadávania i ľahkú zmenu využívaných vyhľadávačov. Taktiež je možné
využívať funkciu na odstránenie tzv. ”mŕtvych” liniek, analýzu alebo uloženie výsledku na pevný disk v textovom i HTML
formáte vhodnom na ďalšie spracovanie. Na obrázku č. 3 je vidieť prehľadné členenie obrazovky na jednotlivé okná, v ktorých
sa zobrazuje výsledok rešerše i kategórie vymedzujúce webový priestor. Veľmi komfortné a praktické je práve súčasné
prezeranie výsledného súboru i aktuálneho dokumentu.
Program umožňuje organizovať bookmark – adresár obľúbených liniek či ukladať rešeršnú stratégiu, vhodnú na opakované
vyhľadávanie v najnovších stránkach, ktoré pribudli na webe za posledný týždeň.
Súčasťou produktu BullsEye Plus je i program SurfSaver, ktorý umožňuje ukladať prezerané WWW stránky na disk a potom
neskôr v nich surfovať mimo pripojenia na internet, vyhľadávať určité výrazy a pod. Tento program je oceňovaný používateľmi
hlavne vtedy, keď vyhľadané dokumenty sú obzvlášť dlhé, ale pritom obsahovo hodnotné a je potrebné si ich uchovať a ľahko sa
v nich orientovať. Tento programový produkt je taktiež voľne prístupný a je možné si ho stiahnuť na adrese
www.surfsaver.com.
Keďže firma Intelliseek Inc. je tvorcom i niekoľkých ďalších vyhľadávacích nástrojov, sú k dispozícii i v rámci
programu BullsEye Plus. Ide o špecializovaný vyhľadávač zameraný na oblasť ”neviditeľného” webu pod názvom InvisibleWeb.com
(obr. 4.) a metavyhľadávací nástroj ProFusion.
Nevýhodou obidvoch vyhľadávacích nástrojov na báze inteligentných agentov COPERNIC 2001 i BullsEye je, že napriek
veľkej kapacite vyhľadávačov je pri niektorých požiadavkách výsledná vyhľadaná množina redukovaná na minimum, pretože systémy
vyberajú stránky podľa svojich hodnotiacich kritérií, takže následne je potrebné informačný prieskum doplňovať a spracovávať
prostredníctvom ďalších, hlavne teritoriálne alebo tematicky orientovaných vyhľadávačov. Napriek tomuto nedostatku, že
výsledok v určitých prípadoch vykazuje neúplnosť vo vzťahu k množstvu informačných zdrojov v prostredí WWW, však patria medzi
desiatku najžiadanejších vyhľadávacích nástrojov vo svete, dokonca i vo svojich free verziách. Funkcie, ktoré sú obsiahnuté v
platených verziách, z nich robia špičkových informačných agentov zefektívňujúcich hľadanie kvalitných informácií na
internete, bez ktorých je orientácia v súčasnom prudko sa rozvíjajúcom WWW svete iba veľmi zdĺhavá a časovo náročná.