E-learning – elektronické vzdelávanie a spracovanie dokumentov

Zo Slovenska




Vývoj vzdelávania v informačnej spoločnosti

Informačná spoločnosť označuje ďalšiu etapu vývoja ľudstva, ktorú je možné dosiahnuť uplatnením nových
informačno-komunikačných technológií. Pre oblasť vzdelávania sa v tejto súvislosti začína používať pojem e-vzdelávanie,
e-learning. Tento pojem je potrebné rozlišovať v dvoch rovinách: ako technický systém a ako nový systém vzdelávania.
Technický systém e-vzdelávania zahrnuje všetky potrebné technické prostriedky informačno-komunikačných technológií pre
vzdelávanie, systém vzdelávania a novú technológiu vzdelávania s implementáciou technického systému. Spoločné pôsobenie
obidvoch systémov je základným predpokladom vytvorenia nového vzdelávania v informačnej spoločnosti.

Vývoj vo svete ukazuje, že trend vytvárania novej vzdelávacej formy, e-vzdelávania, nastúpil a je možné uviesť
nasledujúce dôvody na jeho uplatnenie:

Množstvo informácií, ktoré je potrebné zvládnuť, neustále narastá. Absorbovanie všetkých informácií prestáva byť vo
vzdelávacom procese dominantným a nahrádza sa rozvíjaním schopnosti učiť sa.

Znalosti získané v škole vystačia na čoraz kratšie časové obdobie, vzniká potreba kontinuálneho vzdelávania.

Spracovanie učebnej látky do multimediálnych kurzov a ich interaktívne študovanie zvyšuje kvalitu a rýchlosť získavania
vedomostí a zručností, dovoľuje študentovi prechádzať z pasívnej roly do aktívnej.

Konkurenčný tlak, ktorý vytvárajú predovšetkým americké univerzity, príchod slabších populačných ročníkov a zvyšujúca
sa mobilita študentov začína ohrozovať vysoké školy, ktoré sa bránia zmenám systému vzdelávania.

Ako prekážky realizácie služby e-vzdelávanie sa dnes dajú uviesť:

  • nedostatočná informačno-komunikačná infraštruktúra,
  • počiatočné finančné náklady realizácie,
  • zotrvačnosť súčasného vzdelávacieho systému, ako aj metodiky vzdelávania,
  • nedostatok znalostí o spôsobe implementácie služby e-vzdelávania a uskutočnenia ďalších potrebných zmien.

Uvedené prekážky sú skutočnosťou, ale sú zároveň výzvou na ich prekonanie a vyriešenie. Nie sú faktorom, ktorý
nastupujúci trend zabrzdí, iba ho môže spomaliť.


Zmeny vzdelávacieho procesu

Ak má byť výsledok vzdelávania iný ako doteraz, nemôže ho vytvoriť doterajší spôsob vzdelávacieho procesu. Znamená to,
že vzdelávanie dnešného storočia vyžaduje uskutočnenie nového vzdelávacieho procesu. Už dnes sa predpokladá uskutočnenie
nasledujúcich zmien:

Zmení sa spôsob vyučovania. Doterajší spôsob vyučovania uplatňoval a aj uplatňuje princíp reprodukcie vzdelávacích
obsahov študentom učiteľmi v klasickej škole. Študenti sa naučia základné znalosti, kto využívajú vo svojom ďalšom aktívnom
živote. Súčasné tempo vývoja informačných a komunikačných technológií dovoľuje uskutočniť zásadné zmeny vo vyučovacom procese
tým, že poskytuje možnosti na vytváranie nielen textových stránok, ale aj prezentácie vo forme multimediálnych kurzov. Tie
umožnia študovanú látku absorbovať rýchlejšie a lepšie ako klasická forma výkladu a textového či grafického
spracovania.

Multimediálne vzdelávacie kurzy môžu byť dostupné cez komunikačné siete, čo umožňuje študentom získavať aktuálne
vzdelávacie obsahy z viacerých zdrojov, v akomkoľvek čase a z akéhokoľvek miesta. Tým sa dá meniť čiastočne alebo v
niektorých prípadoch aj celkom charakter poskytovania služby vzdelávania na službu e-vzdelávania.

Možnosť prístupu k vzdelávacím multimediálnym kurzom cez komunikačnú sieť umožní kontinuálne vzdelávanie ľudí bez toho,
aby prerušili svoje pracovné povinnosti. Tento spôsob ďalšieho vzdelávania je v prudko sa meniacich podmienkach práce
nevyhnutný. Zároveň sa tak rozšíri okruh študentov, ktorí budú používať vytvorené kurzy.

Vzdelávacie inštitúcie a učitelia môžu prístupom k štúdiu cez komunikačnú sieť získať nielen miestnych študentov, ale
aj študentov z miest vzdialených. Tým sa dá zväčšiť ich pole pôsobenia, čo prinesie vyššiu efektivitu vzdelávania.

Zmení sa skladba pracovníkov zabezpečujúcich vzdelávací proces. Kým doteraz bol učiteľ tvorcom informačného obsahu,
prednášateľom a tvorcom študijných materiálov, vytvánie multimediálnych kurzov bude vyžadovať špeciálne profesie potrebné pre
tímovú prácu odborníkov z rôznych oblastí.

Súčasná zodpovednosť učiteľov za vedomostnú úroveň študentov sa prenesie na študentov samotných. Učiteľ sa stane viac
trénerom a poradcom študenta pri získavaní požadovaných vedomostí.

Zmeny vzdelávacieho procesu si vyžadujú riešiť najmä tieto oblasti:

  • informačno-komunikačné technológie pre vzdelávanie,
  • pedagogické postupy rešpektujúce použitie informačno-komunikačných technológií,
  • sociálno-kultúrne problémy vzdelávania.




Informačno-komunikačné technológie

Na význam pojmu informačno-komunikačné technológie vo vzdelávaní existuje veľa názorov. Mnohí zastávajú názor, že každý
spôsob elektronického spracovania informácie, ktorý sa dá použiť vo vzdelávaní, patrí k informačno-komunikačným technológiám.
Možno sem tak zaradiť video, audiokazetu, rovnako ako dnešnú službu www či CBT kurz na CD. Niet dôvodu tento názor neprijať.
Treba však poznamenať, že uvedené produkty sú v skutočnosti iba pomôckou pri uskutočňovaní existujúceho vzdelávacieho procesu
a skôr ide o elektronické učebné/didaktické pomôcky. Ich implementácia do vzdelávania, hoci existujú už niekoľko desaťročí,
žiadnu zásadnú zmenu vo vzdelávaní nepriniesla, iba ho v niektorých častiach zlepšila. Poslednou technológiou, ktorá
spôsobila zmenu vo vzdelávacom procese, je kníhtlač. Sprístupnila vzdelanie podstatne širšiemu počtu osôb, ale len vtedy, keď
sa zmenil systém vzdelávania a vznikli obecné školy.

Ak nová informačná spoločnosť vyžaduje iný prístup k vzdelávaniu, potom treba technické prostriedky
informačno-komunikačných technológií združiť a využiť inak. Typická štruktúra technického podsystému v systéme e-vzdelávania
je znázornená na obr. 1.


drozd.gif (6755 bytes)

Obr. 1 Technické nástroje e-vzdelávania

 

Technické nástroje potrebné na jej realizáciu sú:

  • koncové zariadenie (PC, aplikačný softvér),
  • sieťová infraštruktúra,
  • server (softvér, hardvér),
  • videokonferenčné zariadenie,
  • služby pre interaktívnu komunikáciu – telefónna služba, e-mail, talk…,
  • autorské systémy na spracovanie informačných obsahov.

Z procesného hľadiska môžeme rozdeliť úlohy, ktoré treba zabezpečiť, na infraštrukturálne a štrukturálne.
Infraštrukturálne úlohy vykonávajú:

  • prevádzkovateľ komunikačných sietí,
  • poskytovateľ služieb komunikačných sietí,
  • správa servera/databanky,
  • poskytovateľ koncového zariadenia,
  • poskytovateľ aplikačného softvéru,
  • poskytovateľ autorských systémov.

Štrukturálne úlohy vykonávajú:

  • učitelia,
  • tvorcovia informácie/obsahov,
  • producenti vzdelávania,
  • organizátori vzdelávania,
  • poskytovatelia služby vzdelávania,
  • študenti.


 




Pedagogika pre e-vzdelávanie

Hoci je úloha informačno-komunikačných technológií prvoradá a bez nej nemožno ísť ďalej, netreba tento problém
preceňovať na úkor riešenia problémov pedagogických. Vzdelávací proces v informačnej spoločnosti nebude predstavovať
automatizáciu vzdelávacieho procesu prostredníctvom počítača, bez priamej účasti realizátorov vzdelávania. Študent bude aj v
budúcnosti potrebovať motiváciu k štúdiu, radu, ako pri štúdiu postupovať, a sociológovia tvrdia, že i kontakt s inými ľuďmi.
Technológie nenahradia učiteľa, ale zásadne zmenia jeho úlohu. Nové technológie s pomocou učiteľa majú celý proces zmeniť a
prispôsobiť potrebám novej informačnej spoločnosti.

Pre takýto prístup je vhodný pedagogický postup označovaný ako konštruktívny. Vychádza z posledných poznatkov o
funkciách ľudského mozgu a zároveň rešpektuje budúce nároky na proces vzdelávania. Jeho hlavné zásady sú:

  • zvyšovanie vlastnej motivácie,
  • konkrétna samostatná práca, projekty,
  • zapájanie blízkeho a vzdialeného okolia do spolupráce,
  • hľadanie súvislostí medzi rôznymi poznatkami a predmetmi,
  • učenie sa na vlastných chybách,
  • zmena úlohy učiteľa z interpretátora na kouča.

Ak porovnáme dnešný spôsob realizácie vzdelávacieho procesu, musíme konštatovať, že je predovšetkým orientovaný na
interpretáciu informačných obsahov. Učiteľ prezentuje svoje vedomosti a zisťuje, či ich študenti dokážu správne reprodukovať.
Táto forma je určite v niektorých oblastiach nevyhnutná, ale sú oblasti, kde nie je vhodná. Získavanie informácií nebude
hlavnou úlohou vzdelávacieho procesu. Tie môžu byť uložené v správne spracovanom multimediálnom vyučovacom kurze. Hlavnou
úlohou učiteľov vďaka informačno-komunikačným technológiám bude vytvoriť také motivujúceho prostredie na kreatívnu prácu
študentov, ktoré ich dobre pripraví na život v informačnej spoločnosti. A to je ťažká úloha, ktorú musíme vyriešiť.




Sociálno-kultúrne problémy

Realizácia služby e-vzdelávania je celospoločenský problém. Nemožno očakávať jeho dosiahnutie samostatne každým
účastníkom vzdelávacieho procesu. Celospoločensky v našom ponímaní znamená úroveň vzdelávacích inštitúcií, ktoré možno
rozdeliť na dve základné formy:

  • školský systém,
  • podnikový systém.

Pre uplatnenie e-vzdelávania v týchto dvoch odlišných formách sú podstatné dva faktory:

  • legislatíva,
  • financovanie.

Školský systém je z hľadiska právnych a legislatívnych noriem zložitý a nie je jednoduché vytvoriť ho a ani meniť.
Naproti tomu podnikové vzdelávanie je záležitosťou samotného podniku. Jeho vytvorenie a zmeny v ňom si podnik vytvára sám.
Preto uplatnenie systému e-vzdelávania v podnikoch je z tohto pohľadu jednoduchšie. Ale aj v školskom systéme vzdelávania
postupne dôjde k zmenám. Podľa prognóz v Syracus Heral American [1] “v blízkej budúcnosti kvôli štúdiu na vysokej škole
nebude potrebné opúšťať ani byt. Priamo z bytu bude možné navštevovať aj viaceré vysoké školy. Toto všetko bude možné vďaka
širokopásmovému internetu, pričom sa predpokladá rýchle a trvalé pripojenie domácností. Fyzickú návštevu vysokej školy
nahradí rozšírená videokonferencia, priame štúdium univerzitných programov diaľkového vzdelávania.”

Druhý rozdiel pri uplatňovaní nových technológií je vo financovaní, ktoré je v školskom systéme nepriaznivejšie ako v
podnikoch. Napriek tejto situácii je e-vzdelávanie téma, ktorej sa treba venovať a riešiť ju aj v školách, pretože
potrebujeme byť nachystaní na čas, keď problémy finančné nebudú to, na čo sa môžeme vyhovoriť.

Bez ohľadu na to, o aký proces vzdelávania ide, prístup k riešeniu tohoto problému je úplne rovnaký. Pri základných
strategických úvahách o vytváraní služby e-vzdelávania treba mať na pamäti, že historický vývoj smeruje k informačnej
spoločnosti. Vybudovanie informačnej spoločnosti znamená, že všade, kde sa pracuje s informáciami, dôjde k zásadnej zmene
doterajšej práce s nimi.

Vzdelávací proces je jednoznačne práca s informáciami.

Informačno-komunikačné technológie umožňujú prostredníctvom svojich produktov informáciu v akomkoľvek type (hlas, text,
obraz, dáta) a v ich kombináciách zbierať, spracovať, triediť, vyberať, uchovať, prenášať a prezentovať.

Vo vzdelávacom procese sú využívané všetky typy informácie.

Zmeny, ktoré prináša globalizácia, sa dotknú každého, kto pracuje vo vzdelávacom procese. Úvahy o očakávaných zmenách
vedú k implementácii nových služieb informačno-komunikačných technológií. E-vzdelávanie je takouto novou službou vo
vzdelávacom procese.

Vzdelávací proces sa zmení na službu e-vzdelávanie.

Zámer implementovať službu e-vzdelávanie vo vzdelávaní musí byť v súlade so zámerom príslušného producenta
vzdelávania.

V súčasnosti sa [2] najviac pozornosti venuje vybudovaniu zodpovedajúcej sieťovej infraštruktúry, zabezpečeniu prístupu
k vysokorýchlostnej komunikačnej sieti, tvorbe multimediálnych vzdelávacích kurzov, avšak bez celkovej koncepcie riešenia
vzdelávacieho procesu. Projekty budovania informačno-komunikačnej infraštruktúry sú vytvárané podľa technologických a
finančných možností a nie na základe potrieb nového vzdelávacieho procesu. Tento prístup sa všeobecne nepovažuje za správny
pre implementáciu nových informačno-komunikačných služieb, a teda ani pre e-vzdelávanie. Vytváranie nových riešení vyžaduje
induktívny systémový prístup, ktorý je založený na overovaní mnohých čiastkových úloh, z ktorých sa neskôr vytvorí vhodný
implementačný postup.

Rozsah tohto článku neumožňuje vysvetliť princípy správnej implementácie informačno-komunikačných technológií do
systému vzdelávania. Preto odkazujeme čitateľa na ďalšiu literatúru, uvedenú v závere článku.

 


Informačné technológie pre spracovanie dokumentov

V súčasnosti neustále stúpa potreba spracovania veľkého množstva informácií – časopiseckých článkov, novinových
článkov, odbornej literatúry, korešpondencie, agentúrnych správ, vyhlášok, zákonov, príspevkov z konferencií na počítačových
sieťach atď., ktoré sú prístupné pro-stredníctvom počítača. Pre používateľov je väčšinou problémom, že nevedia, kde presne sa
nachádzajú pre nich zaujímavé informácie, alebo dokonca ani nevedia, či sa žiadané informácie v dostupných textoch vôbec
nachádzajú. V reálnom živote asi ťažko dosiahneme to, že sa všetci autori podriadia pravidlám stanoveným pre štruktúru textu.
Vzniká teda potreba nástrojov umožňujúcich rýchlu a ľahkú orientáciu v dokumentoch.

Vyvinuli sa dva hlavné smery hromadného spracovania údajov. Prvý z nich – tzv. rešeršné systémy – slúži na vyhľadávanie
bibliografických informácií. Tieto systémy sú základom tzv. dokumentografických informačných systémov (DIS). Zo začiatku boli
tieto systémy určené výhradne na spravovanie rozsiahlych bibliografických databáz obsahujúcich nie úplné texty dokumentov,
ale len sekundárne informácie, ako napr. meno autora, názov a abstrakt článku. Trendom posledných rokov je prechod k DIS,
ktoré obsahujú úplné texty dokumentov. Je dôležité si uvedomiť, že tieto texty nemusia byť rovnorodé, ale najrôznejšieho
druhu. Databázy obsahujúce texty môžu byť a zväčša sú značne rozsiahle.

Implementácia DIS vyžaduje špeciálne metódy prístupu k dátam. Rešeršné systémy či DIS boli pôvodne vyvíjané s cieľom
efektívne zvládnuť nárast spracovania dát v oblasti vedecko-technických informácií. Mnoho univerzitných, podnikových a
verejných knižníc v súčasnosti používa DIS, aby zaistili prístup k informáciám v knihách, časopisoch a ostatných
dokumentoch.

Druhým smerom sú tzv. faktografické databázy či faktografické informačné systémy (FIS), ktoré v prevažnej miere
spracovávajú údaje určené napr. pre podnikanie. Tu sa veľmi prejavuje snaha po integrácií databázového (faktografického)
sveta a sveta DIS.

Zásadný rozdiel medzi DIS a FIS spočíva v tom, že FIS ukladajú údaje do pevnej údajovej štruktúry. Umiestnenie údajov v
tejto štruktúre dáva údajom istú sémantiku. Napr. atribúty ako sú meno zamestnanca, číslo zamestnanca, adresa a plat môžu
modelovať zamestnanca podniku, pomocou čísla úlohy a čísla zamestnanca možno modelovať skutočnosť, že zamestnanec pracuje na
úlohe, t. j. možno modelovať vzťah. Sú tiež definované vzťahy medzi údajmi. Ďalšou vlastnosťou týchto systémov je, že sú
deterministické a vyhľadávanie v týchto systémoch sa uskutočňuje podľa presnej a úplnej špecifikácie podmienky. DIS pracujú s
málo štruktúrovanými údajmi. Na logickej úrovni môže byť v najjednoduchšom prípade štrukturálnou jednotkou dokument, ktorý
obsahuje text v prirodzenom jazyku so všetkými variabilnosťami, napr. v slovenčine s takým zložitým skloňovaním a časovaním,
synonymami, homonymami a pod. Bez lingvistickej znalosti vlastného textu predstavuje údaje s veľmi slabo definovanou
sémantikou.

V súčasných trendoch je text tiež chápaný štruktúrovane, napr. zborník – článok – kapitola – odstavec. Tieto objekty sú
ale opäť texty. Definovaná štruktúra v nich vytvára len isté usporiadanie. V DIS sa často používa technika klasifikácie.
Zatiaľ čo vo FIS je trieda objektov definovaná pomocou atribútov, podľa ich hodnôt objekt buď do danej triedy patrí, alebo
nepatrí, v DIS sa často uspokojíme len s tým, že objekty danej triedy sa týkajú len niektorých z týchto atribútov. Prvému
spôsobu sa hovorí monotetická klasifikácia, druhá je označovaná ako polytetická.

Systematicky organizovanú digitálnu reprezentáciu textových údajov, vrátane príslušných pomocných dátových štruktúr,
nazývame textovou databázou. Programové prostriedky na manipuláciu s týmito údajmi a ich bezpečné uchovávanie nazývame systém
riadenia textovej bázy údajov a oba komponenty dohromady budeme nazývať dokumentografický informačný systém. Primárne údaje v
textovej databáze sú zvyčajne predstavované kolekciou textov, ktorá sa môže i meniť v čase. Možno teda hovoriť o stave
textovej databázy či stave kolekcie.

Charakteristickou črtou DIS je spôsob práce, akým sú využívané. Účelom DIS je umožniť riešiť vyhľadávací problém, ktorý
možno formulovať takto: Nájsť k používateľskej požiadavke (dotazu) relevantné dokumenty.

Pri vyhľadávaní v týchto systémoch na rozdiel od FIS, žiaľ, používateľ väčšinou nevie, ako formulovať svoju požiadavku,
aby obdržal žiadaný (relevantný) dokument. Existujú dve formy vyhľadávania relevantných dokumentov: listovaním v databáze
(browsing) a formuláciou dotazu. Druhá možnosť znamená formulovať požiadavku v nejakom dotazovacom jazyku. Dotazom potom
možno, podobne ako vo faktografických databázach, chápať vyčísliteľnú funkciu Q, definovanú na stavoch kolekcie textov.
Dokumenty či iné jednotky textu tvoriace odpoveď na dotaz Q sa nazývajú hity. Hovorí sa, že dokumenty z odpovede vyhovujú
dotazu.

Používateľovi je dnes obvykle ako výsledok dotazu prezentovaný online dokument, čo môže byť bibliografická referencia
alebo abstrakt, ale tiež napr. ASCII verzia úplného dokumentu alebo dokonalejší súbor v postskriptovom formáte. V službe WWW
je možné objaviť i dokumenty, ktoré sú samy osebe riadené hypertextovo, t. j. je možné v nich nielen listovať lineárne
(dopredu, dozadu), ale zložitejším spôsobom, ktorý zodpovedá cestám po orientovanom grafe.

V súčasnosti sa pri vytváraní DIS uplatňujú nasledujúce disciplíny: matematika (logika, teória pravdepodobnosti, fuzzy
množiny, vektorové priestory), lingvistika (syntaktická analýza, sémantická analýza), databázové technológie ( dátové
modelovanie, databázové gramatiky a jazyky, dolovanie znalostí, dátové sklady), teória algoritmov (dátové štruktúry,
zložitosť algoritmov).

Podobne ako v modeli FIS je vhodné i s textmi pracovať na viacerých úrovniach abstrakcie, t. j. vedľa textov je vhodné
popísať i jeho schému pomocou zodpovedajúceho modelu. Táto schéma je vo svojich funkciách podobná schéme klasických databáz.
Model DIS je definovaný ako súbor pojmov či nástrojov pre:

  • reprezentáciu dokumentu (tvorí formálny popis informácie obsiahnutej v dokumente),
  • reprezentáciu dotazu (umožňuje špecifikovať formálne požiadavku na informáciu),
  • reprezentáciu pravidiel a procedúr umožňujúcich určiť zhodu medzi požiadavkou používateľa na informácie a dokumenty,
    ktoré vyhovujú tejto požiadavke.

To prináša určité výhody:

  • model DIS umožňuje precizovať metódu interakcie so systémom,
  • model DIS je základom pre dátové štruktúry, ktoré tieto interakcie podporujú.

Medzi prominentné modely DIS patrí v súčasnosti rozšírený Boolov model, vektorový model a model založený na
pravdepodobnostnom výbere. S modelom DIS sú spojené i zodpovedajúce metódy vyhľadávania. Podľa Schebera sú všetky tieto
metódy založené na dvoch princípoch:

1. Princíp vyhľadávania podľa umiestnenia. Ak je raz dokument ulože- ný na vhodnom mieste (polica v knižnici, riadok v
tabuľke, lístok v zá- suvke), je jednoduché ho v ľubovoľnom neskoršom čase vybrať. Hlavným zámerom je organizácia “vhodných
miest”, kde sú dokumenty uložené, alebo odkazov na tieto miesta (napr. indexy). Zodpovedajúce metódy využívajú údajové
štruktúry, ako sú klasifikácie a tezaury.

2. Princíp pravdepodobnostného usporiadania. Ak je odpoveďou na dotaz kolekcia dokumentov usporiadaná vzostupne podľa
klesajúcej pravdepodobnosti užitočnosti týchto dokumentov pre používateľa, pričom tieto pravdepodobnosti sú na základe
dostupných údajov odhadnuté čo najpresnejšie, potom celková efektívnosť DIS bude pre používateľa najlepšia, akú je možné na
základe takých údajov dosiahnuť.

V prvom prípade ide o organizáciu odkazov k dokumentom. S indexáciou úplných textov sa môžeme dostať k stovkám či
stotisícom odkazov. V logických modeloch, kde sa vychádza z predpokladu, že zadaný term (kľúčové slovo, deskriptor) implikuje
dokument nesúci relevantnú informáciu, t. j. term => dokument, môže byť takých odkazov neobmedzené množstvo.

Pravdepodobnostný princíp je nepochybne kvalitatívne vyššie než tradičný prístup pomocou umiestnenia. Možno ho
formulovať a dokázať i matematicky. V kontexte digitálnych knižníc má dokonca jasnú prioritu. Zdôraznime však, že metódy
vyhľadávania charakteristické pre jednotlivé princípy sa často prekrývajú. Nejde teda o dva disjunktné prístupy.
Pravdepodobnostný princíp má zrejme na kvalitu výberu informácií podstatný vplyv. Mieru uspokojenia používateľských dotazov
nazveme informatívnosťou DIS. Systémy uspokojujúce požiadavky používateľa sa nazývajú informatívne. Výskumníci sa snažia
zlepšiť informatívnosť DIS použitím informácií o štatistickom rozložení termov, t. j. frekvenciu termov v jednotlivých
dokumentoch, kolekciách dokumentov alebo v podmnožinách kolekcí dokumentov, ktoré sú pre dotaz relevantné. Distribúcia termov
sa využíva v kontexte štatistických modelov, ako je vektorový model, pravdepodobnostný model alebo model zhlukov dokumentov.
Pri použití týchto modelov je na základe informácií o distribúcií termov možno priradiť pravdepodobnosť relevancie každému
dokumentu v množine, ktorá je odpoveďou na dotaz.

Ohodnotenie dokumentu je dôležité v prípade, že je vybraný veľký počet dokumentov a používateľ by bol tak zavalený
veľkým množstvom informácií. Potom hovoríme o usporiadaní dokumentov (dokument ranking) charakteristickom pre
pravdepodobnostný prístup k vyhľadávaniu dokumentov. Ako prídavok k algoritmom na usporiadanie dokumentov je možno združovať
dokumenty na základe termov do tzv. zhlukov, ktoré obsahujú “príbuzné” dokumenty.

K vytváraniu DIS je tiež možné pristupovať z druhej strany, t. j. zdola od údajových štruktúr. Príkladom takéhoto
prístupu je model založený na súboroch signatúr.

Charakteristickou metódou pre vývoj DIS je experiment. Ukazuje sa, že vývoj DIS prechádza štádiami teória – experiment
– prax a späť. Cieľov v tomto cykle je stanovených niekoľko. Ide najmä o efektívne ukladanie a prístup k údajom a,
samozrejme, o najväčšiu mieru uspokojenia používateľa.

Modely či metódy DIS nesú so sebou mnoho heuristík, ktoré treba overovať na kolekciách textov. Príznačné je, že jedna
metóda vyhľadávania úspešná na jednej kolekcii nemusí byť použiteľná na kolekcii inej.

V súvislosti s rozšírením počítačových sietí a dostupnosťou informácií z rôznych informačných zdrojov vystupujú do
popredia rôzne informačné služby. Tieto služby sa v skorších DIS väčšinou spracovávali offline. Budeme o nich v súlade s
dnešnými trendmi uvažovať všeobecne v sieťovom prostredí.

Najčastejšou službou, ktorú poskytujú dnešné DIS, je možnosť zadať dotaz v dotazovacom jazyku, vyhodnotiť ho, posúdiť
mohutnosť výsledku, upresniť dotaz a po niekoľkých takýchto iteráciách požiadať o sprístupnenie zodpovedajúcich jednotiek
textu (článok, stránka, odstavec a pod.). Vyhľadávaciemu systému sa niekedy hovorí vyhľadávací stroj a používateľskému
rozhraniu prehliadač (angl. browser). Tieto služby teda riešia vyhľadávací problém. K otázkam súvisiacim s riešením
vyhľadávacieho problému, patrí najmä:

  • ako určiť, čo je relevantné a čo nie,
  • ako zaistiť efektívnosť spracovania,
  • ako zaistiť usporiadanie výstupov podľa relevancie.

V rozsiahlych systémoch, ako sú bázy článkov či výskumných správ, sú texty často zoskupované do databáz záujmových
oblastí, z nich len niektoré sú v danom čase dostupné. Používateľ sa teda stretáva s problémom dostupnosti zodpovedajúcej
databáze, na ktorú mieni aplikovať svoj dotaz. Ďalším problémom je, že dotaz prekrýva viac databáz, a tak je nutné ich nájsť
a dotaz realizovať na každú zvlášť.

V týchto prípadoch je vhodné ponúknuť vyššie služby než len výber informácií. Ide o služby, ktoré v klasickom poňatí
niesli názov Selective Dissemination of Information (SDI). Používatelia popíšu tzv. profil, čo je jeden alebo niekoľko
dotazov, ktoré sa ako celok vyhodnocujú v pravidelných časových intervaloch. Z hľadiska vývoja informačných zdrojov to
znamená, že všetky nové informačné pramene, ktoré pribudli od posledného spracovania, vstupujú do nového spracovania.

Základný problém v SDI nazveme priraďovacím problémom – nájsť k novému dokumentu D tie profily, pre ktoré je D
hitom.

Základné riešenie tohto problému predpokladá sekvenčné uloženie profilov. Profily sú spracovávané sekvenčne tak, že
každý profil P je testovaný oproti dokumentu D, t. j. kontroluje sa, či D vyhovuje nejakému dotazu z P. Tento štýl
poskytovania informácií budeme nazývať filtrovanie informácií (IF, z angl. information filtering). Program, ktorý tieto
činnosti zaisťuje, nazveme informačným filtrom.

Rozdielov, ktoré je možné objaviť pri porovnaní klasického vyhľadávania informácií a filtrovaním informácií, nie je
mnoho; ide vlastne o dve strany tej istej mince. Rozdiely sú skôr v poňatí:

  • kolekcia dokumentov (IR – skôr pevne danej, pomaly sa meniacej v čase, IF – dynamickej, rýchle sa meniacej),
  • požiadavky na spracovanie (IR – skôr náhodné dotazy, IF – dlhodobo formulované požiadavky),
  • v IR je častá i priama interakcia a vizuálne porovnanie,
  • v IR sú možné i modifikácie popisov textov (indexy) na rozdiel od IF, kde popisy zvyčajne vznikajú automatickou
    analýzou textu.

Medzi najnovšie smery sa radí tzv. extrakcia informácií. Ide o identifikáciu entít, atribútov a vzťahov medzi entitami
z textov uložených v databáze. V jednoduchých aplikáciách tak možno extrahovať napr. mená firiem, výrobkov, miest.

Literatúra

[1] Syracus Herald American, Progres 2000, Feb., 6., 2000

[2] Drozdová, M., Klimo, M. (1999) Metodika návrhu aplikácie Televzdelávanie, ISTEP 2000, Symposium Proceedings, Košice
2000, ISBN 80-88964-38-5

[3] Drozdová, M.: Implementácia nových informačno-komunikačných služieb, Habilitačná práca, Žilinská univerzita,
2001

Zdieľať:
Obsah čísla