Opis a prieskum prameňov. Smernica na podporu digitalizácie a spolupráce knižníc, archívov a múzeí. (edícia PULMAN)

Voľná príloha

pulobal.gif (9875 bytes)

OBSAH

ÚVOD K SLOVENSKÉMU VYDANIU
OPIS A PRIESKUM PRAMEŇOV
PRAKTICKÉ POKYNY: OPIS PRAMEŇOV
Metaúdaje
Opisy zbierok
Riadené slovníky a tezaury
Jednotné identifikátory
PRAKTICKÉ POKYNY: PRIESKUM PRAMEŇOV
Prehliadače
Zoznamy odporúčaných webových sídel
Vstupné brány a portály
Konzorciá
Komunitné informácie
Podpora vzdelávania
PRAKTICKÉ POKYNY: SPRIEVODNÉ TECHNOLÓGIE
XML
RDF
Z39.50
Žatva
Spracovanie obrazov
CBIR
VÝHĽAD
Sémantický web
Ontológie
Digitálny podpis
Webové služby
LINKY
Medzinárodné
Dánsko
Fínsko
Nemecko
Holandsko
Veľká Británia
USA

ÚVOD K SLOVENSKÉMU VYDANIU

PULMAN (Public Libraries Mobilising Advanced Networks)

PULMAN je projekt Európskej komisie určený pre verejné knižnice a ich spoluprácu s archívmi a múzeami. Oficiálne začal svoju činnosť 1. mája roku 2001. Program projektu sleduje tri základné línie:

1. premenu úlohy verejných knižníc v súlade s programom eEurope,
2. maximálne zlepšenie spolupráce knižníc, archívov a múzeí,
3. zlepšenie prístupu miestnych úradov k verejným knižniciam.

Do projektu je zapojených 26 európskych krajín vrátane Slovenskej republiky. Koordinátorom siete PULMAN je Jan Vaerenbergh z Mestskej knižnice v Antverpách, manažérom projektu siete Robert Davies (firma MDR Partners – Veľká Británia), na čele projektu stojí riadiaci výbor, ktorý úzko spolupracuje s virtuálnou radou projektu ( www.pulmanweb.org ). Garantom implementácie výsledkov projektu na Slovensku je Ministerstvo kultúry SR na čele s ministrom kultúry, koordinátorom je Ing. Alojz Androvič, PhD., z Univerzitnej knižnice v Bratislave.

Aktuálnou úlohou projektu PULMAN je zostavenie smerníc na podporu digitalizácie a spolupráce knižníc, archívov a múzeí na základe podkladov od národných koordinátorov (napr. informáciu o stave verejných knižníc na Slovensku pozri na www.pulmanweb.org/countries/SlovakRepublic.htm ), ktoré sú sprístupnené v elektronickej forme na stránkach webového sídla projektu ( www.pulmanweb.org) vo forme tzv. digitálnych metodických príručiek (Digital Guidelines Manuals). Národní koordinátori sú zároveň zodpovední aj za čo najrýchlejšie sprístupnenie výstupov projektu v jazyku tej-ktorej krajiny zapojenej do tohto projektu. Príručky majú byť sprievodcom súčasnej praxe a návodom na ďalší rozvoj v najrôznejších oblastiach činnosti verejných knižníc a ich súčinnosti s múzeami a archívmi. Zameriavajú sa najmä na riadiacich pracovníkov a tvorcov politiky. Vymedzujú základné pojmy, poskytujú širší prehľad v danej problematike a starostlivo vybraté odkazy na informácie dostupné cez webové stránky.

Tieto príručky sa členia podľa typu do troch skupín:

Spoločenské:

spoločenský prienik,
účasť na verejnej správe,
bezbariérový prístup a služby,
služby pre deti a školy,
podpora vzdelávania,
podpora podnikania,
prístup ku kultúrnemu bohatstvu,
prístup k hudbe a netlačeným materiálom;

Pre riadenie:

hodnotenie informačných služieb,
možnosti a zdroje financovania,

riadenie a modely spolupráce,
prístup k licencovaným materiálom,
technológie ochrany informačných práv;

Technické:

digitalizácia informačných prameňov,
integrované knižničné systémy,
multimediálne informačné služby,
distribučné kanály,
spracovanie informačných prameňov,
prispôsobovanie informačných služieb,
multilingválne informačné technológie.

Príručky majú tieto základné časti:

1. Zameranie smernice
2. Opis predmetu a prostredia
3. Prehľad súčasného stavu vo svete
4. Rozvojové trendy
5. Príklady z praxe

Na vydanie uvedených metodických príručiek v jednotlivých krajinách nie sú vyčlenené osobitné finančné prostriedky. Predpokladá sa, že preklad a postupné publikovanie zabezpečia jednotlivé krajiny vo vlastnej réžii.

Redakcia časopisu IT lib. Informačné technológie a knižnice (CVTI SR) sa rozhodla publikovať tieto smernice priebežne ako voľné prílohy k jednotlivým číslam časopisu. Súčasne vyzývame ostatné knižnice, aby prejavili iniciatívu a vybrali si podľa záujmu niektorú z vyššie uvedených smerníc a preložili ju. Originály v anglickom jazyku sú k dispozícii v redakcii.

Táto príloha obsahuje smernicu Opis a prieskum prameňov v preklade Ing. Alojza Androviča, PhD., z Univerzitnej knižnice v Bratislave.

Bolo by iste peknou ukážkou vzájomnej spolupráce, keby sme spoločnými silami dokázali preložiť a publikovať postupne všetky príručky, ktoré nám budú sprievodcami pri orientácii v spletitej pavučine zavádzania moderných technológií do knižničnej a informačnej praxe.

Redakcia IT lib

OPIS A PRIESKUM PRAMEŇOV

V tejto príručke sú opísané pojmy a problémy súvisiace s rastúcim objemom digitálneho obsahu sprístupňovaného v knižniciach vrátane metaúdajov, riadených slovníkov a tezaurov, prehliadačov, brán, XML a Z39.50.

Rámec

Rozvoj internetu umožňuje knižniciam sprístupňovať čoraz väčší objem digitálnych informácií rozptýlených v sieti internet. Knižničný personál by mal vedieť čo najlepšie v tomto digitálnom prostredí asistovať používateľom pri odkrývaní a vyhľadávaní informácií, ktoré potrebujú. Znalostná spoločnosť, celoživotné vzdelávanie a rastúci dôraz na interakciu so správnymi zložkami štátnej správy a samosprávy v elektronickej forme prikladá vyhľadávaniu informácií čoraz väčší celospoločenský význam. Kľúčovým problémom je interoperabilita digitálnych informácií.

Praktické pokyny

Odsek praktických odkazov sa člení na tri časti:

Opis prameňov: rôzne spôsoby opisu prameňov s cieľom zvýšiť presnosť informačného prieskumu, napr. metaúdaje, opisy zbierok, systémy riadených slovníkov, tezaurov a jednotné identifikátory.

Prieskum prameňov: prostriedky na vyhľadávanie a prieskum prameňov, t. j. prehliadače, portály, súborné katalógy, indexy komunitných informácií. Vyhľadávanie prameňov je sekundárne; ak sa jednotka metodicky opíše, metodicky pracujúci vyhľadávací nástroj poskytuje väčšiu šancu na jej vyhľadanie. Je to oblasť, v ktorej majú knižnice príležitosť na spoluprácu s inými organizáciami, napríklad vysokými školami, univerzitami a pod., na sprostredkúvanie lepšieho prístupu k ich zdrojom. Typickým dôsledkom je vzájomné otváranie fondov, poskytovanie služieb a sprístupňovanie katalógov týchto partnerov spoločným používateľom.

Sprievodné technológie: XML, RDF, Z39.50, spracovanie obrazov vrátane cbir, ontológie a sémantické mapy (topic maps), ktoré súvisia s danou problematikou.

Výhľad

V budúcnosti budú ľudia obklopení “inteligentnými” interaktívnymi a spoľahlivými strojmi schopnými individuálne reagovať. Technológie opísané v tejto príručke sú k dispozícii dnes, ich budúci vplyv si zatiaľ možno iba predstavovať. Ovplyvní domácnosti, školy, hotely, automobily, lietadlá – skrátka všetky oblasti života. Vplyv na knižnice a ostatné kultúrne inštitúcie bude veľmi veľký.

Poznámka prekladateľa: Predpokladá sa, že knižnice budú pristupovať k problematike opisu, vyhľadávania a prieskumu prameňov z rôznych štartovacích pozícií a že v niektorých prípadoch bude treba postupovať po krokoch. Príručky (smernice) možno využiť pri obstarávaní knižničných systémov a pri rokovaniach so zmluvnými partnermi a konzultantmi.

Politický zámer

Význam pre knižnice

Knižnice pôsobia v sieťovom informačnom prostredí. Rozvoj internetu umožňuje prístup k stále narastajúcemu objemu digitálnych informácií rozptýlených v internete aj z tej najmenšej knižničnej pobočky. Pracovníci knižníc by mali vedieť čo najlepšie pomáhať svojim čitateľom pri objavovaní a vyhľadávaní informácií, ktoré potrebujú. Znalostná spoločnosť, celoživotné vzdelávanie a silnejúci dôraz na elektronickú interakciu so štátnymi orgánmi prináša nárast požiadaviek na jednoduchý prístup k informáciám pre všetkých občanov.

Mnohé knižnice vytvárajú digitálny obsah samotné – či sú to knižničné WWW stránky alebo nový multimediálny obsah, ktorý je nezriedka podporovaný špecifickými digitalizačnými programami. Vzniká potreba správneho opisu tohto nového obsahu tak, aby sa dal používateľom ľahko vyhľadať a bol interoperabilný s ostatným digitálnym obsahom.

Technológie a normy v tejto oblasti sa stále zdokonaľujú a budú sa meniť a vyvíjať aj naďalej. Knižnice by mali poznať aktuálny stav rozvoja, aby sa vyhli nevhodnej alebo prekonanej technológii a štandardom.

Knižnice by mali zvládnuť túto problematiku na účely určovania priorít a plánovania svojho rozvoja a osobitne pri rokovaní o nových systémoch alebo zadávaní požiadaviek pre externých konzultantov alebo zmluvných partnerov.

Čo je interoperabilita?

Interoperabilita digitálneho obsahu predstavuje jeho opakovateľnú využiteľnosť, prenášateľnosť a pod. v rôznych sieťach, systémoch a organizáciách a čo najdlhšiu životnosť. Kľúčom na dosiahnutie interoperability sú normy – dohodnuté pravidlá a smernice na tvorbu, opis a správu digitálneho obsahu (pozri aj Reinventing the Wheel D-Lib Magazine Jan 2002 [/ www.dlib.org/dlib/january02/gill/01gill.html]).

Prečo je interoperabilita dôležitá?

Na to, aby sa dali jednoducho vyhľadávať rôzne typy (knihy, muzeálne artefakty) informácií z rôznych zdrojov, v rôznych katalógoch a v rôznych doménach (knižnice, múzeá a archívy).

Nové služby a úlohy

Sprístupňovanie prameňov cez internet, či už ich knižnica vytvorí nejakým spôsobom alebo získa (kooperácia, kúpa/prenájom ap.), má vplyv na kvalifikáciu personálu, potrebné školenia, ponuku služieb a spôsoby ich poskytovania. Knižnice musia rozhodnúť na miestnej úrovni o stratégii a prioritách rozvoja, koľko treba investovať a čo sa má robiť.

Nárast závislosti od digitálneho obsahu

Knižnice budú musieť spracovať rastúci objem pre čitateľov veľmi potrebných materiálov dostupných iba v elektronickej forme. Tieto pramene môžu byť drahšie ako tlačené dokumenty a môžu podliehať licenčnej kontrole distribútora alebo producenta. Licencovanie prameňov a zakladanie združení používateľov je veľmi vážnym problémom (pozri ďalej Konzorciá).

PRAKTICKÉ POKYNY: OPIS PRAMEŇOV

Knižnice by mali vybaviť svoje pramene a webové stránky metaúdajmi. Mali by zvážiť využitie XML.

Metaúdaje

Stručne možno metaúdaje definovať ako “štruktúrované údaje o údajoch”. Katalógový záznam knihy predstavuje metaúdaje opisujúce danú knihu. Webové metaúdaje vo forme konzistentnej štruktúry na opis webových stránok a iných digitálnych objektov vystúpili do popredia ako prostriedok na zvýšenie účinnosti a efektívnosti pri vyhľadávaní digitálnych prameňov v prostredí internetu. Štruktúra metaúdajov na opis knihy môže obsahovať napríklad tieto prvky: autor, názov, vydavateľ, dátum, ISBN, klasifikačný znak ap. V štruktúre metaúdajov pre webovú stránku môžu byť zas tieto prvky: názov, tvorca, predmet, opis a ďalšie. Viac informácií možno nájsť na stránkach Diffuse ( www.diffuse.org/meta.html).

Metaúdaje možno využiť na rôzne účely:

Metaúdaje na opis prameňov – na opis prameňov a umožnenie prieskumu. Jestvuje množstvo rôznych typov metaúdajov. Najznámejšie sú štruktúry typu Marc a Dublin Core:
- Marc (Machine Readable Cataloguing) je bibliografická metaúdajová schéma, ktorú rozvíja najmä Library of Congress. Súčasná verzia sa označuje MARC 21 ( www.lcweb.loc.gov/marc).
- Dublin Core je systém na opis “objektov podobných dokumentom”. Skladá sa z týchto 15 základných prvkov: 1. názov, 2. tvorca, 3. predmet, 4. opis, 5. vydavateľ, 6. prispievateľ, 7. dátum, 8. typ prameňa, 9. formát, 10. identifikátor prameňa, 11. zdroj, 12. jazyk, 13. relácia, 14. pokrytie, 15. správa práv ( http://dublincore.org/).
Metaúdaje archivačné – na podporu ochranných a archivačných činností. Problémom sa zaoberá napríklad projekt CEDARS, zameraný na ochranu digitálnych prameňov ( www.leeds.ac.uk/cedars/).
Metaúdaje právne – na vyjadrenie autorských práv v prameni (pozri stránky projektu Indecs, www.indecs.org).
Metaúdaje pre vzdelávanie – na pomoc pri správe prameňov vzdelávacích inštitúcií a manažmente virtuálneho vzdelávacieho prostredia, ako napr. záznamy o študentoch alebo opisy kurzov. Viac informácií o metaúdajoch na podporu elektronického vzdelávania (e-learning) ponúka webové sídlo Diffuse ( www.diffuse.org/eLearning.html).
Metaúdaje geospaciálne – na využitie v digitálnych mapách a geografických informačných systémoch (GIS). Na stránkach projektu Diffuse sú informácie o štandardoch na výmenu geografických informácií ( www.diffuse.org/gis.html).

Doménovo orientované metaúdaje sa vyvíjajú podľa špecifických požiadaviek jednotlivých oblastí. Napríklad:

Archívy – používajú štruktúry Encoded Archival Description EAD (http://lcweb.loc.gov/ead/) alebo General International Standard Archival Description ISAD(G) ( http://lcweb.loc.gov/ead/). Viac informácií o štandardoch pre archívy možno nájsť na už spomínaných WWW stránkach ( www.diffuse.org/archives.html).

Múzeá – CIMI je medzinárodné konzorcium inštitúcií pre kultúrne dedičstvo. Podporuje spoluprácu na vývoji a používaní štandardov muzeálnych informácií ( www.cimi.org/). Viac informácií o štandardoch pre múzeá možno nájsť na www.diffuse.org/archives.html.

Government – Government Information Locator Service/Global Information Locator ( GILS) sa používa v mnohých krajinách na opis oficiálnych dokumentov a vládnych informácií ( www.gils.net/about.html). Preferuje sa štruktúra Dublin Core. Skupina expertov Dublin Core Metadata Initiative (DCMI) založila pracovnú skupinu Government Working Group (http://dublincore.org/groups/government). Viaceré vlády (Veľká Británia, Austrália, Kanada, USA, Dánsko) vydali v tomto smere záväzné smernice pre organizácie verejného sektora vrátane knižníc. Príkladom sú dokumenty Electronic Government Interoperability Framework (e-gif), URL: www.e-envoy.gov.uk/publications/frameworks/egif4/egif4.htm, a Electronic Government Metadata Standard (e-gms), URL: www.e-envoy.gov.uk/publications/guidelines/metadata/index.htm, ktoré vydal úrad e-Envoy’s Office vo Veľkej Británii ( www.e-envoy.gov.uk/index.htm). Prvá verzia e-gms sa opierala o jednoduchý Dublin Core, druhá používa kvalifikovaný formát Dublin Core s niektorými doplnkovými prvkami na správu dokumentov.

Opisy zbierok

V rozsiahlych kooperačných projektoch môže vzniknúť potreba použitia metaúdajov na opis fondov na úrovni zbierok (collection level description) zúčastnených knižníc (rozsah, úroveň, hĺbka, jazyk a pod.). Príkladom je projekt UKOLN Collection Description Focus ( www.ukoln.ac.uk/cd-focus/), kde sa opisuje metodika využitia pre vysoké školy vo Veľkej Británii, a tiež smernice NOF guidelines ( www.ukoln.ac.uk/nof/support/) ako vzor použitia tejto metodiky pre správne orgány financujúce verejné knižnice.

Riadené slovníky a tezaury

Metaúdaje sú len jednou časťou riešenia. Aby sa dal vykonávať účinný prieskum v distribuovaných prameňoch, treba zapisovať metaúdajové prvky v konzistentnom tvare. Na tento účel treba prijať rozpoznateľné kódovacie schémy alebo riadené slovníky na klasifikáciu. Dobrým príkladom sú predmetové heslá Library of Congress Subject Headings.

Tezaurus je riadený slovník, kde sú termíny usporiadané do hierarchií, ktoré vyjadrujú vzťahy širších alebo užších termínov, ekvivalenciu alebo čiastočnú zhodu a kde sú vyznačené preferované a nepreferované termíny (na kontrolu synoným). Obsahujú obvykle rozsiahle poznámky a ďalšie informácie. Na tezaury sa vzťahujú dve normy: ISO 2788, 1986 Guide to establishment and development of monolingual thesauri; a ISO 5964, 1985 Guide to the establishment and development of multi-lingual thesauri.

Webové sídlo múzea Getty Museum (USA) poskytuje niekoľko tezaurov: Gettyho Art and Architecture Thesaurus ( www.getty.edu/research/tools/vocabulary/aat/) a Thesaurus of Geographic Names ( www.getty.edu/research/tools/vocabulary/tgn). Pani Traugott Kochová spracovala zoznam vybraných riadených slovníkov, tezaurov a klasifikačných schém ( www.lub.lu.se/metadata/subject-help.html).

Jednotné identifikátory

Aby sa každý zdroj dal na internete nájsť, mal by mať jednotný identifikátor alebo adresu, ako napr. URL (Uniform Resource Locator). Pri zmene umiestnenia prameňa sa však URL mení a to sťažuje vyhľadávanie. URN a tiež DOI (Digital Object Identifier) sú trvalé identifikátory, ktoré riešia tento problém ( www.doi.org/). Jednotné identifikátory opisuje Paul Miller ( www.ariadne.ac.uk/issue24/metadata/intro.html).

PRAKTICKÉ POKYNY: PRIESKUM PRAMEŇOV

Prehliadače

Knižničný katalóg je kľúčom k zbierke jednotlivej knižnice. Mnohé knižnice dnes poskytujú svojim čitateľom prístup do internetu. Hľadajú sa najvhodnejšie spôsoby sprístupňovania týchto sieťových prameňov pre používateľov. Najjednoduchším spôsobom je poskytnutie prístupu prostredníctvom niektorého z dostupných prehliadačov. K dispozícii je viacero typov:

plnotextové prehliadače s možnosťou prieskumu pomocou kľúčových slov, ako napr. Altavista (altavista.com), Google ( www.google.com/);
indexové/adresárové prehliadače, pomocou ktorých si používateľ hľadá postupne cestu v rámci spresňujúcich ponúk, ako napr. Yahoo;
Meta/Multi prehliadače, ktoré dovoľujú spustiť súbežný prieskum viacerými metódami, ako napr. ixquick ( www.ixquick.com/);
prehliadače na báze prirodzeného jazyka , v ktorých sa prieskum zadáva formou otázky, napr. Ask Jeeves ( www.ask.co.uk/).

Viac informácií o prehliadačoch rôznych typov uvádza www.philb.com a http://searchenginewatch.com. Tieto sídla informujú o prieskume internetu, analyzujú vývoj prehliadačov a pomáhajú správcom webových sídel zlepšovať viditeľnosť vystavovaných prameňov na internete.

Zoznamy odporúčaných webových sídel

Knižnice majú možnosť pomáhať svojim čitateľom aj zostavovaním zoznamov vytypovaných webových stránok. Stránky sa obvykle vyberajú podľa stanovených kvalitatívnych ktitérií (napr. kvalitatívne kritériá navrhnuté v rámci projektu Desire ; www.desire.org/handbook/2-1.html) a zostavujú podľa predmetu. Dobrým príkladom môže byť projekt RDN (Resource Discovery Network) na www.rdn.ac.uk/. Údržba a aktualizácia takýchto zoznamov je však časove náročná. Knižnice by mali v tejto oblasti spolupracovať. Služba OCLC CORC (Cooperative Online Resource Catalog Service) na www.oclc.org/corc je dobrým príkladom kooperačnej iniciatívy na tvorbu opisu stránok (pozri aj portály).

Vstupné brány a portály

Rozdiel medzi vstupnou bránou (gateway) a portálom (portal) nie je veľmi zreteľný. Vstupná brána je obvykle zložená zo súborov anotovaných liniek k iným webovým stránkam, ktoré boli vybrané zostavovateľmi. Používateľ má k dispozícii výber ponúk, ktoré sú usporiadané od všeobecnejších po špecifické predmety. Takéto webové sídla sú veľmi užitočné pri prieskume, nakoľko šetria veľa času pri hľadaní daného predmetu pri zachovaní požadovanej kvality informácií. Portály poskytujú okrem podobných zoznamov liniek navyše špeciálne informačné služby. Napríklad poskytujú online transakčné služby rôzneho druhu, online nákup ap. Podporujú tiež integrovaný prieskum obsahu webových stránok a sídel.

Príklady najviac používaných vstupných brán:

všeobecné – www.yahoo.com pokrýva celý World Wide Web formou ponúk;
vládne – www.ukonline.gov.uk je abecedne usporiadaný zoznam webových sídel vlády Veľkej Británie a samosprávy , www.premier-ministre.gouv.fr je vstupnou bránou k agentúram francúzskej vlády;
akademické – www.rdn.ac.uk slúži na podporu vysokoškolského vzdelávania vo Veľkej Británii. RDN (Resource Discovery Network) je sieťou individuálnych predmetových vstupných brán alebo rozbočovačov (hubs);
knižničné – UNESCO libraries portal ( www.unesco.org/webworld/portal_bib);
múzejné – 24 Hour Museum ( www.24hourmuseum.org.uk/);
archívne – the UNESCO archives portal ( www.unesco.org/webworld/portal_archives/pages/index.shtml);
kultúrne – European culture portal ( http://europa.eu.int/comm/culture/index_en.htm);
iné – www.teldir.com (online telefónne zoznamy).

Na tvorbu a údržbu predmetových vstupných brán je k dispozícii špecializované programové vybavenie (napr. ROADS – Resource Organisation and Discovery in Subject based services, www.roads.lut.ac.uk/index.html). Komerčné spoločnosti ponúkajú tiež portálový softvér, napr. Internet Portal Suite www.ihs.de, Vignette ( www.vignette.com/), SAP Portal ( www.sapportals.com/), Plumtree ( www.plumtree.com/) a pod. Niektoré knižnice pristúpili k budovaniu vlastných vstupných brán a portálov ( www.caslin.sk).

Konzorciá

Konzorciá (clumbs) sú združenia organizácií, obvykle verejné knižnice, akademické knižnice a iné organizácie (napr. múzeá a archívy), ktoré sa dohodnú na konzorciálnom nákupe prameňov (najmä elektronických), medziknižničnej výpožičnej službe a prepojení vlastných katalógov navzájom. Významným prvkom konzorcií je vytvorenie spoločnej vstupnej brány alebo portálu, ktorý obvykle zahŕňa možnosť simultánneho prieskumu v pripojených katalógoch alebo databázach zúčastnených organizácií. Na dosiahnutie tejto funkcionality treba prijať spoločné formáty metaúdajov, do ktorých sa premietajú (mapujú) opisy prameňov zúčastnených partnerov. Na podporu tohto druhu aktivít sa vyvinulo viacero profilov, napríklad Bath Profile a ONE-2 Profile. Z39.50 alebo XML sa využíva na prieskum rôznych katalógov alebo databáz. Licencovanie a copyright rozličných elektronických prameňov sprístupňovaných v rámci konzorcia predstavuje pomerne náročný problém.

Komunitné informácie

Rada vyššieho územného celku Essex County Council vo Veľkej Británii je protagonistom rozvoja distribuovaného komunitného informačného systému (comunity information system). Namiesto tradičnej centralizovanej bázy komunitných informácií Essex Online, ktorá sa vybudovala v rámci projektu SEAMLESS – www.seamless.org.uk/, sa využíva Z39.50 a metóda žatvy (harvest) na prieskum databáz a webových sídel zúčastnených organizácií vo forme jediného integrovaného prieskumu (je známy pod pojmom “deep integration”). Vyše 30 miestnych organizácií (samospráva, univerzity a kolégiá, obchodné agentúry, zdravotnícke zariadenia, služby, miestne periodiká, dobrovoľné agentúry a podobne) poskytujú v súčasnosti svoje údaje do systému a ich počet rýchlo narastá.

Aby bolo možné vykonávať prieskum distribuovaných databáz, prijali partnerské organizácie jednotný profil metaúdajov založený na e-gms ( www.govtalk.gov.uk/ interoperability/metadata_document.asp?docnum=524), ktorý sa opiera o Dublin Core ( http://dublincore.org/), a spoločný tezaurus na priraďovanie predmetových deskriptorov. Essex získal nedávno grant New Opportunities Fund ( www.nof.org.uk/) na rozšírenie svojho systému v celoštátnom rozsahu v spolupráci s ďalšími informačnými producentmi, ako je nhsDirect Online ( www.nhsdirect.nhs.uk/), aby bolo možné poskytovať verejné informačné služby v ďalších 8 VÚC, v ktorých žije 6 miliónov obyvateľov (pozri aj webové sídlo seamlessUK – www.seamless-uk.info/).

Podpora vzdelávania

Niektoré verejné knižnice začínajú spolupracovať s inými organizáciami, kolégiami, univerzitami na zlepšení podmienok pre vzdelávajúcich sa. Obvykle sa dohodne vzájomný prístup k fondom a službám, čomu pomáha zavedenie jednotného knižničného preukazu. Knižničné katalógy sa prepájajú a vyvíjajú sa systémy na sieťový prieskum všetkých pripojených prameňov, katalógov a databáz. Príklady: Libraries Access Sunderland Scheme ( www.lash.sunderland.ac.uk/) a glasgovský Digital Library project ( http://gdl.cdlr.strath.ac.uk/).

Vo Veľkej Británii vyvíja výbor Joint Information Services Committee ( JISC – www.jisc.ac.uk/) distribuovaný systém Distributed National Educational Resource ( DNER – http://www.ariadne.ac.uk/issue26/dner/) na poskytovanie informácií a prameňov na podporu výskumu a vzdelávania. Je to veľmi rozsiahly inovačný projekt, ktorý rozvíja ideu RDN predmetových portálov a poskytovania informačných prameňov prostredníctvom informačných sietí.

Mnohé vysokoškolské knižnice sa zapojili do rozvoja vzdelávacích webových sídel, tzv. Managed alebo Virtual Learning Environments (MLEs, VLEs). UKOLN vo Veľkej Británii navrhol metaúdaje Metadata Education Group (MEG) na využitie a podporu týchto systémov ( www.ukoln.ac.uk/metadata/education/). Verejné knižnice majú vzhľadom na svoje poslanie príležitosť zapojiť sa najmä v oblasti podpory formálneho a celoživotného vzdelávania.

PRAKTICKÉ POKYNY: SPRIEVODNÉ TECHNOLÓGIE

XML

Extensible Mark-up Language (XML) je následníkom HTML. Poskytuje oproti HTML rad výhod, hlavný rozdiel spočíva v oddelení obsahu a prezentácie. Pracovná skupina W3C zostavila desatoro ( .w3.org/XML/1999/XML-in-10-points ), v ktorom sa opisujú základné vlastnosti XML. Viac informácií poskytuje webové sídlo sekcie xml section of the W3C ( www.w3.org/XML/) alebo sídlo XML ( .xml.com/ ).

Na XML sa sústreďuje množstvo výskumných a vývojových aktivít. Informácie o nástroji na vyhľadávanie XML xpath možno nájsť na adrese W3C XML Query Group ( www.w3.org/XML/Query). Knižnice môžu zvážiť prechod na XHTML ( www.ariadne.ac.uk/issue27/web-focus/). Používanie metaúdajov a XML a súvisiace problémy a obmedzenia, ako aj možnosť ich využitia na spoločné využívanie informácií v rôznom kontexte sa opisuje v správe UKOLN ( www.ukoln.ac.uk/nof/support/help/papers/metaxml.htm).

RDF

Resource Description Framework (RDF) dovoľuje kódovanie, výmenu a opakované využitie štruktúrovaných metaúdajov, ktoré je založené na využití XML ako výmennej syntaxe. Týmto spôsobom sa podporuje integrácia rôznych aplikácií, počnúc knižničnými katalógmi a globálnymi adresármi až po syndikáciu a agregáciu správ, programového vybavenia a obsahu, osobných hudobných zbierok, fotografií a udalostí.

RDF dovoľuje tvorbu výrokov (statements) o prameňoch (resource) vo forme súboru vlastností (properties), ktoré zodpovedajú danej schéme (schema). Výroky sa zaznamenávajú v prvkoch opisu rdf: Description XML elements.

Mimoriadna účinnosť RDF spočíva v tom, že sa zakladá štrukturálny rámec na podporu konzistentného a spoľahlivého kódovania a výmeny metaúdajov, čo umožňuje výmenu jednotlivých súborov metaúdajov na opis prameňov definovaných rôznymi komunitami. Navyše RDF poskytuje nástroje na publikovanie okom čitateľných a aj strojovo spracovateľných slovníkov určených na povzbudenie a opakované využívanie a rozširovanie metaúdajovej sémantiky v rámci rôznych informačných komunít (pozri an introduction to RDF – www.dlib.org/dlib/may98/miller/05miller.html). V opise RDF sa niekedy ako analógia uvádzajú slibraries ( www.xml.com/pub/a/98/06/rdf.html). Technické informácie sa uvádzajú aj na adrese W3C RDF ( www.w3.org/RDF/). Príkladom komunitného informačného systému, v ktorom sa využíva na kódovanie metaúdajov RDF, je systém seamlessUK ( www.seamless-uk.info/).

Z39.50

Z39.50 je medzinárodný protokol (ISO 23950, 1998) na informačný prieskum, ktorý dovoľuje prieskum (obvykle vzdialený) heterogénnych databáz a vyhľadávanie údajov cez jednotné používateľské rozhranie. Z39.50 definuje štandardný spôsob komunikácie dvoch výpočtových systémov pri spoločnom využívaní informácií. Protokol, určený a navrhnutý na podporu vyhľadávania a prieskumu rôznych typov dokumentov (textových, bibliografických, obrazových a multimediálnych), zodpovedá architektúre klient-server a je plne využiteľný v internete. Dovoľuje používateľský prieskum katalógov, databáz jediným integrovaným dotazom.

Poznámka: Zatiaľ čo sa dotazovacie jazyky XML stále vyvíjajú, Z39.50 sa prednostne využíva v systémoch poskytujúcich komplexný distribuovaný prieskum.

Žatva

Žatevné programy sú nástrojom na zber údajov, napríklad metaúdajov zo zoznamu vybratých webových stránok vytypovaných organizácií. V projekte Seamless project ( www.seamless-uk.info/) sa prostredníctvom žatvy (harvest) vytvára indexový súbor (index file), ktorý systém využíva pri hľadaní odpovede na používateľský dotaz. Výsledky sa následne zlučujú z výsledkami prieskumu pomocou protokolu Z39.50 a prezentujú sa používateľovi ako spoločný zoznam hitov. Kliknutím na niektorý z výsledkov sa otvára príslušná webová stránka (v prípade žatvy) alebo záznam z bázy údajov (v prípade Z39.50).

Na princípoch “žatvy” sa zakladá iniciatíva Open Archives Iniatiative (OAI, www.openarchives.org/), ktorá je kooperačným úsilím zameraným na uľahčenie vyhľadávania informácií cez WWW, založeným na vývoji a používaní interoperabilných štandardov (interoperability standards). Má potenciálny význam pre muzeálnu oblasť (pozri Museums www.archimuse.com/mw2001/papers/perkins/perkins.html).

Spracovanie obrazov

Vyhľadávanie obrazových dokumentov sa doposiaľ zakladá na prieskume textových deskriptorov alebo klasifikačných kódov a je často podporované špecializovaným programovým vybavením na spracovanie obrazov. Gettyho tezaurus AAT (Art and Architecture Thesaurus ( www.getty.edu/research/tools/vocabulary/aat/) má 120 000 termínov na opis objektov, textúrovaných materiálov, obrazov, architektúry a kultúrneho dedičstva. Obrazy možno klasifikovať aj pomocou systémov, ako je ICONCLASS ( www.iconclass.nl/) na umelecké diela a muzeálne výstavy; TELCLASS pre televíziu a video a sociálnu históriu a Industrial Classification pre muzeálne objekty.

Modernejšie systémy pracujú s obrazmi, ktoré nie sú slovne opísané.

CBIR (Content Based Image Retrieval)

CBIR alebo vyhľadávanie obrazov podľa obsahu nevyužíva indexovanie pomocou kľúčových slov. Obraz sa vyhľadá na základe inherentnej charakteristiky, ako je farba, textúra, uhol a pod. Napríklad obraz pláže bude mať modrú navrchu, žltú dole. Prebieha technická diskusia ( www.unn.ac.uk/iidr/report.html) o rôznych typoch CBIR. Jestvujú už aj komerčné systémy CBIR, napríklad IBM QBIC (Query by Image Content): obraz je opísaný pomocou farebných charakteristík a program podľa toho vyhľadáva ( www.qbic.almaden.ibm.com/), predmetovú charakteristiku obrazu zadať netreba. Ako ďalší príklad možno uviesť programový systém Excalibur’s Image retrieval, ktorý sa využíva na prezentáciu zbierok Hermitage Museum ( www.hermitagemuseum.org/html_En/07/hm7_41_1.html).

Opis a klasifikácia obrazov je témou diskusie (vo francúzštine) Cursus ( www.fas.umontreal.ca/EBSI/cursus/vol4no1/vezina.htm). Technické problémy ohľadne spôsobu spracovania obrazov sa uvádzajú na stránkach WWW sídla Diffuse ( www.diffuse.org/compress.html) . Uvádzajú a porovnávajú sa tu bezstratové a stratové formy uchovávania obrazov. Súbory reprezentujúce elektronické obrazy bez straty rozlíšenia sú rozsiahlejšie a pomalšie než tie, ktoré zahrnujú istú mieru straty.

VÝHĽAD

Sémantický web

Sémantický web je víziou, ktorú priniesol na prvých stránkych časopis Scientific American v máji 2001. Podľa pána Tima Bernersa-Lee, riaditeľa konzorcia World Wide Web Consortium (W3C), “The Semantic Web je sieťou údajov, ktorá sa podobá globálnej databáze. Zakladá sa na myšlienke, že cieľom WWW nie je slúžiť iba na komunikáciu medzi ľuďmi, ale zapojiť i stroje, ktoré by mali byť schopné zapojiť sa a pomáhať.” Kým sa však tento sen splní, má sémantický web ešte dlhú cestu pred sebou. Bude sa postupne budovať v rámci rôznych záujmových skupín. Reálny potenciál sémantického webu sa uvoľní vtedy, keď sa podarí vytvoriť príslušné programy na zber obsahu z rôznych prameňov a spracovať a vymieňať získané informácie pomocou príslušných programov.

Predpokladá sa, že sémantický web sa vymaní z virtuálneho prostredia a rozšíri možnosti reálneho sveta. Ilustratívnym príkladom je predstava webovej mikrovlnky, ktorá komunikuje s WWW ponukou výrobcu mrazených jedál, elektronickým chorobopisom majiteľa a vyhľadáva vhodný kuchársky recept na webových stránkach knižnice. Inou víziou je virtuálny obraz, ktorý na základe hlasového prejavu majiteľa (podľa jeho nálady) vyhľadá a zobrazí vhodný motív z príslušnej galérie alebo múzea, do elektronickej knihy uloží vhodný text z ponuky knižnice a z hudobného servera stiahne a spustí vhodnú hudbu. Táto predstava už dnes privádza klasických knihovníkov do zúfalstva.

Najdôležitejšie koncepcie, technológie, protokoly a štandardy na rozvoj Sémantického webu ( www.diffuse.org/semantic-web.html) sú už k dispozícii alebo na kratšej ceste: napríklad XML, RDF a tiež jednotná identifikácia.

Ontológie

Ontológiu možno charakterizovať ako formálny opis objektu a jeho vzťahov s okolím (inter-relationships). V kontexte sémantického webu, cieľom je umožniť strojom komunikovať navzájom celkom bez alebo len s obmedzeným zásahom človeka. Pozri Ontoweb ( www.ontoweb.org/) a Wonderweb ( http://wonderweb.semanticweb.org/). Na modelovanie ontológií je k dispozícii postupne čoraz viac pokrokovejších sémanticky založených prístupov:

Zoznam termínov (Term list) – nedefinované vzťahy;
Klasifikačná schéma;
Tezaurus – vnútorné a asociatívne vzťahy;
Topic maps – nový ISO štandard na opis poznatkových štruktúr a ich previazanie na informačné pramene. Poskytujú výkonné nástroje na navigáciu v rozsiahlych a prepojených telesách ( www.gca.org/papers/xmleurope2000/papers/s11-01.html). Namiesto replikácie vlastností knižného indexu tieto mapy ich zovšeobecňujú a rozširujú vo viacerých smeroch;
Ontologický jazyk (Ontology language) DAML+Oil – opis logických vzťahov ( www.daml.org/about.html) .

Význam ontológií narastá v systémoch na správu poznatkov a pri vývoji sémantického webu. Využívajú sa napríklad v systémoch elektronického obchodu (e-commerce) na opis výrobkov alebo služieb a tiež napríklad na opis a organizáciu digitalizovaných muzeálnych zbierok.

Digitálny podpis

Digitálny podpis je kľúčovou súčasťou verejnej infraštruktúry na vykonávanie elektronických transakcií a zabezpečenie ich dôveryhodnosti. Významnú úlohu má aj vo vývoji sémantického webu.

Webové služby

Webové služby sú pomerne novým konceptom, ktorý by sa mal rozvinúť v najbližších rokoch. Budú prvou manifestáciou systémov založených na sémantickom webe. Definície webových služieb sa zatiaľ líšia, mali by umožňovať tvorbu programových aplikácií bez vedomostí o tom, kto je používateľom, kde sa nachádza alebo čokoľvek iné o ňom (pozri www.diffuse.org/WebServices.html). V najbližších rokoch by sa mali rozvinúť webové služby, ktoré by mali byť ľahko pochopiteľné a používané automaticky používateľmi, verejnými knižnicami a automatmi alebo strojmi. Tieto služby by mali poskytovať externí poskytovatelia External Application Services Providers (ASPs). Webové služby sa opierajú o otvorené internetové štandardy.

Súbor štandardov a protokolov pre webové služby sa vyvíja a ich postupné prijímanie sa očakáva počnúc rokom 2002. Zahrňujú (okrem XML):

Jazyk Web Services Description Language ( WSDL) na jednotný opis webových služieb (which enables a common description of Web Services);

Metodiku opisu Universal Description, Discovery & Integration ( UDDI) na registráciu a opis informácií o obchodnej alebo inej entite a jej technického rozhrania;
Protokol Simple Object Access Protocol ( SOAP) na štruktúrovanú výmenu správ medzi programami a počítačmi.

Webové služby sa v súčasnosti rozvíjajú pod hlavičkou e-commerce. Predstavujú však potenciálne možnosti aj pre sektor verejných služieb. Napríklad rozhrania na prieskum budú dostupné ako webové služby verejných knižníc alebo externých poskytovateľov.

Budúcnosť v oblasti spracovania informácií prinesie nespočetné zmeny, ktoré zatienia dnešné primitívne metódy práce. Sofistikované personalizované robotické systémy budú priebežne prehliadať internet, budú využívať dostupné metaúdaje, kontrolované slovníky a jednotné identifikátory. Budú vyhľadávať presne to, čo budú ich používatelia chcieť, budú poznať ich potreby a budú to robiť za nich. Nebudú poskytovať redundantné informácie a nevynechajú nič, čo by mohlo byť v tom-ktorom prípade relevantné.

LINKY

Medzinárodné

IFLA štandard na bibliografický opis
http://www.ifla.org/VII/s13/pubs/isbd_m0602.pdf

Dánsko

BibHit

Katalóg prameňov na internete indexovaných pomocou metaúdajov. Kolaboračný projekt troch verejných knižníc – Hobro Public Library, Main Public Library of Aarhus a Silkeborg Public Library a jednej vedeckej knižnice – Library of the Aarhus School of Business.
http://www.bibhit.dk/info/english.htm

Fínsko

Link Library

Adresár prameňov na internete vybraných a opísaných knihovníkmi. Obsahuje vyše 6 000 liniek usporiadaných podľa fínskej verzie Dewey (ykl) a publikovaný vo fínskom a švédskom jazyku. Obsahuje tiež možnosti na metaprieskum knižničných katalógov prepojených s Link Library.
http://www.kirjastot.fi/linkkikirjasto/selaus.asp?kieli=suomi&hid=&language-id=

Nemecko

Národné katalogizačné pravidlá

Nemecké verejné knižnice prijali túto schému na opis prameňov: má 25 kategórií. Využívajú sa centrálne pripravované údaje, dodávané najmä Die Deutsche Bibliothek a EKZ Reutlingen.
http://www.ekz-bibliotheksservice.de/ekz/home.nsf/pages/startseite

Holandsko

OCLC PICA

Paralelný prieskum Holandského centrálneho katalógu a katalógov rôznych knižníc.
http://oclcpica.org/?id=2&In=uk

Veľká Británia

Co-East, združenie verejných knižníc na východe Anglicka
http://www.co-east.net/

Leeds Museums, website s ponukou virtuálnej prehliadky mestských múzeí
http://www.leedslearning.net/makingconnections/library/flashcheck.asp?platform=win

Glasgow digital library project
http://gdl.cdlr.strath.ac.uk/

Knižnice Access Sunderland ScHeme
http://www.lash.sunderland.ac.uk/

seamlessUK distribuovaný komunitný informačný systém
http://www.seamless-uk.info/

USA

Solinet

Členská sieť knižníc zameraná na zlepšenie prístupu k informáciám a efektívne riešenie informačného zabezpečenia vzdelávania, hospodárstvy a kvality života v regióne.
http://www.solinet.net/index.cfm

Opis a prieskum prameňov. Smernica na podporu digitalizácie a spolupráce knižníc, archívov a múzeí. (edícia PULMAN)

Zdieľať:

Číslo: 3/2002

Obsah čísla