Info mailom

Chcete pravidelne dostávať informácie o novinkách?

Elektronické informačné zdroje a knižnično-informačné systémy – aktuálne problémy a súvislosti

Autor: Jaroslav Šušol
Číslo: 3/2001 - Elektronické dokumenty
Rubrika: Hlavné články/ Main Articles
Kľúčové slová:

Problematike elektronických dokumentov sa nielen v zahraničnej, ale i našej odbornej literatúre v priebehu posledných rokov venovalo nemálo pozornosti. Je to oblasť, ktorá je v súvislosti s nárastom kapacity elektronickej komunikácie v spoločnosti a s výraznejším zapojením tohto typu dokumentov do tradičnej (spracovanie) či menej tradičnej (plnotextové sprístupňovanie elektronických zdrojov) knižničnej činnosti v neustálom vývoji – najmä otázky ich terminologického a typologického vymedzenia predstavujú v súčasnosti horúcu pôdu, po ktorej s rozpakmi a dosť neisto stúpa knižnično-informačná prax i teória. Súvisí to do značnej miery aj so skutočnosťou, že táto problematika ako objekt skúmania prestáva byť, na rozdiel od ”tradičných” dokumentov, výsostnou doménou knižnično-informačnej sféry, ale čoraz výraznejšie do nej zasahujú iné vedné či praktické odbory, ktoré sa tiež podieľajú na tvorbe, rôznych druhoch spracovania či na využívaní elektronických dokumentov, predovšetkým v sieťovom prostredí. Tento príspevok si kladie za cieľ zmapovať súčasnú situáciu v oblasti teoretických úvah okolo dokumentov v elektronickom prostredí a zameriava sa na tri základné okruhy otázok – prístupy k terminologickému vymedzeniu, typologickému rozčleneniu a vytypovanie niektorých základných vlastností elektronických dokumentov. Vychádza z analýzy našich, ale najmä zahraničných zdrojov k tejto problematike a odráža zmenu pozícií, ku ktorým dochádza v súvislosti s už spomenutým zinterdisciplinárnením prístupu k jej skúmaniu.

Dokumenty, zdroje, objekty

V oblasti knižnično-informačnej teórie sa elektronický dokument zvyčajne definuje ako prostriedok sociálnej komunikácie, ktorý sa od tradičných typov dokumentov (písomných, obrazových, zvukových) odlišuje nie obsahovými, ale formálnymi charakteristikami, najmä digitálnym spôsobom záznamu informácií a z neho vyplývajúcou väčšou nezávislosťou, oddeliteľnosťou obsahu dokumentu od materiálneho nosiča – počítačového pamäťového média, zväčša magnetického alebo optického (Šušol, 1998). Ako však vo svojich príspevkoch reflektujú už aj iní autori (Bratková, 1998) a ako naznačuje analýza zdrojov a diskusií z posledného obdobia, termín ”dokument” je v súvislosti s elektronickými zdrojmi pomaly na ústupe a používa sa len v kontexte dokumentov textových, resp. textovo-obrazových.

Príčiny tohto stavu treba zrejme hľadať v technológiách, ktoré v súčasnosti prevažujú pri tvorbe aj tých najbežnejších ”elektronických dokumentov” – hypertextové či hypermediálne diela, či už sú prístupné lokálne z CD-ROM-u, alebo prostredníctvom počítačovej siete, sa zväčša vytvárajú ako agregáty izolovaných počítačových súborov, ktoré sa vďaka funkčným možnostiam prehliadačov a definovaniu väzieb v procese ich tvorby ”účelovo” stretávajú na obrazovke používateľa. V sieťovom prostredí sú však takéto súbory zväčša individuálne vyhľadateľné pomocou rôznych internetových nástrojov a, čo je podstatnejšie, používateľ si ich môže prezerať aj mimo ich ”primárneho” kontextu. Samotné chápanie ”primárneho kontextu” je však tiež vcelku vágne, keďže ten istý počítačový súbor (obrázok a podobne) sa môže využiť ako čiastkový informačný zdroj v doslova neobmedzenom množstve dokumentov bez straty kvality a dokonca bez toho, aby musel byť fyzicky uložený na tom istom serveri ako sám dokument. Globalizácia par excellence!

Pomerne vypuklo sa však paradoxný stav v chápaní pojmu elektronický dokument prejavuje aj v spojení s takým tradičným dokumentovým typom, ako je napríklad monografia – v prípade rozsiahlejších diel sa jednotlivé kapitoly či podkapitoly často ukladajú ako samostatné súbory a ak jednotlivé časti nie sú starostlivo prepojené linkovým aparátom, ľahko sa môže stať, že používateľ si na sieti nájde jednu relevantnú kapitolu bez toho, aby čo i len tušil existenciu širšieho rámca, v ktorom je zasadená.

Aj z týchto dôvodov sa holistický dokumentový prístup k definovaniu objektov súčasného digitálneho sveta nahrádza parciálnym, ktorý rešpektuje častú roztrieštenosť tradičných dokumentov i existenciu nových druhov informačných zdrojov v počítačových sieťach. Na ich všeobecné označenie sa používa generický termín zdroje v spojení s viacerými adjektívami – elektronické zdroje, elektronické informačné zdroje, digitálne informačné zdroje alebo tiež termín elektronické/digitálne objekty.

RFC 2396, jeden zo základných normalizačných dokumentov na internete k problematike identifikácie, definuje zdroj ako ”čokoľvek, čo má identitu”, a zdôrazňuje, že nie všetky zdroje sa dajú nájsť na sieti (sic!). Zdroj sa považuje za konceptuálne mapovanie k entite alebo množine entít, pritom však nie nevyhnutne k entite, ktorá korešponduje s týmto mapovaním v konkrétnom čase. Takto zdroj môže zostať konštantný, aj keď sa jeho obsah – entity, s ktorými aktuálne korešponduje – mení v čase za predpokladu, že konceptuálne mapovanie sa v tomto procese nezmenilo (Berners-Lee, 1998).

V OCLC príručke pre katalogizáciu internetových zdrojov sa elektronický zdroj (Weitz, 2000) definuje ako manifestácia (verzia) diela kódovaná na spracovanie v počítači – je uložená na médiu, ktoré je prístupné priamo alebo na diaľku; niektoré elektronické zdroje môžu vyžadovať použitie periférneho zariadenia pripojeného k počítaču (CD-ROM...). Zaujímavou a zároveň diskutabilnou súčasťou definície je konštatovanie, že k takto chápaným elektronickým zdrojom nepatria tie zdroje, ktoré nevyžadujú využitie počítača, napr. hudobné disky alebo videodisky. Ak si uvedomíme, že mikroprocesory sú dnes štandardnou súčasťou prevažnej väčšiny elektronických zariadení a že súčasné PC sú schopné prehrávať aj tieto typy zdrojov, sa toto obmedzenie nezdá relevantné.

Keďže v elektronickom sieťovom prostredí sa knižnice čoraz tesnejšie identifikujú aj s archívnymi funkciami, spomeňme ešte jeden termín, informačný objekt, ktorý sa okrem iného rozpracováva aj ako súčasť projektu DSEP (Deposit system for electronic publications – Depozitný systém elektronických publikácií), v rámci referenčného modelu OAIS (Open archival information system – Otvorený systém archívnych informácií). V rámci tohto modelu (Standards, 2000) sa definuje informačný balík (information package) ako spojenie PDI (preservation description information – informácie na uchovanie) a informačného objektu, ktorý tvoria reprezentačné informácie a samotný digitálny objekt. Pod informačným objektom sa v tomto prípade teda rozumie digitálny objekt obohatený o určité metaúdaje, v danom kontexte zamerané na archívne funkcie. Aplikáciou tohto modelu na podmienky knižnično-informačnej inštitúcie si veľmi ľahko vieme odvodiť informačný objekt, ktorý popri samotnom digitálnom objekte obsahuje metaúdaje bibliograficko-popisného charakteru1.

Vlastnosti elektronických zdrojov

Elektronické zdroje vykazujú celý rad charakteristík, ktorými sa odlišujú od tradičných dokumentov. Okrem pomerne často spomínaných nových rozmerov v oblasti kopírovania, editovania a prenosu (Šušol, 1998) je v kontexte komunikačného procesu zaujímavá množina aspektov, ktorú možno súborne nazvať integrita digitálnych informácií (Preserving, 1996). Zaraďujeme sem črty informačného objektu, ktoré ho definujú ako celistvé a jednotlivé dielo – obsah, stálosť, identifikácia, pôvod a kontext.

1. obsah

Obsah sa vo všeobecnosti považuje za najdôležitejšiu vlastnosť informačného objektu, za jeho raison d’etre. V elektronickom prostredí možno obsah definovať na niekoľkých úrovniach abstrakcie, pričom platí, že nižšia úroveň implicitne obsahuje, resp. je nositeľom aspektov úrovne vyššej:

  • na úrovni fyzickej (bitovej) je obsah zdroja reprezentovaný postupnosťou binárnych číslic, teda 0 a 1, pričom každá jedinečná kombinácia binárnych číslic predstavuje iný objekt, prípadne inú verziu toho istého objektu;
  • na úrovni formálnej digitálny objekt predstavuje jeho formát a štruktúra. V prípade textových objektov ide teda o reprezentáciu znakov v niektorom znakovom kóde (ASCII, UNICODE), o formát a štruktúru dokumentu – či už ide o proprietarné formáty pre konkrétne systémy, ako napríklad Word, alebo o všeobecné formátovanie typu SGML;
  • logická úroveň reprezentuje poznatky a myšlienky obsiahnuté v dokumente, tak ako ich je schopný pochopiť a zaradiť do kontextu človek.

2. fixnosť/stálosť

Stálosť digitálneho objektu je problematickou črtou integrity najmä v sieťovom prostredí, kde je možné objekt počas ”publikovania” meniť alebo ho po určitom čase ”stiahnuť z obehu/ponuky”. V analógovom prostredí je otázka fixácie finálneho produktu pomerne uspokojivo vyriešená – v prípade literárneho či iného materiálne publikovaného diela je týmto okamihom akt publikovania, dokonca aj v prípade efemérnych produktov typu rozhlasového či televízneho programu je fixácia daná aktom výroby, prípadne odvysielania.

Sieťové prostredie však so sebou prináša nielen možnosť neustálych zmien/aktualizácie už raz publikovaných zdrojov, ale súčasne aj možnosť výskytu viacerých reprezentácií toho istého diela, pričom je možné, že žiadna verzia nie je definovaná ako kánonická. Riešením tejto situácie môže byť využívanie kryptografických techník, napr. tzv. ”vodotlače”, na identifikovanie špecifických verzií dokumentov. Iným typom digitálnych objektov, pri ktorých je fixácia dôležitým problémom z hľadiska integrity, sú sústavne aktualizované databázy, pri ktorých je komplikované zaznamenávanie všetkých zmien na úrovni jednotlivých záznamov – v súvislosti s nimi sa spomína technológia ”time-travel specification”, teda možnosť zachytávať zmeny v samostatnom súbore a v prípade potreby ich extrapolovať na základný súbor. Iným riešením môže byť periodické zachytávanie aktuálneho stavu raz za definovaný časový úsek.

3. referencia/identifikácia

Identifikácia súvisí s potrebou presnej a spoľahlivej lokalizácie v čase a vo vzťahu k iným objektom – tradične túto funkciu zabezpečujú citačné, popisné a klasifikačné systémy, pričom problematickou vždy bola a aj zostáva otázka kvality takejto referencie. Silným trendom v súčasnosti sú samoreferenčné informácie, ktoré sa ukladajú v objekte samotnom (vo forme záhlavia – header alebo tzv. ”digitálnej obálky”) – v tomto duchu už v definičnej časti tejto štúdie bol spomenutý termín informačný objekt. V digitálnom prostredí problémom zostáva už pertraktovaná otázka referovania variantných digitálnych objektov.

Referencia a identifikácia elektronických zdrojov sa realizuje prostredníctvom známeho mechanizmu URI (Uniform Resource Identifier). Pod identifikátorom sa rozumie objekt, ktorý funguje ako referencia na zdroj – týmto objektom je postupnosť znakov s presne vymedzenou syntaxou (Berners-Lee, 1998). V zásade môže URI vystupovať v dvoch formách. URL – Uniform Resource Locator – identifikuje konkrétne miesto (server), na ktorom je zdroj umiestnený. Problematickým sa tento spôsob identifikácie stáva v momente, keď z nejakého dôvodu dôjde k zmene lokácie zdroja. Naproti tomu URN – Uniform Resource Name – má zabezpečiť stálu identifikáciu objektu bez ohľadu na jeho umiestnenie, na základe jednoznačného názvu. Vzťah medzi menom zdroja a jeho lokáciou sa zrealizuje cez špeciálne digitálne služby a servery (podobný princíp, na akom dnes fungujú servery DNS pre transformáciu internetových adries z doménovej do IP formy). Zatiaľ však tieto riešenia existujú skôr na úrovni konceptuálnych modelov a jedným z nich je napríklad aj iniciatíva DOI – Digital Object Identifier.

4. pôvod

Pôvod digitálneho zdroja je významnou charakteristikou najmä pri posudzovaní autenticity a spoľahlivosti objektu. Systémy tradičného formálneho publikovania zväčša fixujú dáta o pôvode diela na presne špecifikovaných miestach v publikácii. V digitálnom prostredí sa tento publikačný aspekt pomerne úzko viaže na problém stálosti zdrojov a na otázku identifikovania viacerých verzií/edícií dokumentu. V oblasti neformálnych publikačných kanálov sú v tomto smere diskutabilné napríklad:

  • informácie individuálneho a súkromného charakteru (webové stránky, korešpondencia...);
  • informácie sprostredkované alebo riadené cez rôzne firemné informačné systémy (finančné záznamy, zmluvy...);
  • informácie (najmä vedecké dáta) zverejňované do siete z rôznych elektronických zdrojov/snímačov.

5. kontext

Kontext reprezentuje súhrn podmienok, v akých bol elektronický zdroj vytvorený, resp. podmienok, pre aké bolo jeho využívanie projektované. Odvíja sa z neho spôsob interakcie daného objektu s inými objektmi v digitálnom prostredí, pričom ho môžeme definovať na viacerých úrovniach:

  • technický/technologický kontext – predstavujú väzby dokumentu (počítačového súboru) na špecifický hardvér/softvér, prostredníctvom ktorého je možné objekt vnímať, v súčasnosti predovšetkým vidieť a počuť;
     
  • väzbový kontext – pre daný objekt ho reprezentujú jednak prepojenia (vytvorené v jazyku html alebo inou technológiou) s inými, príbuznými objektmi a jednak prepojenia na objekty, ktoré sú integrálnou súčasťou agregovaných zdrojov (napríklad obrázky, grafy a podobne);
     
  • komunikačný kontext – ide o spôsob využívania, respektíve prístupu k elektronickým zdrojom, v rámci ktorého sa vyčleňujú dve veľké skupiny: diela na médiu versus sieťovo prístupné. Pri ich tvorbe a využívaní sa potom musia brať do úvahy také faktory, ako napríklad formáty a veľkosti súborov, ktoré možno pri tvorbe dokumentu využiť, otázka bezpečnosti siete na prenos údajov a realizáciu rôznych transakcií...;
     
  • sociálny kontext – reflektuje dôvody tvorby digitálnych objektov, spôsob i účel ich využívania. Tento kontextuálny rozmer predstavuje najrozsiahlejšiu a veľmi ťažko kategorizovateľnú zložku kontextuálneho spektra tvorby a využívania elektronických zdrojov – od záujmov tvorcov/”vydavateľov” cez záujmy cieľových skupín až po širšie politické, sociálne a kultúrne aspekty elektronického publikovania.
     

Typológia

Vzhľadom na šírku záberu v definovaní predmetu záujmu tejto štúdie (elektronické dokumenty, elektronické zdroje, digitálne objekty) je aj typologické vymedzenie elektronických zdrojov nejednoznačné a v súčasnej teórii i praxi internetu dosť chaotické v závislosti od toho, z akého uhla sa na elektronické zdroje pozeráme. Do úvahy prichádzajú jednak tradičné knihovnícke kritériá, na základe ktorých sa vymedzujú ”dokumentové typy” (v analógovom svete do detailu rozpracované v práci Novákovej, 1983), jednak formátové charakteristiky súborov, ktoré sa zväčša s menšími modifikáciami aplikujú na širšiu oblasť zdrojov, a napokon novšie modely postavené na objektovom prístupe. Z uvedeného je jasné, že dokumentová typológia sa neprekrýva s typológiou formátovou, a prax v sieťovom prostredí každému knihovníkovi potvrdzuje, že dokumentový typ môže byť vyjadrený viacerými formátmi a naopak.

Formát súboru

V základnom počítačovom chápaní digitálne objekty predstavujú množinu núl a jednotiek, ktoré možno ukladať a spracovávať pomocou počítačov a prenášať cez počítačové siete. Na vyššej úrovni však ide o omnoho komplexnejšie objekty, ktoré sú typologicky značne rôznorodé a každý typ má vlastné charakteristiky, ktoré určujú spôsob, akým je možné dokument používať pre tvorbu, ukladanie, prístup a prenos informácií.

Pravdepodobne najpriamočiarejším spôsobom charakterizovania zdrojov v elektronickom prostredí je formát súboru, v ktorom sú dáta uložené. Typológia počítačových súborov má tiež viaceré dimenzie, ktoré sa viažu jednak na typ uložených údajov (z hľadiska ich percepcie), ale aj na špecifický spôsob ich spracovania... Pomerne prehľadný a komplexný spôsob kategorizácie formátov digitálnych objektov ponúka dokument IFLA Selecting Electronic Document Formats (Cleveland, 1999), založený na multifacetovom prístupe, v rámci ktorého každý konkrétny formát možno charakterizovať viacerými parametrami. Na účely tejto typológie sú podstatné nasledujúce2:

  • strojová čitateľnosť – schopnosť počítača rozpoznať textové znaky a vyhľadávať ich,
  • zobrazovanie národných znakov – schopnosť formátu zobrazovať znaky rôznych svetových abecied,
  • zachovanie pôvodného vzhľadu dokumentu – najmä v prípade prevodu verzie analógovej do verzie digitálnej,
  • možnosť editovania – zásahy do objektu (opravy textu, editovanie obrazu a pod.),
  • viacstranové (multiobjektové) ukladanie v jednom súbore – význam najmä v súvislosti s ”obrazovými” dokumentmi,
  • štruktúrovanosť dokumentu – explicitne identifikované a označené prvky dokumentu (názvy, autori, sekcie, nadpisy, odstavce...),
  • multimediálny charakter – objekt obsahuje viac ako jeden typ média (text, grafika, audio, video),
  • podpora hypertextových odkazov – významná pri objektoch so zloženou architektúrou, odkazy na subkomponenty, zahrnutie multimediálneho obsahu,
  • primárne určenie výstupu – na obrazovku, tlač,
  • možnosť vyhľadania internetovými vyhľadávacími nástrojmi.

Ako som už zdôraznil, tieto parametre nepredstavujú ucelený typový rad, ale skôr modelový súbor charakteristík, ktoré nám umožňujú kategorizovať konkrétne formáty. Tých sa v súčasnom digitálnom prostredí, sieťovom i nesieťovom, používa veľké množstvo, a tak sa po užitočnej typológii musíme poobzerať v inej dimenzii – tá sa nachádza na rozhraní človeka a počítača, v spôsobe, akým človek vníma rôzne typy údajov, ktoré k nemu smerujú z vonkajšieho sveta. V prostredí internetu je najprestížnejšou takouto typológiou schéma MIME (Multipurpose Internet Mail Extensions), ktorú k;aždý používateľ internetu pozná (aj keď možno nevedomky) z elektronickej pošty.

Internetový normatívny dokument RFC (Request for Comments) 2046 definuje typy médií pre MIME (Freed, Borenstein, 1996) všeobecne na základnej úrovni (top-level), ktorá sa ďalej môže špecifikovať vo forme konkrétneho formátu, napr. v podobe abc/xyz, kde abc je základný typ a xyz je podtyp3. Typológia pozná na základnej úrovni 6 jednoduchých a 2 zložené typy médií:

1. text – s bežnými podtypmi ako ”jednoduchý” (plain) či ”rtf” (enriched), s možnosťou pridať akýkoľvek formát textového procesora, ktorý možno prečítať bez potreby použiť daný softvér;

2. obraz – s podtypmi napríklad jpeg and gif, čo sú bežne rozšírené formáty obrázkov, najmä na internete;

3. audio – základným podtypom je v RFC nešpecifikovaný ”basic”, ale súčasná prax už poskytuje množstvo ďalších, ktoré sa stávajú de facto štandardmi – wav, a najmä mp3;

4. video – ako základný podtyp je definovaný formát ”mpeg”, ale rozšírené (aj keď na ústupe) sú aj iné, napríklad avi;

5. aplikácia – iný typ dát, najmä neinterpretované binárne dáta alebo informácie určené na spracovanie konkrétnou aplikáciou. Najbežnejším podtypom je ”octetstream”, ale patrí sem napríklad aj podtyp postscript;

6. model – tento typ sa objavuje v novších aktualizáciách typológie (RFC 2077), ide o elektronickú behaviorálnu alebo fyzickú reprezentáciu zväčša vo forme viacrozmerných objektov;

7. viaczložkový typ – skladá sa z viacerých entít nezávislých dátových typov. Preddefinované sú 4 podtypy, základný ”zmiešaný” (mixed), ”alternatívny” (alternative) pre tie isté údaje v rôznych formátoch;

8. správa – vložená správa.

Detailný prehľad typov a podtypov MIME možno nájsť v dokumente Media types (Media, 2001). Z uvedených charakteristík vyplýva, že pre potreby všeobecnej typológie formátov digitálnych objektov sú podstatné predovšetkým jednoduché typy (1 – 6). Funkcia zložených spočíva najmä v tom, že umožňujú zmiešavanie a hierarchické štruktúrovanie entít rôznych typov v jednej správe, takže na všeobecnej úrovni digitálnych objektov nie sú typologicky významné.

Typ súboru

Ďalší prístup k definovaniu i typológii elektronických zdrojov vychádza z aplikácie objektovej metodológie, ktorá nie je založená primárne na formáte počítačových súborov, ale na objekte reálneho (teda analógového!) sveta, ktorý daný zdroj v elektronickej forme predstavuje. Pokusom o takýto prístup je aj typológia, ktorá bola rozpracovaná v rámci Dublin Core Metadata Initiative (ďalej DCMI) – hoci kvôli presnosti treba konštatovať, že objektová podstata sa v priebehu diskusií okolo finálnej podoby tejto typológie v jednotlivých verziách skôr viackrát vynorila, ale zatiaľ dôsledne nepresadila. Špecifikácia metadátových prvkov pre popis elektronických zdrojov DCMI (Dublin, 1999) obsahuje dva príbuzné údajové prvky – formát a typ zdroja.

Formát sa definuje ako ”fyzický alebo digitálny prejav zdroja” a zvyčajne zahŕňa typ média alebo rozmery zdroja (veľkosť, trvanlivosť), určuje sa ním potrebné softvérové, hardvérové či iné vybavenie. Jedným z odporúčaných kontrolných slovníkov na výber hodnôt tohto metadátového prvku je práve štruktúra MIME (Internet media types). Naproti tomu typ určuje ”povahu alebo žánrový obsah zdroja” a zvyčajne obsahuje termíny popisujúce všeobecné kategórie, funkcie, druhy alebo agregačné úrovne obsahu. DCMI ponúka vlastnú typológiu, DCMI Type Vocabulary (DCMI, 2001), ktorej prvá verzia bola zverejnená do diskusie koncom 90. rokov a je ešte stále v štádiu návrhu. Vo svojej najobsiahlejšej verzii slovník definoval 13 typov digitálnych zdrojov, posledná aktualizácia z júla 2000 rozoznáva 9 typov:

1. agregát – vzájomne prepojená množina zdrojových položiek – v tomto prípade sa zdroj popisuje ako skupina, pričom jeho časti možno samostatne popísať aj vyhľadať;

2. dátový súbor – štruktúrované informácie kódované v zoznamoch, tabuľkách, bázach dát na priame spracovanie v príslušnom softvéri;

3. udalosť – zdroj s časovo obmedzeným výskytom (výstava, konferencia);

4. obraz – symbolická vizuálna reprezentácia iná ako text, zaraďujeme sem aj video, diagramy, mapy, notové záznamy;

5. interaktívny zdroj – vyžaduje interakciu používateľa (webové formuláre, aplety, chat, virtuálna realita);

6. služba – systém, ktorý poskytuje používateľovi nejakú službu (bankové, MVS, služby na overovanie identity, Z39.50);

7. program – zdrojový alebo kompilovaný;

8. zvuk – zdroj primárne určený na počúvanie;

9. text – určený na čítanie; zaraďujeme sem aj faksimile alebo obrazy textov.

Ukážkou zmien, akými v rámci diskusie typológia DCMI neustále prechádza, je skutočnosť, že v predchádzajúcej verzii bol zaradený aj typ fyzický objekt pre objekty reálneho sveta, ktoré nemajú protipól v iných typoch (napríklad osoba, počítač, socha) – keďže však ich digitálne reprezentácie musia byť v konečnom dôsledku typu obraz, text a pod., takýto objekt napokon do poslednej verzie typológie zaradený nebol. V súvislosti s typom udalosť sa tiež môže vyskytnúť transformácia pôvodného zdroja (skripty, noty, artefakty) a môžu vzniknúť derivované zdroje (film, páska, prepis, obraz), udalosť však má v tomto kontexte základnú identitu (Cox, 1998). Zaujímavá je tiež skutočnosť, že v typologickej schéme formátov IMT sa využívajú niektoré termíny rovnaké ako v typovom slovníku DCMI (napríklad obraz, text). Rozdiel medzi formátom a typom v rámci metaúdajových prvkov (ale nielen tam) už bol zadefinovaný vyššie v zmysle aspektu obsahového verzus formálneho. Markantným príkladom tohto rozdielu je prípad textového zdroja, ktorý je uložený v naskenovanom nerozpoznanom tvare – typ je text a formát je definovaný ako obraz (Cox, 1998b).

Uvedená základná typová škála DCMI je už na prvý pohľad veľmi hrubá a najmä pre oblasť ”textových” zdrojov a ich spracovanie v dokumentačných systémoch nepostačujúca. Z viacerých pokusov o detailnejšiu typológiu spomeňme aspoň metodickú príručku pre katalogizáciu internetových zdrojov (Olson, 1997), ktorá v súvislosti s kódovaním polí typu a súboru pri tvorbe bibliografického záznamu uvádza 29-bodovú typológiu elektronických zdrojov podľa ISBD (ER). V rámci samotného DCMI boli snahy o vytvorenie podobnej typológie. Pracovná skupina pod vedením R. Tennanta vypracovala v roku 1997 tzv. štrukturalistický návrh (Tennant, 1997) zoznamu typov zdrojov Dublin Core (ako protipól minimalistického návrhu), ktorý rozvíjal škálu základných typov objektov, v prípade obrazov a najmä textov do dvoch podúrovní s využitím bodkovej notácie (napríklad text.korešpondencia.email, text.periodikum.časopis alebo obraz.pohyblivý.animácia).

Aktuálny návrh (Apps, 2001) detailnejšej typológie zdrojov v rámci DCMI modifikuje štrukturalistický prístup v tom, že oproti pôvodnej rigidnej hierarchii určitých podtypov v rámci konkrétnych typov sa ponúka otvorený zoznam kategórií (v súčasnosti 50 – pozri príloha), ktoré sa môžu aplikovať v rámci ktoréhokoľvek typu.

Digitálne zdroje a knižnice

Globálny trend prechodu k elektronickej komunikácii a využívaniu elektronických informačných zdrojov sa samozrejme odrazil aj v knižnično-informačnej činnosti a od polovice 90. rokov viedol k celkovej modifikácii tradičného modelu knižnično-informačného systému smerom ku knižnici elektronickej či digitálnej (pozri napríklad Kimlička, 2000). Táto zásadná zmena sa prejavuje nielen vo zvýšenej miere aplikácie výpočtovej techniky v technologických procesoch KIS, ale najmä v podstatnej modifikácii technologických procesov ako takých.

Vo všeobecnosti možno charakterizovať vplyv digitálnych technológií na fungovanie tradičnej knižničnej inštitúcie pomocou nasledujúcich faktorov:

  • oddelenie využívania dokumentu od originálu,
  • simultánne viacnásobné využívanie dokumentu,
  • efektívnosť prístupu (plnotextové vyhľadávanie, možnosť výberu média).

K druhotným prínosom na úrovni inštitúcie možno zaradiť:

  • úspora úložného priestoru,
  • úspory spojené s údržbou papierových fondov,
  • rýchlosť a efektívnosť dodávania dokumentov.

Aké sú najdôležitejšie zmeny, ktoré možno pozorovať na úrovni jednotlivých technologických procesov?

  1. Zmena v technológii doplňovania a akvizície – knižnica nenakupuje do svojich fondov dokument ako artefakt, ale prístupové právo k nemu. Táto prax sa zväčša realizuje na základe uzatvorenia licenčnej dohody medzi knižnicou a vydavateľom. Vytvárajú sa tak ”virtuálne fondy” ako podmnožina všetkých elektronických zdrojov, ku ktorým má konkrétna knižnica prístup. Problematika licencií sa v knižničnej praxi čoraz častejšie – vzhľadom na narastajúcu ekonomickú náročnosť zabezpečenia prístupu k potrebnému množstvu zdrojov – spája s praxou vytvárania konzorcií, v rámci ktorých knižnice koordinujú svoj ekonomický potenciál i používateľské zázemie.
  2. Spracovanie – patrí sem jednak otázka metodiky a organizácie, respektíve kooperácie pri spracovaní elektronických a špecifickejšie sieťových zdrojov na úrovni odborných katalogizačných postupov do knižničného katalógu (odporúčania Kongresovej knižnice, projekt CORC v rámci OCLC), integrácia takýchto záznamov do modulu OPAC a ich sprístupnenie knižničným používateľom s možnosťou priameho prepojenia na primárne sieťové zdroje (prostredníctvom poľa 856) a napokon metadáta ako popis a charakteristika zdrojov na nekatalogizačnej úrovni, zväčša kvôli využitiu takýchto údajov na účely strojového (agentového) spracovania (napríklad štruktúra prvkov podľa Dublin Core Metadata Initiative).
  3. Sprístupňovanie elektronických zdrojov z virtuálnych i vlastných fondov knižnice – špecifické vlastnosti elektronických dokumentov umožňujú, aby knižnica poskytovala prístup svojim používateľom aj na diaľku, napríklad z ich domovov alebo pracovísk, a to aj viacerým súčasne k tomu istému zdroju. Tieto aspekty práce s elektronickými zdrojmi sa najčastejšie spomínajú ako problematické z hľadiska tvorcov a detailne sa zohľadňujú v licenčných podmienkach zmlúv medzi vydavateľmi a knižnicami – na individuálnej úrovni ich zvyčajne ošetrujú systémy digitálnej správy práv (DRMS – Digital Rights Management Systems), ktoré sú schopné zabezpečiť jednotlivú kontrolu a autorizáciu prístupu, spôsob využívania (prezeranie, tlač...) i finančný manažment.
  4. Digitalizácia – ide o elektronický proces konverzie dokumentu z nedigitálneho média do digitálnej formy na účely uloženia, vyhľadávania a prenosu. Knižnica môže prikročiť k takémuto spôsobu ”spracovania” svojich fondov za predpokladu, že sú vysporiadané všetky otázky súvisiace s autorským právom. Každodenné fungovanie knižnice stelesňuje konflikt medzi potrebou sprístupňovať materiály uložené v knižničnom fonde a potrebou ich zachovania pre budúce využitie – práve digitalizácia túto dilemu odstraňuje tým, že vo výpožičnom, respektíve ”prístupovom” procese nahrádza originály dokumentov ich digitálnymi kópiami. Konkrétna koncepcia projektu digitalizácie v knižnici závisí od jej prvotného účelu – digitalizácia ochranného typu sa zameriava na maximálne možnú ochranu a zachovanie dokumentu ako artefaktu, konzervačný typ digitalizácie kladie dôraz na zachovanie obsahu dokumentu.
  5. Archívne funkcie – na prvý pohľad ide o oblasť, ktorá zasahuje iba malú časť knižníc s konzervačnými kompetenciami. Ak však zoberieme do úvahy digitalizačné aktivity, ktoré prebiehajú či budú prebiehať v čoraz väčšom počte knižníc, archívne funkcie sa v súvislosti s elektronickými materiálmi, ktoré má knižnica fyzicky uložené na svojich nosičoch, stanú štandardnou súčasťou technologických procesov. Starostlivosť o uchovanie digitálnych zbierok má viacero rozmerov:
  • ochrana informačných médií – problém životnosti fyzického média, jeho celistvosti a funkčnosti,
  • technologická ochrana – problém zastaranosti technológií určených na prácu s elektronickými dátami, ktorý sa najvypuklejšie prejavuje v životnosti/dostupnosti čítacích zariadení a príslušného softvéru či kódovania,
  • intelektuálna ochrana – už spomínaný problém integrity a autenticity informácií (používanie vodotlače, kódovania a pod.).

Existujúce modelové riešenia archívnych problémov sú postavené na princípoch obnovovania (občerstvovania) digitálnych dát s pravidelným kopírovaním na nové médiá (platí napríklad úzus lehoty 4 – 5 rokov pre magnetické médiá), migrácie (periodický presun digitálnych materiálov z jednej hardvérovej/softvérovej konfigurácie na inú) či emulácie starých technológií/formátov na nových technologických platformách.

Faktom je, že digitálne dokumenty nesú so sebou vysoké archivačné riziko, ktoré spočíva okrem iného aj v tom, že vlastníci alebo správcovia digitálnych dokumentov zanedbajú alebo úmyselne vynechajú činnosti spojené so zabezpečením prístupu. Cieľom je preto vytvorenie takej infraštruktúry, ktorá by zlyhania tohto typu minimalizovala – napríklad Americká ALA (American Library Association) v spolupráci s RLG (Research Libraries Group) a ďalšími odborovými organizáciami pripravili koncepciu národného systému digitálnej ochrany. Definuje sa v ňom inštitút digitálneho archívu, ktorý môžu plniť knižnice, prípadne iné inštitúcie na základe prísnej certifikácie (spĺňanie kritérií a štandardov) a tiež tzv. krízový mechanizmus ako množina organizačných, ekonomických a právnych prostriedkov, ktoré umožnia vykonať ”agresívnu záchrannú akciu” na zachovanie kultúrne významných digitálnych informácií v prípade ich ohrozenia. V európskych podmienkach podobnú funkciu plní projekt NEDLIB (Networked European Deposit Library), v rámci ktorého bol vypracovaný návrh všeobecného architektúrneho rámca depozitného systému elektronických publikácií (DSEP), ktorý sa má budovať väčšinou na úrovni národných knižníc.

Záver

Oblasť elektronických informačných zdrojov predstavuje veľmi dynamicky sa rozvíjajúcu sféru spoločenskej komunikačnej praxe a nachádza širokú odozvu aj na úrovni teoretického spracovania, do ktorého čoraz výraznejšie zasahujú interdisciplinárne prístupy. V rámci tohto príspevku som sa zameral na aktuálny stav poznania v oblasti charakteristík elektronických zdrojov, ich terminologického a typového vymedzenia, ako aj na vplyv komunikácie elektronických zdrojov na koncepciu tradičného systému KIS. Škála dokumentových typov v elektronickom prostredí naberá viaceré dimenzie, dominantné sú najmä dve vrstvy – tradičnejšie, aj keď interdisciplinárnym prístupom modifikované dokumentovo-typové hľadiská sa kombinujú s novšími formátovými aspektmi. Uvedené typológie elektronických zdrojov dosť podstatne narúšajú tradičný knihovnícky pohľad zvyknutý pracovať najmä s dokumentovými zdrojmi, ktoré aj keď nie sú lokálne materiálne fixované, sú aspoň stabilné. Z takéhoto rámca sa však vymykajú zdroje typu udalosť alebo služba, ktoré sú dynamické svojou povahou. Neobstojí tu argument, že dynamické zdroje sú mimo zorného uhla knižničnej praxe i teórie, podobne ako povedzme prebiehajúce telefonické rozhovory alebo konferencie ako také – naopak, treba si zvykať na to, že aj takýto typ variabilných informačných zdrojov sa stáva súčasťou elektronického informačného univerza, ktorý knižnica môže či musí evidovať, spracovávať, odporúčať i poskytovať svojim používateľom.

Poznámky:

1. Reprezentačné informácie v rámci modelu OAIS obsahujú také metadátové prvky ako špecifické požiadavky na hardvér, mikroprocesor, špecifické multimediálne požiadavky, špecifické požiadavky na periférie (zip), OS, aplikácia a pod. PDI zahŕňa metadátové prvky typu obsahový identifikátor, URL, checksum (bitová kontrola správnosti dát), zmeny v histórii objektu (významné modifikácie v životnom cykle objektu).

2. Ostatné aspekty uvedené v dokumente IFLA nie sú typotvorné, možno ich považovať skôr za parametre dôležité pri výbere formátu pre konkrétne použitie.

3. Okrem toho štruktúra MIME rozoznáva aj širokú škálu parametrov, ktoré fungujú ako modifikátory subtypov, pričom množina aplikovateľných parametrov je závislá od typu média a jeho subtypu – parameter ”charset” napríklad možno použiť na definovanie znakovej sady textových podtypov. V kontexte typologických funkcií MIME však tieto parametre nie sú podstatné.

Použité zdroje:

Apps, Ann (2001) DCT2: Dublin Core Type Vocabulary: Subtypes Working Draft. – http://epub.mimas.ac.uk/DC/subtypes.html.

Berners-Lee T., R. Fielding, U.C. Irvine, L. Masinter (1998) Uniform Resource Identifiers (URI): Generic Syntax. Request for Comments 2396. – http://andrew2.andrew.cmu.edu/rfc/rfc2396.html.

Bratková, Eva (1998) K otázkám pojmu, třídění a typologie internetových a webovských informačních zdrojů. In: Národní knihovna, 9, 1998, č. 5, s. 262 – 276. – ISSN 0862-7487

Bratková, Eva (1999) Metadata jako nový nástroj pro komunikaci webových informačních zdrojů. In: Národní knihovna, 10, 1999, č. 4, s. 178-194. – ISSN 0862-7487

Cleveland, Gary (1999) Selecting Electronic Document Formats. UDT Occasional Paper # 11. – http://www.ifla.org/VI/5/op/udtop11.

Cox Simon, Rebecca Guenther, Diann Rusch-Feja (1998) Format Element Working Draft. – http://dublincore.org/documents/1998/10/23/format-element/.

Cox Simon, Rebecca Guenther, Diann Rusch-Feja (1998) Type Element Working Draft. – http://dublincore.org/documents/1998/10/23/type-element/.

DCMI Type Vocabulary (2001) – http://dublincore.org/documents/dcmi-type-vocabulary/.

Dublin Core Metadata Element Set, Version 1.1: Reference Description (1999) – http://dublincore.org/documents/1999/07/02/dces/.

Freed N., N. Borenstein (1996) Multipurpose Internet Mail Extensions. (MIME) Part Two: Media Types (Request for Comments 2046). http://andrew2.andrew.cmu.edu/rfc/rfc2046.html.

Kimlička, Štefan (2000) Knižničná a informačná veda na prahu informačnej spoločnosti : filozofický, systémový a historický pohľad. – Bratislava : Stimul, 2000. 138 s. – ISBN 80-88982-29-4

Knoll, Adolf (1999). Problematika elektronických publikací. In: Národní knihovna, 10, 1999, č. 3, s. 173 – 177. – ISSN 0862-7487

Media Types (2001) [RFC2045, RFC2046] – http://www.isi.edu/in-notes/iana/assignments/media-types/media-types.

Nováková, Marta (1983) Informačné pramene. – Bratislava : SPN, 1983. 221 s.

Olson, Nancy B. (1997) Cataloging Internet Resources : A Manual and Practical Guide. – http://www.oclc.org/oclc/man/9256cat/toc.htm.

Preserving Digital Information : Report of the Task Force on Archiving of Digital Information. (1996) – http://www.rlg.org/ArchTF/.

Standards for DSEP : Standards for the Implementation of a Deposit System for Electronic Publications – NEDLIB Report 4 (2000) – http://www.kb.nl/nedlib/results/dsepstandards.rtf.

Šušol, Jaroslav (1998) Definovanie pojmu elektronická knižnica v kontexte elektronických komunikačných aktivít. – In: Knižničná a informačná veda XVII. – Bratislava : UK 1998, s. 23 – 36.

Tennant, Roy (1997) Dublin Core Resource Types. Structuralist DRAFT. – http://sunsite.berkeley.edu/Metadata/structuralist.

Weitz, Jay (2000) Cataloging Internet Resources: OCLC-MARC Coding Guidelines. – http://www.oclc.org/oclc/cataloging/type.htm.

Príloha: Prehľad všeobecne aplikovateľných subtypov zdrojov DCT2: Dublin Core Type Vocabulary: Subtypes Working Draft podľa Apps, 2001. Usporiadané abecedne podľa originálnych anglických názvov.
Abstrakt
Oznámenie
Archív
Článok
Kniha
Kartografické dáta
   Atlas
   Globus
   Mapa

Katalóg
Chat - počítačový rozhovor
Korešpondencia
Slovník
Úvodník
Erratum - oprava
Program
Beletria
   Dráma
   Román
   Báseň

Formulár
Hra
Geopriestorové dáta
Register
Odborný časopis
Časopis
Zápisnica
Pohyblivý obraz
Multimediálny učiaci objekt
Hudba (zvuk)
Hudobný zápis
Rozprávanie (zvuk)
Prirodzený zvuk
Spravodaj
Noviny
Numerické dáta
Zborník z konferencie
Recenzia
Zdrojový kód
Spektrálne dáta
Štatistické dáta
Statický obraz
   Ilustrácia
   Maľba
   Fotografia
   Socha

Prejav
Technická správa
Dizertačná práca
VR (virtuálny realita)

Tlačiť Facebook Twitter LinkdeIN

Hodnotenie

Počet hodnotení: 0

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License

Ak sa neuvádza inak, obsah článkov podlieha licencii https://creativecommons.org/licenses/by/4.0/


ISSN 1336-0779 (online vydanie)  ISSN 1335-793X (tlačené vydanie)
© Centrum vedecko - technických informácií SR