Digitálny obsah a jeho ochrana

From Slovakia

Digitálne dokumenty samy osebe predstavujú veľmi komplexnú a často diskutovanú problematiku, ktorú možno lepšie pochopiť pomocou modelu životného cyklu dokumentov.

Jednotlivé fázy životného cyklu digitálnych dokumentov (objektov) definujeme podľa kľúčových oblastí problematiky. Prvý krok predstavuje tvorbu digitálnych dokumentov (primárny, teda pôvodný digitálny dokument, a sekundárny digitalizovaný dokument). V súčasnosti sa posúvame od problémov súvisiacich s technologickým riešením (retrospektívnej) digitalizácie ku kvalitatívnym problémom digitalizácie, ktorých súčasťou je výber materiálov na transformáciu do digitálnej podoby (kvalita, reprezentácia, náhrada absencie) a následne k ďalším fázam životného cyklu digitálnych dokumentov – spracovaniu (výber najvhodnejšieho metadátového popisu, evidencie a katalogizácie), sprístupňovaniu (dostupnosť a prístupnosť), šíreniu a dlhodobej ochrany (long-term preservation) digitálnych dokumentov.

Pod ochranou digitálnych dokumentov rozumieme súbor činností a zásahov, ktoré sú nevyhnutné na zabezpečenie trvalého a spoľahlivého prístupu k digitálnym dokumentom bez ohľadu na čas (Pennock, 2006).

Medzi najproblematickejšie oblasti v súvislosti s (dlhodobou) ochranou a prístupom k digitálnym dokumentom (ďalej len DD) možeme zaradiť dramaticky sa zvyšujúci počet DD, štandardov a formátov; vačšiu komplexnosť DD (obsahujúcich text, obrázky, zvuk a video v rozličných formátoch) a ich závislosť od softvéru; nedostatočný alebo chýbajúci plán ochrany DD (kritériá výberu, časového rozpätia a pod.); absencia všeobecne prijatých štandardov na zabezpečenie prístupu k DD; autorské práva, ktoré v mnohých prípadoch odporujú politike dlhodobého uchovávania DD, a v neposlednom rade nestabilné pamäťové médiá, ktorých životnosť je obmedzená (Bullock, 1999).

Zabezpečenie opätovného prístupu k DD by malo byť interdisciplinárnym úsilím, alebo ako hovoria Montfort a Wardrip-Fruin – “prácou komunity” (2004). Svoje nezastupiteľné miesto v nej majú knihovnící, informační pracovníci, archivári, vývojári softvéru, počítačoví vedci, vydavatelia a v neposlednom rade autori ako pôvodcovia informačných zdrojov. Tí môžu ovplyvniť životnosť dokumentu už samotným výberom formátu a programu. Je teda potrebné mať na zreteli, že proprietárny systém môže ponúkať viacero možností a funkcií pri práci s dokumentom, ale na rozdiel od otvorených, tzv. open-source systémov sťažuje migráciu a emuláciu DD.

Za najznámejšie stratégie, resp. prístupy k ochrane digitálnych dokumentov považujeme:

A. obnovenie (refreshing) – kopírovanie informácií bezo zmien, vo väčšine prípadoch je tento prístup využiteľný len ako krátkodobé riešenie;

B. migrácia (migration) – premiestnenie elektronickej informácie, resp. DD z jednej hardvérovej a/alebo softvérovej konfigurácie na iné, či z jednej počítačovej technológie na ďalšie;

C. emulácia (emulation) – prístup k originálnym DD pomocou tzv. “premosťovacej” technológie medzi originálnym súborom a súčasnými platformami;

D. zapuzdrenie (encapsulation) – proces “zabalenia” DD s dostatočnými metadátami v záujme ochrany obsahu aj kontextu;

E. metadáta – súbor atribútov, ktoré popisujú objekt, v našom prípade DD.

Najčastejšie sa v súvislosti s metadátami a ochranou DD “skloňujú” METS a PREMIS.

METS predstavuje štandard na kódovanie popisných, administratívnych a štrukturálnych metadát prostredníctvom XML schémy z dielne World Wide Web konzorcia. METS vznikol z iniciatívy Digital Library Federation (DLF) a v súčasnosti je pod správou Kongresovej knižnice. Podrobnejšie informácie je možné nájsť na http://www.loc.gov/standards/mets/. Štruktúru METS možno rozdeliť do týchto logických celkov, resp. častí: hlavička (METS Header), popisné metadáta (Descriptive Metadata Section), administratívne metadáta (Administrative MS), skupiny objektov (File Section), štrukturálna mapa (Structural Map), štrukturálne odkazy (Structural Links) a správanie podľa obsahu (Behavior Section). O tom, že je tento štandard pomerne akceptovaný, svedčí aj skutočnosť, že bol implementovaný do viacerých komerčných riešení pre digitálne knižnice (napr. Greenstone, Fedora, Dspace, DigiTool a pod.).

Projekt PREMIS (The Preservation Metadata Implementation Strategies) vznikol ako odpoveď na potrebu širšieho rámca dlhodobej ochrany EZ. Jeho výsledkom je veľmi dobre štruktúrovaná sada metadátových prvkov a dátového slovníka. V neposlednom rade priniesol projekt definície rozličných možných stratégií a odporúčaní pre konkrétne sp?soby implementácie metadátového formátu.

Nespornou výhodou pri implementácii PREMIS je jednoduchosť jeho dátového modelu, ktorý pozostáva z piatich ťažiskových typov entít – objekty (Objects), udalosti (Events), agenti (Agents), práva (Rights) a zo samotnej intelektuálnej entity (Intellectual Entity). Správcovia digitálnych zbierok a systémov digitálnych knižníc postupne obracajú pozornosť na skutočnosť, že dlhodobá ochrana nepozostáva len zo zachovania fyzického dátového toku, ale aj zo schopnosti reprezentovať obsah na všetkých úrovniach tak, ako ich definuje dátový model PREMIS. V jadre modelu však nenájdete práva na sprístupňovanie a šírenie; podrobné technické metadáta a dokumentáciu hardvérového riešenia je možné použiť podľa potreby a špecifikácie (Vojnar, 2006).

Ak sa na problematiku ochrany DD pozrieme z čisto teoretického hľadiska, musíme uznať, že nejde o príliš komplexnú problematiku. Cieľom je v zásade “len” vytvorenie vhodnej väzby/nadväznosti medzi hadvérom, softvérom a ľudskou zložkou (organizácie, ľudia). Výsledok v praxi však do veľkej miery ovplyvňuje roztrieštenosť prístupov.


Zoznam bibliografických odkazov

BULLOCK, A. Preservation of Digital Information: Issues and Current Status. In Network Notes [online]. Ottawa : National Library of Canada, 1999. [cit. 2007-04-21]. ISSN 1201-4338. Dostupné na internete: <http://www.collectionscanada.ca/9/1/p1-259-e.html>.

MONTFORT, N., WARDRIP-FRUIN, N. Acid-Free Bits: Recommendations for Long-Lasting Electronic Literature [online]. v1.0, June 14, 2004 [cit. 2007-05-06]. Dostupné na internete: <http://eliterature.org/pad/afb.html>.

PENNOCK, M. 2006. Digital preservation: continued access to authentic digital assets. In JISC [online]. November, 2006 [cit. 2007-03-06]. Dostupné na internete: <http://www.jisc.ac.uk/media/documents/publications/digital-pres-bp-v1-04-ab_web.pdf>.

VOJNAR, M. 2006. Nové standardy digitálních knihoven pro dlouhodobou ochranu. In Knihovna plus [online]. 2006, č. 1 [cit. 2007-02-05]. Dostupné na internete: <http://www.knihovna.nkp.cz/knihovna61/vojnar.htm>.

Share:
Issue content