Európska konferencia o archivácii digitálnych zdrojov (NSR, Frankfurt 20. – 21. apríla 2007)

From seminars and conferences

V rámci nemeckého predsedníctva Rady Európskej únie v roku 2007 usporiadali splnomocnenec spolkovej vlády pre kultúru a médiá a Nemecká národná knižnica medzinárodnú konferenciu s mottom “Výzva: Digitálna dlhodobá archivácia. Stratégie a prax európskej spolupráce”. (Ponúkame vám správu z tejto konferencie. Ďalšie informácie, program a prezentácie nájdete na stránke http://www.langzeitarchivierung.de/eu2007/.)

Konferenciu otvoril Hermann Schäfer, vedúci odboru kultúry a médií spolkovej vlády a komisár pre kultúru a médiá. Upozornil, že len spolupráca celej Európy na poli digitalizácie a ochrany kultúrneho dedičstva je jediná možná cesta k úspechu. Pri svojich snahách musia mať pamäťové inštitúcie súčasne kontaktnú osobu na politickej úrovni.

Najťažšou vecou je totiž znovu objavovať to, čo už dávno vieme. Aby sa tak nestávalo, je nutné zamyslieť sa pri archivácii a uchovávaní informácií a pamäte ľudstva nad piatimi podstatnými otázkami. Na samotný výber informácií potrebujeme stanoviť optimálne výberové kritériá. Na úspešnú národnú i medzinárodnú kooperáciu musíme využívať a dodržiavať štandardy, vybudovať technické zázemie. Kooperácia medzi inštitúciami buduje siete, spája skúsenosti, odspodu vytvára organizačnú infraštruktúru potrebnú na vytvorenie celosvetovej pamäte. Ako správcovia tejto pamäte musíme garantovať dlhodobú dôveryhodnosť informácií, zabrániť ich manipulácii zvonka. Okruh uzatvára podstatný fakt, ktorý musíme zohľadňovať v každom kroku. Musíme vedieť, pre koho digitalizujeme.

Elisabeth Nigemannová, generálna riaditeľka Nemeckej národnej knižnice, uviedla, že digitalizovať a archivovať musia inštitúcie a že je potrebné vyriešiť problematiku archivovania digitálnych objektov do archívnych systémov. Upozornila, že v lete roku 2006 vstúpil do platnosti novelizovaný zákon o Nemeckej národnej knižnici, ktorý rozšíril archívnu úlohu knižnice o sieťové publikácie. Aj preto sa Nemecká národná knižnica začala zaoberať zabezpečením dlhodobej dostupnosti digitálnych publikácií. Príkladmi národnej spolupráce pod záštitou národnej knižnice na tomto poli sú dva projekty – NESTOR a KOPAL. Cieľom projektu NESTOR je vybudovanie decentralizovanej štruktúry pre dlhodobé uchovávanie. KOPAL je praktickou implementáciou systému dlhodobého uchovávania.

Prezident IFLA Alex Byrne prirovnal problém digitalizácie informácií k chytaniu dúhy. Zvýraznil potrebu zabezpečenia prístupu k archivovaným objektom. Povedal, že kto robí pre seba, robí zároveň aj pre druhých. Upozornil aj na problematiku prospektívnej digitalizácie (digitalizácie toho, čo vzniká teraz). Podstatou digitalizácie je prístupnosť a použiteľnosť obsahu. Na to potrebujeme stabilné a dôveryhodné inštitúcie ako garantov týchto procesov a zároveň potrebujeme štandardy. Ako príklad medzinárodnej spolupráce uviedol program IFLA týkajúci sa spolupráce národných knižníc na digitalizácii.

Po úvodných komentároch vystúpil Kim Veltman, pracovník McLuhanovho Maastrichtského virtuálneho inštitútu s prezentáciou Rámec pre dlhodobú digitálnu archiváciu v EÚ. Upozornil na fakt, že za posledných 50 rokov sa v USA rozrástli fondy univerzitných knižníc natoľko, že rozsahom prekračujú fondy národných knižníc. Po exkurze po dejinách písma a médií (až po tie elektronické) sa venoval hlavne bibliografickej kontrole a ako víziu predstavil projekt DEER (Distributed European Electronic Resoure – Distribuovaný európsky elektronický zdroj). Skonštatoval, že potrebujeme úložisko (repozitár), referenčný systém, prístupový bod (agoru) a inštitúciu na organizáciu poznania. Ako úlohu pre 21. storočie predpokladá integráciu čiastkových obsahov a viacjazyčný výstup. Výstupom budú plné obsahy. Predpokladá vznik nových nástrojov organizácie poznania (vizuálne slovníky a pod.). Podotkol, že je potrebné využiť a katalogizovať Wikipédiu, blogy, Skype, UTube, videokonferencie a pod.

Najzaujímavejšou ideou jeho vízie bola výzva na integráciu práce jednotlivých medzinárodných organizácií (FID, UDC, ISKO) a predovšetkým rekvalifikáciu existujúcich klasifikácií poznania (ako napr. MDT). Pre pamäťové inštitúcie predpovedal novú rolu – “from recorded worlds to recording worlds”. Je potrebné zmapovať internet, zemský povrch, moria i oceány a vesmír. Výsledkom bude vizuálna Zem. Ako príklad uviedol, že napr. na prechádzke v parku si človek odfotografuje mobilom strom, fotografiu pošle do systému, systém vyhľadá informácie o strome a pošle ich späť do mobilu.

Svoju víziu nazval WONDER (World Online Networked Digital Electronic Resource). Je to vlastne globálna digitálna knižnica, fungujúca na viacerých systematických úrovniach a využívajúca rôzne filtre.

Pre Európu vidí dve možné cesty. Buď budeme digitalizovať niekoľko miliónov kníh a budeme minoritnými hráčmi, alebo sa zapojíme do takejto vízie presahujúcej inštitucionálny, národný a aj striktný odborný pohľad, vytvoríme DEER a prispejeme do/ku WONDER.

Hans Jansen z Holandskej národnej knižnice, moderátor prvého popoludňajšieho bloku, predstavil Alianciu pre trvalý prístup (APA), kde je zastúpený svet vedeckých knižníc a vydavateľov. Blok bol venovaný stratégiám a kooperácii na úrovni EÚ, ktorá podporuje napríklad programy PLANETS a CASPAR. Cieľom je vybudovať interoperabilné repozitáre, zabezpečiť trvalý prístup k obsahu a vyvíjať nástroje na tieto činnosti.

Prvá prednášajúca Birte Christensen-Dalsgaardová z Dánska predstavila digitálnu archiváciu z takzvanej nordickej perspektívy. Ochrana sa týka tak webového obsahu, ako aj televízneho a rozhlasového vysielania a e-governmentu. Upozornila, že údaje momentálne strácame, lebo sa nearchivujú. Ako problematické oblasti uviedla copyright a financie. Preto je potrebné selektovať, čo treba uchovávať prednostne.

Severské krajiny spolupracujú na projektoch EÚ PLANETS (spolupráca európskych inštitúcií zainteresovaných na ochrane digitálnych kultúrnych a vedeckých znalostí) a DPE (spolupráca existujúcich národných iniciatív). Švédi majú DiVA (ochrana vedeckých publikácií) a Dáni Pindar. Pindar je unikátny tým, že používateľ systému si môže nechať overiť, či má údaje v súlade so štandardmi, a sám si ich aj uploadovať do systému. Preto tu robia len malý zber (harvesting) údajov.

Birte Christensen-Dalsgaardová sa pozastavila nad problémom multiplicity obsahu na rôznych stránkach, či ich všetky zbierať a archivovať, či je potrebné archivovať aj softvérové riešenia ako nástroj Wiki a pod. Podľa skúseností z Veľkej Británie stojí ochrana 65 % z celkovej ceny webovej archivácie. Dôležité je aj zodpovedanie otázky, či digitalizujeme pre uchovávanie alebo pre sprístupňovanie, či uchovávame vzhľad alebo obsah.

Bohdana Stoklasová z Českej národnej knižnice predstavila projekt Stratégia a spolupráca pri dlhodobom uchovávaní v Českej republike, ktorý financuje štát prostredníctvom ministerstva kultúry. Na MK ČR je aj centrálne dôveryhodné úložisko. Inštitúcie majú zároveň svoje úložiská. Česká digitálna knižnica (www.ndk.cz) obsahuje archívy Manuscriptorium, Kramerius a WebArchive. Využívajú štandardy METS (kontajner), DC, MARCXML, MODS (popisné metadáta) a PREMIS, MIX i PREMIS rights (technické, autorské metadáta). Tieto sú testované na Kramériovi. Národná knižnica je zapojená do viacerých medzinárodných projektov ako CASPAR, PLANETS či DPE. V rámci DPE je ČR zodpovedná za šírenie informácií, webovú stránku DPE a analýzu trhu. V roku 2008 – 2009 pripravujú projekt na systém správy obsahu.

Maurizio Lunghi predstavil iniciatívu Digital Preservation Europe (DPE). Táto iniciatíva vykonáva certifikáciu a audit archívov a úložísk, tréningové programy a osvetu. Snažia sa budovať odborné komunity a ich prepájanie. V Taliansku existuje tzv. Cultural Heritage online. Hoci je DPE oproti PLANETS a CASPAR malý projekt, podporuje spoluprácu v rámci prebiehajúcich iniciatív, poskytuje možnosť certifikácie a self-audit, zvyšuje povedomie o digitálnej ochrane medzi malými a strednými podnikmi v Európe. Navyše sú v DPE zapojené aj inštitúcie mimo rezortu kultúry, napr. hospodárstvo, vnútro.

Ute Schwensová z Nemeckej národnej knižnice z Frankfurtu nad Mohanom predstavila ich projekty NESTOR, DINI, BABS, Edoc-Server a predovšetkým KOPAL. Systém KOPAL má implementovaný OAIS model a je postavený na IBM systéme DIAS (Digital Information Archiving System) a OpenSource koLibRI (kopal Library for Retrieval and Ingest). Plány do budúcnosti zahŕňajú kooperatívnu výstavbu dlhodobého archívu digitálnych informácií, ktorý má byť rozšíriteľný, kooperatívny, univerzálny. Spustenie do štandardnej prevádzky je plánované v polovici tohto roku. Udržanie adresovateľnosti a citovateľnosti má zabezpečiť kooperatívne zadávanie URN (producenti majú, resp. môžu mať vlastné meno) a centrálne zadávanie DOI. Pre projekt NESTOR plánujú ďalšie vzdelávanie, odborné podujatia, kurzy a tréningy. Efektom snehovej gule chce národná knižnica budovať kooperáciu a podporovať spoluprácu. V snahe o kooperáciu sa chce Nemecká národná knižnica zapojiť do iniciatívy i2010 Digital Libraries.

V rámci panelovej diskusie bola spomenutá snaha Britskej národnej knižnice mať celý svoj obsah sprístupnený na webe do roku 2020. Digitalizujú od roku 1990, doteraz je spracované iba 1 %. Preto bol termín i z finančných dôvodov spochybnený. Otvorená bola diskusia na tému štandardy na digitálnu ochranu. Nemecká národná knižnica netrvá na jedinom štandarde, pretože ho iné pamäťové inštitúcie neprijmú, prakticky nie je možné stanoviť jeden štandard. Tento problém rieši interoperabilita. Dôležité sú však i štandardy týkajúce sa práv (legal standards), ktoré doposiaľ nie sú presne rozpracované. Zástupca z Fínska zase upozorňuje na fakt, že nie je problém štandardy stanoviť, ale implementovať ich. Diskusia sa dotkla aj témy selekčné kritériá na ochranu. Kritériá sú primárne stanovené potrebami a možnosťami krajiny. V rámci archivácie webu sa medzi jednotlivými štátmi približujú najviac. Dánsko upozorňuje na problém archivácie e-mailov vedeckej komunity. Takisto iniciatíva OpenAccess nie je zapojená do uchovávania. Diskutujúci upozornili na dve roviny rozhodovania pri výbere dokumentov. V prvej línii treba určiť, čo bude inštitúcia archivovať, následne rozhodnúť o dlhodobej archivácii obsahu, resp. vykonať druhotnú selekciu a určiť, ako dlho daný obsah v archíve uchovávať. Základný problém uchovávania je rozhodovanie medzi funkcionalitou (volíme menšiu veľkosť súboru) alebo čo najlepším obsahom (archivácia v čo najväčšom súbore). Dánsko už dnes bojuje s migráciou dát i metadát. Preto navrhujú spolupracovať s odborníkmi IT a producentmi dát, aby pôvodne digitálne materiály (born-digital) už vznikali ako dlhodobo udržateľné. Problémom sú aj dynamické stránky a ochrana databáz za nimi. Štáty zbierajú zatiaľ statický web, no uvedomujú si problémy spojené so zberom dynamického webu a obávajú sa personalizovaného webu. Ide o výzvu do budúcnosti. A nakoniec, pri digitalizácii dokumentov chceme archivovať text, alebo vydanie? Smerodajný je maximálny prístup, no je to aj ekonomické rozhodnutie. Pri tvorbe archívu či úložiska musíme vedieť, či digitalizujeme, resp. uchovávame kvôli prístupu alebo ochrane. Digitalizácia nám umožňuje uchovať originál bezpečnejší. Nesmieme tiež zabúdať, že náklady na digitalizáciu a náklady na dlhodobú ochranu sú dve veci, pričom dlhodobá ochrana je finančne omnoho náročnejšia. Projekty získavajú peniaze na digitalizáciu, no v praxi musíme rátať aj s dlhodobou ochranou. Nemecká filozofia je archivácia v záujme sprístupňovania prostredníctvom replík, pretože originály sú v analógovej forme archivované.

Na druhý deň Neil Beagrie z Britskej knižnice predstavil v hlavnej prednáške dňa premisy spolupráce pri riešeniach dlhodobého digitálneho uchovávania v Európe. Spolupráca je vec zložitá, individuálna, a preto musíme byť flexibilní. Má mnoho foriem a úrovní, možných rolí. Organizácie a ich potreby sa menia, inštitúcie spolupracujú a súťažia zároveň. V Európe sú spolupracujúce siete organizácií DPC (Digital Preservation Coalition), NESTOR, PIN (Pérrenisation des informations numériques – preservation of digital information) a iné. DPC vo Veľkej Británii je príkladom spolupráce vlády, archívov, knižníc, vedcov, ale aj vydavateľov a iných. Zo spolupráce by sa mali vymieňať skúsenosti, “best practices” a pod. Digitálne uchovávanie je globálna výzva a riziká sa objavujú až časom, a to aj také, ktoré nikto nepredpokladal. V Európe sa spolupracuje na výcviku, výskume (PLANETS, CASPAR), certifikácii (TRAC checklist), nástrojoch a pracovných postupoch (IIPC web archiving), osvete (PADI), aby politici a verejnosť pochopili dôležitosť a závažnosť problému.

Vybudovať interdisciplinárnu spoluprácu trvá aj 15 rokov. Zároveň je potrebné si uvedomiť aj širšie súvislosti a nabádať verejnosť na personálnu archiváciu. Je potrebné zvoliť správne formy spolupráce a prepojiť národné siete, podporovať komerčnú a komunitnú aktivitu.

Michael Seadle ako moderátor ďalšieho bloku upozornil v krátkom vstupe na problém autenticity a integrity digitálnych zdrojov a systémov, pretože sú ťažko dokázateľné. Integrita musí byť zabezpečená pri všetkých serveroch (princíp LOCKSS – “lots of copies keep stuff safe”). Riešením by mohol byť DINI certifikát (Deutsche Initiative für Netzwerkinformation).

Marie-Elise Waltz z USA predstavila možnosti certifikovania na základe požiadaviek klientov. Pôvodný auditový zoznam kritérií je RLG-NARA, po revízii vznikol TRAC audit (Trustworthy Repositories Audit and Certification). TRAC audit trvá približne 3 dni a stojí v priemere 65 000 $. TRAC je možné urobiť si aj samovoľne a bezplatne. Knižnice často robia audit podľa týchto dostupných zoznamov (checklists), aby nemuseli platiť, vtedy však nezískajú certifikát. A ten je dôležitý pre trh a dlhodobé pretrvanie. Nikto si neuloží údaje do nedôveryhodného úložiska. TRAC podporuje aj OAIS.

Andrea Scotti mal hovoriť o štandardoch, ale zameral sa len na štatistiku členov jednotlivých organizácií na tvorbu štandardov, kde poukázal na fakt, že najviac členov majú USA, takže štandardizácia nie je doménou kontinentálnej Európy, čo je potrebné zmeniť.

Uwe Borghoff z nemeckého Inštitútu pre softvérové technológie hovoril o archívnych systémoch na báze OAIS. Budúcnosťou je prepojenie archívnych systémov s knižničnými, vydavateľskými a inými systémami. Do úvahy prichádza 50 až 60 systémov vrátane OpenSource. Na stránke projektu NESTOR je vystavený katalóg kritérií na vhodný archívny systém, ktorý pomáha pri rozhodovacom procese. Pri výbere si inštitúcia musí vyjasniť, aké objekty a dáta chce uchovávať, či plánuje uchovávať dáta s médiom alebo bez (USB, DVD-ROM, CD-ROM), aké metadáta bude priraďovať a vytvárať. V Nemecku sú dokumenty dlhodobej archivácie zálohované na páskach. Bavorská štátna knižnica zaradila medzi svoje kritériá výberu archívneho systému dôveryhodnosť aj s ohľadom na prípadné pohromy (disaster management), zálohovanie a obnovu dát, hlásenie chýb, náklady na produkt, podporu konečného používateľa, udržateľnosť firmy a jej prienik na trhu. Z existujúcich systémov spomenul DIAS, MyCoRe (nepodporuje XML export, a teda ani METS), DigiTool, DSpace, Eprints.

Hilde van Wijngaarden povedala, že digitálny objekt má 5 aspektov – obsah, štruktúru, kontext, vydanie a správanie (digitálneho objektu v procese komunikácie). Proces archivácie pozostáva z výberu (čo treba archivovať), popisu, uloženia, prístupu. Najlepšie je, ak archivácia a ochrana začína už pri tvorbe objektu. Prípadne prebieha migrácia už pred prijatím dokumentov do archívu. Dynamické prostredie archiváciu sťažuje. Hilde van Wijngaarden vyzvala na spoluprácu s vydavateľmi a IT sektorom pri tvorbe softvéru na správu digitálneho obsahu. Pre budúci prístup ráta s alternatívnymi prezentáciami. Upozornila na fakt, že musíme prejsť od projektov k implementácii a bežnej praxi.

diskusii sa otvorili otázky potreby prezentácie úspešných projektov a riešení, spolupráce s vydavateľmi atď. Odznela aj otázka, či bude o 10 rokov všetko uložené v repozitároch. Navyše je veľa dokumentov publikovaných, tvorených ako OpenAccess. Práve preto potrebujeme dôveryhodné úložiská. Dôležité sú certifikáty, pretože pomôžu nájsť najlepšie riešený archív. Popri auditovom nástroji TRAC existuje i JAMBORA, čo je viac “self-auditing-tool”.

Na záver vystúpila Pat Mansonová z Európskej komisie a predstavila možnosť získania finančných prostriedkov z FP7 ICT programu. Zároveň predstavila politiku EÚ “i2010 Digital Library”. Európska komisia odporúča mať do polovice roku 2008 národné stratégie digitalizácie, do konca roku 2009 mať legislatívu a infraštruktúru na podporu digitálneho uchovávania na národných úrovniach. Toto všetko je možné dosiahnuť len spoločnými silami.

Na koniec už len závery z konferencie. Viacero rovnakých či podobných myšlienok zaznelo nezávisle od seba, v diskusiách sa potvrdilo jednotné smerovanie celej Európy. Knižnice a pamäťové inštitúcie musia vyvíjať tlak na vydavateľov, vypracovať požiadavky a podmienky na tvorbu produktov. Kľúčovým problémom je dodržiavanie autorského práva. Tým, že má inštitúcia kópiu diela, neuberá zo zisku vydavateľovi, len je potrebná správna prezentácia na verejnosti. Musíme zaviesť certifikáciu dôveryhodných úložísk, vytvárať aj softvérové úložiská, podporovať modulárnosť a jasnú architektúru repozitárov. EÚ má tlačiť na národné agentúry a ich aktivitu v medzinárodných organizáciách, podporovať OpenSource softvér v rámci EÚ (aj kvôli cene nástrojov na audit). Uchovávanie a digitálna ochrana je proces, a preto je potrebné začať čo najskôr. Infraštruktúra je najdôležitejšia a skúsenosti je potrebné šíriť ďalej. V neposlednom rade je potrebné dodržiavať štandardy. Vhodné je vytvorenie jednotného náhľadu, spojiť množstvo existujúcich projektov a ich výstupy prezentovať z jedného portálu.

Share:
Issue content