Info mailom

Chcete pravidelne dostávať informácie o novinkách?

Slovakiana. Stručný prehľad vývoja

Autori: Pavel Antalík; Peter Marman
Číslo: 4/2009 -
Rubrika: NISPEZ predstavuje
Kľúčové slová:

Informačný systém pôvodne vyvíjaný ako Digitálny informačný systém kultúry a neskôr  premenovaný na Slovakianu (v súlade so zmenou názvu Európskej digitálnej knižnice na Europeanu) by sme mohli jednou vetou charakterizovať ako integrovaný informačný systém pre dlhodobú archiváciu, organizáciu a sprístupnenie digitálneho kultúrneho obsahu na centrálnej úrovni. Stručne možno povedať, že Slovakiana sa vyvinula a ďalej sa vyvíja z informačného systému rezortu kultúry pôvodne zamýšľaného ako portál, resp. register kultúry na centrálny informačný systém integrujúci ostatné informačné systémy kultúrnych inštitúcií, ako aj pripravovaných digitalizačných pracovísk tak, aby mohol hrať kľúčovú úlohu v    pripravovanom procese masovej a medzisektorovej digitalizácie v rámci Operačného programu Informatizácia spoločnosti a jeho Prioritnej osi 2.

Myšlienka vybudovania informačného systému s týmito funkciami vznikla už v roku 1993: v rámci Registra kultúry bol prvýkrát spomenutý zámer realizácie portálu (vzhľadom na nevyspelosť technológií a enormných finančných nákladov nebola možná realizácia). V roku  2002 bol projektový zámer Portálu kultúry predložený vedeniu MK SR, na základe čoho bol vypracovaný projekt. V roku 2004 bola zriadená rada ministra kultúry pre informatizáciu, bolo vytvorených viacero pracovných skupín, pričom najaktívnejšou bola Pracovná skupina pre interoperabilitu. Táto publikovala viacero odborných článkov a publikácií, na ktoré mohla potom neskôr Slovakiana organicky nadviazať. Napriek spomenutým aktivitám sa však vtedy nepodarilo vytvoriť priestor na realizáciu tohto jedinečného projektu. Prelom nastal až v roku 2007, keď podľa zadania a na základe odporúčaní projektu MINERVA a tiež vzhľadom na špecifiká jedinečnosti slovenského prostredia bol vytvorený pilotný projekt s názvom Digitálny informačný systém kultúry (skrátene DISK), neskôr premenovaný na Slovakiana. Koncom roku 2008 bola radou ministra kultúry pre informatizáciu a digitalizáciu zriadená dodnes aktívna Pracovná skupina pre projekt DISK-Slovakiana, kde prizvané odborné kapacity z rezortu kultúry participujú pri strategickom vývoji a požiadavkách zmien na projekte. Členmi sú zástupcovia sektorových agregátov rezortu a ďalšie kľúčové kultúrne inštitúcie.

Táto aktivita mala svoju podporu v národných aj európskych legislatívnych normách, iniciatívach a projektoch. Základné strategické dokumenty, ktoré priamo súvisia s vytvorením projektu, sú: Akčný plán eEurope+, Stratégia informatizácie spoločnosti v podmienkach SR a akčný plán stratégie (2004), Operačný program informatizácia spoločnosti (2007), Stratégia rozvoja pamäťových a fondových inštitúcií a obnova ich národnej infraštruktúry (2008). Týmto sa vytvoril a ďalej budoval základný strategický a myšlienkový rámec na prípravu projektového zámeru.

Projekt v rámci funkčných oblastí, ktoré teraz pokrýva, môžeme charakterizovať týmito hlavnými cieľmi na centrálnej úrovni:

  • Slovakiana ako Archív kultúry – poskytnutie platformy pre dlhodobú archiváciu a ochranu kultúrneho obsahu produkovaného v procese masovej a medzisektorovej digitalizácie kultúrneho dedičstva na jednom mieste tak, že vytvára centrálny uzol celej digitalizácie na dlhodobé uchovávanie a správu obsahu.
  • Slovakiana ako Portál kultúry – medzisektorové agregované sprístupnenie kultúrneho dedičstva pre verejnosť, a to od všetkých typov držiteľov obsahu spolu s poskytnutím rozšírených služieb a vytvorenie centrálneho prístupového bodu pre obsah z oblasti kultúry, začleneného do informačnej infraštruktúry verejnej správy aj európskych štruktúr s podporou pridaných služieb pre odbornú i laickú verejnosť. Z pohľadu funkcionality ide o portál G2C (vláda k občanom), G2G (vláda k vládnym inštitúciám) a G2B (vláda k biznisu).
  • Slovakiana ako Register kultúry – podpora národných registrov nevyhnutných na poskytovanie elektronických služieb v medzisektorovom a distribuovanom prostredí informačných systémov kultúrnych inštitúcií a digitalizačných pracovísk, ako aj pre koordinovaný a efektívny priebeh masovej medzisektorovej digitalizácie. Z procesného pohľadu ide o množinu databáz podporujúcich vybudovanie referenčných registrov ako základných pilierov rezortu kultúry.

Je zrejmé, že v tomto strategickom smerovaní pôjde o rozsiahly a ambiciózny projekt (zatiaľ je v pilotnom riešení implementovaná iba iniciálna časť). A je rovnako zrejmé, že rozsiahlu funkcionalitu bude nevyhnutné a potrebné v budúcnosti tak či tak realizovať. Pri zahrnutí uvedených troch strategických cieľov do smerovania projektu však musí nevyhnutne nastať diskusia o ich spoločnom riešení a zahrnutí pod jeden projekt, vzhľadom na ich úzke prepojenie, i keď sa na prvý pohľad môžu javiť ako heterogénne. Ukážme si, že v súčasnej situácii a pri existujúcich požiadavkách na realizáciu OPIS PO 2 je opak pravdou, a ukážme si to na centrálnom archíve kultúry.

Zrekapitulujme si najskôr procesy, ktoré bude potrebné realizovať v rámci pripravovanej masovej digitalizácie. Z procesného hľadiska to budú desiatky parciálnych procesov, ktoré by sa dali rozčleniť do nasledujúcich hlavných kategórií:

  • Prierezové procesy – procesy realizované prierezovo v rámci celej digitalizácie, ako napr. identifikácia objektov, vykazovanie stavu, validácia a kontrola kvality, bezpečnosť atď.
  • Prípravné procesy – procesy zahŕňajúce prípravu samotnej konverzie, ako napr. príprava digitalizačných plánov, príprava digitalizačných pracovísk, reštaurovanie a pod.
  • Procesy konverzie – procesy samotnej digitalizácie v užšom zmysle slova.
  • Postkonverzné procesy – postprocesingové odborné procesy po ukončení konverzie, ako napr. digitálne reštaurovanie, logistika, spracovanie metadát atď.
  • Procesy uchovania – procesy zberu a distribúcie údajov, ich zálohovania a následnej dlhodobej archivácie a ochrany obsahu.
  • Procesy spracovania – procesy spracovania digitalizovaného obsahu a poznatkov.
  • Procesy prezentácie – procesy, pri ktorých sa prezentuje spracovaný obsah a poznatky.

Tieto procesy, ak sa má zdigitalizovať požadovaných 3 a pol milióna objektov, bude potrebné realizovať s maximálnou možnou automatizáciou a paralelizáciou, vo veľkých objemoch, previazane, synchronizovane a plánovane, v neposlednom rade aj s náležitým monitorovaním, kontrolou kvality a finančným vykazovaním. Mimoriadne ťažké na tom bude, že budú realizované – a nedá sa tomu pri požadovanom počte objektov vyhnúť – mnohými desiatkami organizačných jednotiek v rámci kritického počtu subjektov, či už na digitalizačnej, inštitucionálnej alebo centrálnej úrovni. No a v konečnom dôsledku tento obrovský objem dát bude potrebné dlhodobo uchovávať. Určite nepôjde o objem menší ako 6 petabajtov dát. Väčšina sektorov totiž avizuje najmenej jeden petabajt digitalizovaného obsahu, pričom nemá zmysel nevyužiť existujúce technické možnosti digitalizácie a umelo na úkor objemu znižovať kvalitu rozlíšenia.

Je zrejmé, že Štúdia uskutočniteľnosti za týchto podmienok nemôže navrhnúť ako efektívne riešenie archívu na federatívnom princípe, t. j. že každá inštitúcia by si zriadila a prevádzkovala vlastný archív. Jednoducho opakovať archivačné procesy, technické riešenie, personálne zabezpečenie atď. niekoľkokrát je z finačného hľadiska neefektívne. Navyše podľa archivačných štandardov je potrebné ukladať najmenej 3 kópie objektov najmenej v 2 geograficky vzdialených lokalitách. Výsledkom návrhu štúdie teda nevyhnutne musí byť centrálny archív, zrejme s dvomi alebo maximálne tromi úložiskami.

Podľa interných odhadov, ktoré sme realizovali v projektovej príprave Slovakiany, 3 a pol milióna zdigitalizovaných kultúrnych objektov sa premietne v konečnom dôsledku do viac ako 200 miliónov digitálnych objektov uložených v centrálnom archíve (odvodené deriváty v procese úprav, kontroly a narábania s digitálnym obsahom pracovníkov). Ako sme uviedli, v objeme cez 6 petabajtov krát počet úložísk plus rezerva. Čiže pôjde o veľmi robustný digitálny archív, pri ktorom jednou z kľúčových požiadaviek na uchovávanie bude garancia uloženia, správy a dohľadania popisných informácií k objektom, nielen požiadavka na uloženie a dlhodobú ochranu obsahu. Jednoducho, aby sme vedeli, čo v archíve vlastne máme a mohli sa k objektom aj efektívne dostať, čo zahŕňa aj dohľadanie príslušných informácií o nich. Pretože pri tom počte objektov to nebude jednoduché.

Za týchto podmienok je nemysliteľné realizovať archív bez existujúcich a fungujúcich funkcií centrálnej jednoznačnej a trvalej identifikácie kultúrnych aj digitálnych objektov, ďalej národného agregátora, ktorý kanonicky do spoločného dátového modelu agreguje popisné údaje zo všetkých sektorov, v ktorých sa digitalizuje obsah, taktiež národného registra pre autority, riadené slovníky a tezaury, ako aj ďalších komponentov nevyhnutných pre beh centrálnych systémov. Inými slovami povedané, všetky tri spomínané strategické ciele pre oblasť archívu, portálu a registra sú veľmi úzko prepojené a je potrebné ich riešiť súčasne a integrovane. Inak hrozia riziká, ktoré si v negatívnom príklade odskúšali napr. vo Veľkej Británii (Dawson et al.).

Slovakiana na tieto potreby už od svojho začiatku reflektovala. Na konci roku 2007 bolo spustené pilotné riešenie systému DISK MK SR, v rámci ktorého bolo implementované pilotné riešenie pre Národný agregátor, Digitálny archív a Portál kultúry. Bolo implementované v rokoch 2007 a 2008 dodávateľským konzorciom a v súčinnosti s ďalšími partnermi a subdodávateľmi za aktívnej účasti IT odborov jednotlivých participujúcich inštitúcií, ako aj ich dodávateľov informačných systémov. Po polročnej prestávke projekt pokračoval v prvej polovici roku 2009 už pod menom Slovakiana. V rámci tejto etapy sa odštartovalo pilotné riešenie pre Národný register autorít, 3 inštitúcie sa integrovali do existujúceho Digitálneho archívu, ďalšie sa pridali k Národnému agregátoru. Riešenie je v súčasnosti prevádzkované v rámci infraštruktúry Univerzitnej knižnice v Bratislave a dostupné v sieti MK SR.

Za vôbec najcennejší prínos projektu považujeme existenciu a prácu Pracovnej skupiny pre Slovakianu. Tá, aj keď to nešlo vždy ľahko a hladko, nadviazala na výsledky pôvodnej Pracovnej skupiny pre interoperabilitu a reálne udržiavala pri živote myšlienku medzisektorovej integrácie informačných systémov v rezorte, a to pri riešení konkrétnych technických otázok na konkrétnych problémoch z praxe. Riešitelia pri vývoji komponentov v jednotlivých oblastiach vždy predkladali odpočet prác, výsledky analýz a návrhy koncepcií a ďalšieho smerovania, ku ktorým sa skupina vyjadrovala a schvaľovala, príp. korigovala. Opíšme si podrobnejšie tie z realizovaných komponentov, ktoré sa týkajú práve integrácie.

Pre Národný agregátor pilotné riešenie implementovalo harvestovanie z jednotlivých inštitúcií cez rozhranie OAI-PMH. Pri implementácii bol zvolený prístup implementácie kanonického dátového modelu (CDM), ktorý je založený na CIDOC-CRM. Tento prístup – oproti prístupu, kde by sa zbieral len súbor spoločných popisných údajov zo všetkých inštitúcií – poskytuje možnosť vytvorenia prepojeného modelu popisných údajov ďalším spracovaním po harvestovaní s možnosťami štrukturálneho hľadania. Metadáta obsahujú URL tých objektov, ktoré sú priamo na webových stránkach inštitúcií (Portál kultúry nemá nahradiť inštitucionálne portály, naopak, má byť pre ne vstupným bodom). Obsah CDM je podriadený potrebám aplikácie Národného agregátora. CDM je serializovaný do formátu RDF. Serializácia využíva štandardné schémy a mapovania, ak existujú. Integrácia s pamäťovými a fondovými inštitúciami je implementovaná modulmi, ktoré adaptujú IS inštitúcií mapovaním natívnych schém do CDM. Tento prístup bol pre pilotné riešenie zvolený z toho dôvodu, že nezasahuje do IS inštitúcií, ale len pristupuje k údajom, ktoré mapuje. V súčasnosti sú v Národnom agregátore importované dáta zo 6 inštitúcií.

Pri Národnom registri autorít boli importované súbory existujúcich personálnych autorít zo 4 inštitúcií, realizovaná a prezentovaná analýza o štruktúre importovaných dát, spôsoboch vypĺňania selekčných polí, využití pri katalogizačnom procese, existujúcimi medzisektorovými prienikmi a pre importovaný súbor dát bol implemetovaný webovský prehliadač. Na základe analýzy bol stanovený a pracovnou skupinou odsúhlasený ďalší postup v tejto oblasti.

Záverom je potrebné spomenúť, že pre ďalší vývoj v tejto oblasti budú základnými dokumentmi výstupy zo Štúdie uskutočniteľnosti, ktorá detailne rozpracuje realizáciu projektov a možnosti čerpania finančných zdrojov z EÚ. Nepriamo sa podieľajú na realizácií štúdie rôzne dokumenty a projekty (Stratégia rozvoja PFI, Europeana, Slovakiana, strategické dokumenty SR, politika EÚ, technologické štandardy a i.), ako aj spoločná práca sekcií, odborov a organizácií v zriaďovateľskej pôsobnosti MK SR.

V súčasnosti sa otvára jedinečný priestor a možnosť (zrejme aj posledná), na realizáciu takýchto projektov v rozsahu, ktorý na jednej strane umožní výrazné skvalitnenie a zefektívnenie práce odborníkov rezortu kultúry a na druhej strane umožní laickej verejnosti prístup k informáciám. Oba faktory predstavujú možnosť na spropagovanie práce odborníkov pracujúcich v kultúre i samotných inštitúcií. Preto je nutná spolupráca, vôľa a hlavne nadšenie pre tento základný projekt, ktorý bude spolupracovať a poskytovať jednotný integrovaný nástroj pre všetkých zúčastnených v procese digitalizácie, na čo najefektívnejšie a najekonomickejšie využitie poskytnutých finančných zdrojov a zabezpečenie podpory procesu digitalizácie v čo najväčšej miere automatizácie činností. Nástroj, ktorý bude integrovaný s ďalšími informačnými systémami, bude poskytovať používateľom na laickej aj odbornej úrovni dlhodobú archiváciu, organizáciu a sprístupnenie digitálneho kultúrneho obsahu, čím sa pre koncového používateľa virtuálne zjednotí aj celá kultúrna obec a kultúrne dedičstvo.

 

Literatúra:

DAWSON, D. et al. Digitisation in the UK, JISC. Dostupné na internete: <http://www.jisc.ac.uk/media/documents/programmes/digitisation/jisc-digi-in-uk-v1-07.pdf>

Tlačiť Facebook Twitter LinkdeIN

Hodnotenie

Počet hodnotení: 0

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 International License

Ak sa neuvádza inak, obsah článkov podlieha licencii https://creativecommons.org/licenses/by/4.0/


ISSN 1336-0779 (online vydanie)  ISSN 1335-793X (tlačené vydanie)
© Centrum vedecko - technických informácií SR