Slovakiana. Stručný prehľad vývoja

NISPEZ presents

Informačný systém pôvodne vyvíjaný ako Digitálny informačný
systém kultúry a neskôr  premenovaný na Slovakianu (v súlade so zmenou názvu
Európskej digitálnej knižnice na Europeanu) by sme mohli jednou vetou charakterizovať
ako integrovaný informačný systém pre dlhodobú archiváciu, organizáciu a
sprístupnenie digitálneho kultúrneho obsahu na centrálnej úrovni. Stručne možno
povedať, že Slovakiana sa vyvinula a ďalej sa vyvíja z informačného systému rezortu
kultúry pôvodne zamýšľaného ako portál, resp. register kultúry na centrálny
informačný systém integrujúci ostatné informačné systémy kultúrnych
inštitúcií, ako aj pripravovaných digitalizačných pracovísk tak, aby mohol hrať
kľúčovú úlohu v    pripravovanom procese masovej a medzisektorovej
digitalizácie v rámci Operačného programu Informatizácia spoločnosti a jeho
Prioritnej osi 2.

Myšlienka vybudovania informačného systému s týmito funkciami
vznikla už v roku 1993: v rámci Registra kultúry bol prvýkrát spomenutý zámer
realizácie portálu (vzhľadom na nevyspelosť technológií a enormných finančných
nákladov nebola možná realizácia). V roku  2002 bol projektový zámer Portálu
kultúry predložený vedeniu MK SR, na základe čoho bol vypracovaný projekt. V roku
2004 bola zriadená rada ministra kultúry pre informatizáciu, bolo vytvorených viacero
pracovných skupín, pričom najaktívnejšou bola Pracovná skupina pre interoperabilitu.
Táto publikovala viacero odborných článkov a publikácií, na ktoré mohla potom
neskôr Slovakiana organicky nadviazať. Napriek spomenutým aktivitám sa však vtedy
nepodarilo vytvoriť priestor na realizáciu tohto jedinečného projektu. Prelom nastal
až v roku 2007, keď podľa zadania a na základe odporúčaní projektu MINERVA a tiež
vzhľadom na špecifiká jedinečnosti slovenského prostredia bol vytvorený pilotný
projekt s názvom Digitálny informačný systém kultúry (skrátene DISK), neskôr
premenovaný na Slovakiana. Koncom roku 2008 bola radou ministra kultúry pre
informatizáciu a digitalizáciu zriadená dodnes aktívna Pracovná skupina pre projekt
DISK-Slovakiana, kde prizvané odborné kapacity z rezortu kultúry participujú pri
strategickom vývoji a požiadavkách zmien na projekte. Členmi sú zástupcovia
sektorových agregátov rezortu a ďalšie kľúčové kultúrne inštitúcie.

Táto aktivita mala svoju podporu v národných aj európskych
legislatívnych normách, iniciatívach a projektoch. Základné strategické dokumenty,
ktoré priamo súvisia s vytvorením projektu, sú: Akčný plán eEurope+, Stratégia
informatizácie spoločnosti v podmienkach SR a akčný plán stratégie (2004),
Operačný program informatizácia spoločnosti (2007), Stratégia rozvoja pamäťových a
fondových inštitúcií a obnova ich národnej infraštruktúry (2008). Týmto sa
vytvoril a ďalej budoval základný strategický a myšlienkový rámec na prípravu
projektového zámeru.

Projekt v rámci funkčných oblastí, ktoré teraz pokrýva,
môžeme charakterizovať týmito hlavnými cieľmi na centrálnej úrovni:

  • Slovakiana ako Archív kultúry – poskytnutie platformy pre
    dlhodobú archiváciu a ochranu kultúrneho obsahu produkovaného v procese masovej a
    medzisektorovej digitalizácie kultúrneho dedičstva na jednom mieste tak, že vytvára
    centrálny uzol celej digitalizácie na dlhodobé uchovávanie a správu obsahu.
  • Slovakiana ako Portál kultúry – medzisektorové
    agregované sprístupnenie kultúrneho dedičstva pre verejnosť, a to od všetkých typov
    držiteľov obsahu spolu s poskytnutím rozšírených služieb a vytvorenie centrálneho
    prístupového bodu pre obsah z oblasti kultúry, začleneného do informačnej
    infraštruktúry verejnej správy aj európskych štruktúr s podporou pridaných služieb
    pre odbornú i laickú verejnosť. Z pohľadu funkcionality ide o portál G2C (vláda k
    občanom), G2G (vláda k vládnym inštitúciám) a G2B (vláda k biznisu).
  • Slovakiana ako Register kultúry – podpora národných
    registrov nevyhnutných na poskytovanie elektronických služieb v medzisektorovom a
    distribuovanom prostredí informačných systémov kultúrnych inštitúcií a
    digitalizačných pracovísk, ako aj pre koordinovaný a efektívny priebeh masovej
    medzisektorovej digitalizácie. Z procesného pohľadu ide o množinu databáz
    podporujúcich vybudovanie referenčných registrov ako základných pilierov rezortu
    kultúry.

Je zrejmé, že v tomto strategickom smerovaní pôjde o rozsiahly a
ambiciózny projekt (zatiaľ je v pilotnom riešení implementovaná iba iniciálna
časť). A je rovnako zrejmé, že rozsiahlu funkcionalitu bude nevyhnutné a potrebné v
budúcnosti tak či tak realizovať. Pri zahrnutí uvedených troch strategických cieľov
do smerovania projektu však musí nevyhnutne nastať diskusia o ich spoločnom riešení
a zahrnutí pod jeden projekt, vzhľadom na ich úzke prepojenie, i keď sa na prvý
pohľad môžu javiť ako heterogénne. Ukážme si, že v súčasnej situácii a pri
existujúcich požiadavkách na realizáciu OPIS PO 2 je opak pravdou, a ukážme si to na
centrálnom archíve kultúry.

Zrekapitulujme si najskôr procesy, ktoré bude potrebné
realizovať v rámci pripravovanej masovej digitalizácie. Z procesného hľadiska to
budú desiatky parciálnych procesov, ktoré by sa dali rozčleniť do nasledujúcich
hlavných kategórií:

  • Prierezové procesy – procesy realizované prierezovo v
    rámci celej digitalizácie, ako napr. identifikácia objektov, vykazovanie stavu,
    validácia a kontrola kvality, bezpečnosť atď.
  • Prípravné procesy – procesy zahŕňajúce prípravu
    samotnej konverzie, ako napr. príprava digitalizačných plánov, príprava
    digitalizačných pracovísk, reštaurovanie a pod.
  • Procesy konverzie – procesy samotnej digitalizácie v
    užšom zmysle slova.
  • Postkonverzné procesy – postprocesingové odborné procesy
    po ukončení konverzie, ako napr. digitálne reštaurovanie, logistika, spracovanie
    metadát atď.
  • Procesy uchovania – procesy zberu a distribúcie údajov,
    ich zálohovania a následnej dlhodobej archivácie a ochrany obsahu.
  • Procesy spracovania – procesy spracovania digitalizovaného
    obsahu a poznatkov.
  • Procesy prezentácie – procesy, pri ktorých sa prezentuje
    spracovaný obsah a poznatky.

Tieto procesy, ak sa má zdigitalizovať požadovaných 3 a pol
milióna objektov, bude potrebné realizovať s maximálnou možnou automatizáciou a
paralelizáciou, vo veľkých objemoch, previazane, synchronizovane a plánovane, v
neposlednom rade aj s náležitým monitorovaním, kontrolou kvality a finančným
vykazovaním. Mimoriadne ťažké na tom bude, že budú realizované – a nedá sa tomu
pri požadovanom počte objektov vyhnúť – mnohými desiatkami organizačných
jednotiek v rámci kritického počtu subjektov, či už na digitalizačnej,
inštitucionálnej alebo centrálnej úrovni. No a v konečnom dôsledku tento obrovský
objem dát bude potrebné dlhodobo uchovávať. Určite nepôjde o objem menší ako 6
petabajtov dát. Väčšina sektorov totiž avizuje najmenej jeden petabajt
digitalizovaného obsahu, pričom nemá zmysel nevyužiť existujúce technické možnosti
digitalizácie a umelo na úkor objemu znižovať kvalitu rozlíšenia.

Je zrejmé, že Štúdia uskutočniteľnosti za týchto podmienok
nemôže navrhnúť ako efektívne riešenie archívu na federatívnom princípe, t. j.
že každá inštitúcia by si zriadila a prevádzkovala vlastný archív. Jednoducho
opakovať archivačné procesy, technické riešenie, personálne zabezpečenie atď.
niekoľkokrát je z finačného hľadiska neefektívne. Navyše podľa archivačných
štandardov je potrebné ukladať najmenej 3 kópie objektov najmenej v 2 geograficky
vzdialených lokalitách. Výsledkom návrhu štúdie teda nevyhnutne musí byť
centrálny archív, zrejme s dvomi alebo maximálne tromi úložiskami.

Podľa interných odhadov, ktoré sme realizovali v projektovej
príprave Slovakiany, 3 a pol milióna zdigitalizovaných kultúrnych objektov sa
premietne v konečnom dôsledku do viac ako 200 miliónov digitálnych objektov
uložených v centrálnom archíve (odvodené deriváty v procese úprav, kontroly a
narábania s digitálnym obsahom pracovníkov). Ako sme uviedli, v objeme cez 6 petabajtov
krát počet úložísk plus rezerva. Čiže pôjde o veľmi robustný digitálny archív,
pri ktorom jednou z kľúčových požiadaviek na uchovávanie bude garancia uloženia,
správy a dohľadania popisných informácií k objektom, nielen požiadavka na uloženie
a dlhodobú ochranu obsahu. Jednoducho, aby sme vedeli, čo v archíve vlastne máme a
mohli sa k objektom aj efektívne dostať, čo zahŕňa aj dohľadanie príslušných
informácií o nich. Pretože pri tom počte objektov to nebude jednoduché.

Za týchto podmienok je nemysliteľné realizovať archív bez
existujúcich a fungujúcich funkcií centrálnej jednoznačnej a trvalej identifikácie
kultúrnych aj digitálnych objektov, ďalej národného agregátora, ktorý kanonicky do
spoločného dátového modelu agreguje popisné údaje zo všetkých sektorov, v ktorých
sa digitalizuje obsah, taktiež národného registra pre autority, riadené slovníky a
tezaury, ako aj ďalších komponentov nevyhnutných pre beh centrálnych systémov.
Inými slovami povedané, všetky tri spomínané strategické ciele pre oblasť archívu,
portálu a registra sú veľmi úzko prepojené a je potrebné ich riešiť súčasne a
integrovane. Inak hrozia riziká, ktoré si v negatívnom príklade odskúšali napr. vo
Veľkej Británii (Dawson et al.).

Slovakiana na tieto potreby už od svojho začiatku reflektovala. Na
konci roku 2007 bolo spustené pilotné riešenie systému DISK MK SR, v rámci ktorého
bolo implementované pilotné riešenie pre Národný agregátor, Digitálny archív a
Portál kultúry. Bolo implementované v rokoch 2007 a 2008 dodávateľským konzorciom a
v súčinnosti s ďalšími partnermi a subdodávateľmi za aktívnej účasti IT odborov
jednotlivých participujúcich inštitúcií, ako aj ich dodávateľov informačných
systémov. Po polročnej prestávke projekt pokračoval v prvej polovici roku 2009 už pod
menom Slovakiana. V rámci tejto etapy sa odštartovalo pilotné riešenie pre Národný
register autorít, 3 inštitúcie sa integrovali do existujúceho Digitálneho archívu,
ďalšie sa pridali k Národnému agregátoru. Riešenie je v súčasnosti prevádzkované
v rámci infraštruktúry Univerzitnej knižnice v Bratislave a dostupné v sieti MK SR.

Za vôbec najcennejší prínos projektu považujeme existenciu a
prácu Pracovnej skupiny pre Slovakianu. Tá, aj keď to nešlo vždy ľahko a hladko,
nadviazala na výsledky pôvodnej Pracovnej skupiny pre interoperabilitu a reálne
udržiavala pri živote myšlienku medzisektorovej integrácie informačných systémov v
rezorte, a to pri riešení konkrétnych technických otázok na konkrétnych problémoch
z praxe. Riešitelia pri vývoji komponentov v jednotlivých oblastiach vždy predkladali
odpočet prác, výsledky analýz a návrhy koncepcií a ďalšieho smerovania, ku ktorým
sa skupina vyjadrovala a schvaľovala, príp. korigovala. Opíšme si podrobnejšie tie z
realizovaných komponentov, ktoré sa týkajú práve integrácie.

Pre Národný agregátor pilotné riešenie implementovalo
harvestovanie z jednotlivých inštitúcií cez rozhranie OAI-PMH. Pri implementácii bol
zvolený prístup implementácie kanonického dátového modelu (CDM), ktorý je
založený na CIDOC-CRM. Tento prístup – oproti prístupu, kde by sa zbieral len súbor
spoločných popisných údajov zo všetkých inštitúcií – poskytuje možnosť
vytvorenia prepojeného modelu popisných údajov ďalším spracovaním po harvestovaní
s možnosťami štrukturálneho hľadania. Metadáta obsahujú URL tých objektov, ktoré
sú priamo na webových stránkach inštitúcií (Portál kultúry nemá nahradiť
inštitucionálne portály, naopak, má byť pre ne vstupným bodom). Obsah CDM je
podriadený potrebám aplikácie Národného agregátora. CDM je serializovaný do
formátu RDF. Serializácia využíva štandardné schémy a mapovania, ak existujú.
Integrácia s pamäťovými a fondovými inštitúciami je implementovaná modulmi, ktoré
adaptujú IS inštitúcií mapovaním natívnych schém do CDM. Tento prístup bol pre
pilotné riešenie zvolený z toho dôvodu, že nezasahuje do IS inštitúcií, ale len
pristupuje k údajom, ktoré mapuje. V súčasnosti sú v Národnom agregátore
importované dáta zo 6 inštitúcií.

Pri Národnom registri autorít boli importované súbory
existujúcich personálnych autorít zo 4 inštitúcií, realizovaná a prezentovaná
analýza o štruktúre importovaných dát, spôsoboch vypĺňania selekčných polí,
využití pri katalogizačnom procese, existujúcimi medzisektorovými prienikmi a pre
importovaný súbor dát bol implemetovaný webovský prehliadač. Na základe analýzy
bol stanovený a pracovnou skupinou odsúhlasený ďalší postup v tejto oblasti.

Záverom je potrebné spomenúť, že pre ďalší vývoj v tejto
oblasti budú základnými dokumentmi výstupy zo Štúdie uskutočniteľnosti, ktorá
detailne rozpracuje realizáciu projektov a možnosti čerpania finančných zdrojov z
EÚ. Nepriamo sa podieľajú na realizácií štúdie rôzne dokumenty a projekty
(Stratégia rozvoja PFI, Europeana, Slovakiana, strategické dokumenty SR, politika EÚ,
technologické štandardy a i.), ako aj spoločná práca sekcií, odborov a organizácií
v zriaďovateľskej pôsobnosti MK SR.

V súčasnosti sa otvára jedinečný priestor a možnosť (zrejme
aj posledná), na realizáciu takýchto projektov v rozsahu, ktorý na jednej strane
umožní výrazné skvalitnenie a zefektívnenie práce odborníkov rezortu kultúry a na
druhej strane umožní laickej verejnosti prístup k informáciám. Oba faktory
predstavujú možnosť na spropagovanie práce odborníkov pracujúcich v kultúre i
samotných inštitúcií. Preto je nutná spolupráca, vôľa a hlavne nadšenie pre tento
základný projekt, ktorý bude spolupracovať a poskytovať jednotný integrovaný
nástroj pre všetkých zúčastnených v procese digitalizácie, na čo
najefektívnejšie a najekonomickejšie využitie poskytnutých finančných zdrojov a
zabezpečenie podpory procesu digitalizácie v čo najväčšej miere automatizácie
činností. Nástroj, ktorý bude integrovaný s ďalšími informačnými systémami,
bude poskytovať používateľom na laickej aj odbornej úrovni dlhodobú archiváciu,
organizáciu a sprístupnenie digitálneho kultúrneho obsahu, čím sa pre koncového
používateľa virtuálne zjednotí aj celá kultúrna obec a kultúrne dedičstvo.

 

Literatúra:

DAWSON, D. et al. Digitisation in the UK, JISC.
Dostupné na internete: <http://www.jisc.ac.uk/media/documents/programmes/digitisation/jisc-digi-in-uk-v1-07.pdf>

Share: