Registr digitalizace.cz

Zo zahraničia

I. Úvod

Registrdigitalizace.cz je projekt, na jehož vývoji se podílí společně Knihovna Akademie věd České republiky[1], Národní knihovna České republiky[2] a soukromá společnost INCAD, s. r. o.[3] Financován je zejména z prostředků výzkumného záměru „Evidence digitalizovaných dokumentů, sledování procesu zpracování a vývoj systému pro zpřístupnění“, jehož hlavním řešitelem je Knihovna Akademie věd České republiky a dále pak i z dalších zdrojů. Cílem projektu je vytvořit národní registr digitalizovaných dokumentů, který by měl institucím, jež se zabývají digitalizací svých knihovních sbírek, pomoci se vyvarovat duplicitám ve zpracování dat a dále sdílet výsledky svých digitalizačních aktivit s dalšími českými institucemi. To by mělo přispět k úspoře finančních prostředků a zároveň i času, vzhledem k tomu, že by se pomocí tohoto systému mělo zabránit přípravě a zpracování stejných dokumentů. Registr zároveň poskytuje pomocí prolinků do elektronických katalogů základní informace o originálním dokumentu. Stejným způsobem je propojen i s digitálním objektem.

Registr digitalizace nabízí zároveň základní workflow pro řízení procesu digitalizace uvnitř jednotlivých institucí. Nabízí unikátní možnost monitorovat jak interní pracovní postupy, tak i spolupráci s jednotlivými externími dodavateli.

V této rovině je však nutné Registr digitalizace rozlišit na dvě separátní uživatelská rozhraní. Jde o webovou službu, která je dostupná všem na adrese www.registrdigitalizace.cz, kde jsou k dispozici informace o digitalizovaných dokumentech napříč všemi zúčastněnými institucemi a dále pak o výše zmíněný systém pro sledování digitalizačního workflow, který je určen pro lokální použití.

II. Technologické pozadí projektu

Celý systém je vystavěn na aplikačním frameworku Relief III (J2EE)[4]. Data jsou ukládána do relační databáze Oracle. Pro uživatelské zpřístupnění aktuálních informací o stavu digitalizace je použit vyhledávací nástroj FAST. Registr digitalizace je nezávislý na operačním systému a může být přeložen do jakéhokoli jazyku, což je výhodné s ohledem na jeho mezinárodní rozšíření. V současné době pracuje vývojový tým na nové verzi systému Relief s označením IV, který má být již plně postaven na open-sourcových řešeních typu FEDORA Commons, Jasper či Grails,[5] které ještě více usnadní jeho šíření. To plně koresponduje s předsevzetím vyřčeným na počátku vývojových prací a to že: „V rámci vývoje systému bude stále kladen důraz na jeho flexibilitu a snadnou rozšiřitelnost.“

S plánovaným přechodem na masovou digitalizaci knihovních dokumentů je nutné stále zvyšovat automatizaci veškerých procesů spojených se získáváním záznamů, zpracováním dokumentů a následným propojením na webové služby. Proto bude systém v blízké době rozšířen například o automatické sklízení dat pomocí protokolů OAI-PHM či Z39.50 a další inovace, které tento přechod budou náležitě reflektovat.

V systému jsou obsaženy jednoznačné identifikátory – jednoznačné ID Registru digitalizace, číslo ČNB a další, které mají zamezit duplicitním záznamům a jsou využitelné i v rámci jednotlivých institucí.

foltyn1.jpg (929759 bytes)
Obr. č. 1: Webový portál www.registrdigitalizace.cz.

 

III. Aplikační struktura digitalizačního workflow

Z hlediska digitalizačního workflow je sytém otevřen pro různé modifikace, které ho mohou uzpůsobit individuálním potřebám každé instituce. Tyto operace mohou vést k postupnému rozšiřování stávající funkcionality, která vychází z praktických zkušeností digitalizačních pracovišť Národní knihovny České republiky a Knihovny Akademie věd, kde se v současné době aktivně využívá. Nesmírně důležitou skutečností je i fakt, že systém je schopen monitorovat nejen samotnou digitalizaci, ale zároveň zpracování mikrofilmů se všemi specifiky – tj. například s údaji o denzitě filmů apod.

foltyn2.jpg (953659 bytes)
Obr. č. 2: Zobrazení informací o monografii v digitalizačním workflow Relief III (přístupný pouze s platným heslem)[6]

Samotný systém je sestaven z několika svébytných modulů, které je možné používat, ale zároveň je i do individuálního workflow nezahrnovat tak, aby bylo možné maximálně vyjít vstříc potřebám jednotlivých institucí. Nepanují zde ani žádná striktní omezení ohledně typů dokumentů. Zatím se sledují zejména monografie, periodika, mapy či staré tisky, ale je zde možnost zahrnout i další typy dokumentů. U všech uvedených typů je možné sledovat prakticky celý proces jejich zpracování od výběru a přípravy, přes vlastní skenování a tvorbu metadat, až k finální prezentaci prostřednictvím digitální knihovny. V podstatě ke každému kroku je možné vygenerovat vlastní náhled, který zobrazí ty nejdůležitější informace, nebo vytisknout tiskový výstup. Zároveň je možné sledovat statistické údaje o efektivitě produkce.

IV. Propojitelnost se souvisejícími knihovními systémy

Registr digitalizace byl od samého počátku dimenzován tak, aby byl schopen plně komunikovat se souvisejícími knihovními systémy. Je tak do něj možné importovat bibliografické záznamy o dokumentech, které jsou určeny pro digitalizaci. To se děje pomocí datových dávek, jež jsou exportovány z knihovního systému ALEPH ve formátu MARCxml. Pomocí protokolu OAI-PMH je možné získat informace o již zdigitalizovaných dokumentech. Dále je možné poskytovat informace o ukončení procesu digitalizace s příslušným linkem na digitální dokument do lokálního knihovního systému či poté zprostředkovaně i do Souborného katalogu. Registr digitalizace je tak schopen komunikovat s dalšími důležitými systémy – digitální knihovnou Kramerius a elektronickým katalogem.

foltyn3.jpg (859767 bytes)

Obr. č. 3: Diagram zobrazující konektivitu Registru digitalizace s dalšími knihovními systémy v rámci NK ČR

V. Stávající partneři projektu aneb jak je možné přispívat?

K 1. květnu 2010 obsahuje webová služba www.registrdigitalizace.cz téměř 24 000 záznamů o digitalizovaných dokumentech. Tato data pocházejí nejen z obou institucí, jež systém vyvíjejí, ale i dalších, které patří mezi nejvýznamnější knihovny na území České republiky. Jmenovat lze například Moravskou zemskou knihovnu v Brně, Městskou knihovnu v Praze či Národní technickou knihovnu. Mezi vlastníky digitalizovaných dokumentů, o nichž se je možné v Registru dozvědět, patří však mnohé další instituce zaměřené na speciální sbírky či knihovny lokálního charakteru. Zde je možné uvést mimo jiných například Národní lékařskou knihovnu, Městskou knihovnu Horažďovice či Knihovnu Vojenského historického ústavu.

Do systému může v současné době přispět jakákoli instituce, zabývající se digitalizací knihovních dokumentů, a to dvěma různými způsoby. Buď to pasivně – což znamená poskytnout záznamy o svých digitalizovaných dokumentech prostřednictvím formuláře obsaženého na webové stránce Registru digitalizace či pomocí kontaktního formuláře umístěného tamtéž, či aktivně, jako plnohodnotný uživatel systému sledující workflow. To obnáší získání systémových uživatelských účtů a následné zaškolení do jednotlivých operací umožňujících monitorovat svou výrobu digitálních dat.

VI. Budoucnost projektu

Nejbližším cílem na národní úrovni je získávat další data od českých institucí, abychom byli schopně plnohodnotně naplnit původní cíle projektu, tudíž stát se centrálním registrem všech digitalizovaných dokumentů vzniklých na území České republiky. Pokračovat budou i práce na samotném systému.

Z mezinárodního hlediska spějí během počátku května 2010 ke konci přípravy nadnárodního projektu, jehož cílem je v první úrovni vytvořit centrální registr digitalizovaných dokumentů pro území střední Evropy. Toto teritorium bylo zvoleno záměrně s ohledem na společný historický vývoj a množství stejných dokumentů, jež jsou obsaženy v knihovních sbírkách jednotlivých partnerských zemí. Do projektu se podařilo získat významné instituce ze všech relevantních států – Německa, Rakouska, Polska, Slovenska, Maďarska a Slovinska. Jedním z dalších náplní tohoto projektu je i připravit pilotní verzi začlenění archivních sbírek do registru digitalizovaných dokumentů, což může dosah registru ještě více rozšířit. Pokud vše půjde podle předpokladů a projekt bude schválen, tak veškeré práce začnou na počátku roku 2011 s perspektivou, že během tří let trvání projektu by měl být uvedený registr k dispozici nejen odborné veřejnosti.

VII. Význam projektu

Registr digitalizace nabízí prostřednictvím své webové aplikaci jedinečnou databázi digitalizovaných dokumentů, které jsou propojeny přímo do digitálních knihoven i elektronických katalogů, což významně usnadňuje orientaci v rámci digitálních dat. Instituce tu tímto způsobem prezentují výsledky své práce, mohou koordinovat své aktivity s dalšími projekty, čímž ušetří finanční prostředky i čas a skrze tvůrce projektu budou v případě schválení projektu pasivně zainteresováni v nadnárodní iniciativě DigitizationRegistry.eu.

V případě aktivního využití systému pak mohou sledovat postup jednotlivých operací v rámci své výroby, mají přehled o stavu zpracování dokumentů či přístup k statistikám monitorujícím efektivitu práce.



[1] Více informací na webové stránce http://www.lib.cas.cz.

[2] Základní informace na webové stránce www.nkp.cz.

[3] Více na http://www.incad.cz.

[4] Jde o systém pro efektivní správu objektů, tzv. record management systém. Vychází s oborové specifikace Java 2 Enterprise Edition (J2EE).
     Více na http://www.incad.cz/jnp/cz/www/produkty/relief/index.html.

[5] Podrobné informace o těchto open-sourcových řešení jsou k dispozici na webových stránkách http://www.fedora-commons.org/, http://jasperforge.org/projects/jasperreports a http://www.grails.org/.

[6] Služba je dostupná na http://sluzby.incad.cz/nkp/digital/plaant?action=login.

[7] Mgr. Tomáš Foltýn vystudoval v letech 2002 až 2008 Kulturní dějiny na Filozofické fakultě Univerzity Pardubice. V současnosti zde pokračuje doktorským studiem ve stejném oboru. Již během svých studií pracoval v Oddělení digitalizace Národní knihovny ČR, kde pracuje i v současné době jako projektový manažer. Je spoluodpovědný za řešení mnoha národních i mezinárodních projektů, mezi něž patří například IMPACT, Registrdigitalizace.cz, Kramerius, VISK 4 a další.

Zdieľať: