Budovanie digitálnej knižnice v UK TU
V roku 2001 vznikla v Univerzitnej knižnici (UK) Technickej univerzity v Košiciach (TU) iniciatíva na
budovanie digitálnej knižnice, ktorej súčasťou nie sú len externé zdroje, ale aj vlastný interný fond publikácií
pracovníkov TU. Táto iniciatíva je v súlade s medzinárodným trendom budovania otvorených archívov [1], založených
na princípoch interoperability systémov a ich lepšieho využívania v záujme prístupu k digitálnym zdrojom a službám.
Jadrom projektu digitálnej knižnice UK TU je vývoj a implementácia informačného systému zabezpečujúceho získavanie,
spracovávanie, uchovávanie a sprístupňovanie digitálnych zdrojov na úrovni úplných textov dokumentov publikačnej
činnosti TU – EPC TU [2]. Systém EPC TU je navrhnutý na používateľsky orientované komplexné zabezpečenie celého
procesu evidencie a registrácie publikačnej činnosti (PC) na TU. Niektoré súčasti systému sú už plne funkčné, iné
sú vo vývoji a riešení. Ide o tieto základné procesy:
-
elektronický zber podkladov: tvorba deskriptívnych metadát autormi, t. j. samotnými tvorcami primárnych
zdrojov, prostredníctvom dynamických elektronických formulárov, s možnosťou pripojenia a prenosu (upload)
úplného textu primárneho dokumentu;
-
digitalizácia: transformácia jednotlivých strán tlačeného primárneho dokumentu do digitálnej podoby vo
forme grafických súborov;
-
bibliografické spracovanie: vzhľadom na to, že spracovanie je rozdelené medzi autora a katalogizátora,
ide o verifikáciu, prípadne editáciu údajov vo formulári podľa digitálnej kópie primárneho dokumentu a pridanie
administratívnych metadát;
-
výstupná kontrola kvality: kontrola digitálneho obrazu a bibliografického záznamu;
-
vyhľadávanie a prezentácia dát: vyhľadávanie cez webové rozhranie na základe popisných charakteristík
dokumentu pomocou kľúčových slov, ich kombinácií a fráz, viacúrovňové sprístupňovanie (bibliografický záznam
dostupný na internete, úplný text dostupný podľa podmienok zmluvy s autorom), prezentácia digitálnych kópií
primárnych dokumentov v rôznych formátoch (html, doc, xml, pdf);
-
výstupy a štatistiky: automatické generovanie požadovaných zoznamov publikačnej činnosti a ohlasov na
rôzne využitie (akreditácie pracovísk TU, výstupy podľa požiadaviek grantových agentúr);
-
manažérska nadstavba: štatistiky podľa potrieb pracovísk TU, “autorský systém“ prístupný cez webové
rozhranie na definovanie prístupových práv k dokumentom (po implementácii digitálneho podpisu).
Počiatky digitalizácie
Zriadenie digitalizačného pracoviska (DP) v UK TU sa viaže na december 2001, v ktorom UK z prostriedkov
grantu Ministerstva školstva SR na podporu informačných technológií na vysokých školách (IT MŠ SR 2001), za
spolufinancovania TU, zakúpila vysokorýchlostný dokumentačný skener
Fujitsu so softvérom
VirtualReScan a dokumentačný server. Nutné hardvérové rozšírenie pracoviska, v záujme úschovy veľkého objemu
dát, sme zabezpečili v rámci projektu IT MŠ SR 2002. Týmto boli vytvorené základné technické podmienky na štart
prevádzky DP z hľadiska hardvéru.
V roku 2002 prebiehalo testovanie zariadení DP s následnou tvorbou technických, organizačných a personálnych
návrhov. Zároveň UK iniciovala viaceré rokovania s manažmentom TU a fakúlt s cieľom navrhnúť požiadavky na
informačný systém pre agendu publikačnej činnosti na TU a pracovné postupy akceptovateľné všetkými zúčastnenými,
ako aj ich rôznorodé požiadavky:
-
autori z TU: minimum práce s vykazovaním PC, spracovanie podkladov do databázy v čo najkratšom čase,
jednoduchý prístup k personálnej bibliografii v požadovanom členení podľa druhu využitia a v štandardizovanej
forme podľa STN ISO 690 a ISO 690-2.
-
UK TU: z hľadiska používateľov – sprístupnenie digitálneho archívu publikácií autorov z TU používateľom,
zefektívnenie a podpora zberu publikácií na evidenciu do UK, poskytovanie výstupov podľa požiadaviek, pridané
funkčnosti a služby pre autorov a manažment TU; z hľadiska interných potrieb UK – zefektívnenie spracovania,
minimalizácia manuálnych činností, kontrola nad systémom kvôli možnosti finančne nenáročných a flexibilných
zmien podľa požiadaviek, podpora otvorených štandardov a iniciatív na zlepšenie prístupu používateľov k
zdrojom, získavanie skúseností v oblasti tvorby digitálnej knižnice;
-
manažment TU: jednoduchý prístup k bibliografii pracovísk a jednotlivcov v požadovanom členení a
štandardizovanej forme za dané časové obdobie na rôzne využitie, najmä periodické hodnotenia pracovísk
(akreditácie a evaluácie), grantové agentúry a pod., scientometrické hodnotenia pracovísk a jednotlivcov z TU,
prezentácia a uchovanie výsledkov tvorivej práce autorov z TU do budúcnosti;
-
študenti TU: jednoduchý 7/24 prístup k základnej študijnej literatúre.
V januári 2003, po ukončení základných vývojových prác na vývoji modulu pre digitalizáciu
Scan a jeho testovacej prevádzky, začalo DP svoju rutinnú prevádzku v nadväznosti na spustenie modulu
elektronického zberu podkladov na publikačnú činnosť
eForm. Proces digitalizácie je viazaný na predchádzajúce vyplnenie a odoslanie elektronického formulára zo
strany autora, keďže ku každému elektronickému formuláru sa dynamicky vygeneruje tzv.
archívne číslo publikácie a
heslo. Archívne číslo je jedinečné pre daný dokument a je väzbovým prvkom medzi elektronickým formulárom,
bibliografickým záznamom o dokumente a digitálnou kópiou úplného textu dokumentu.
Proces digitalizácie
Po vyplnení a zaslaní elektronického formulára autorom a zapožičaní originálu primárneho dokumentu
publikačnej činnosti autora do UK na formálnu verifikáciu údajov (údaje vo formulári vs. údaje podľa dokumentu)
nastáva proces digitalizácie. (Výnimku tvoria prípady, ak bol k elektronickému formuláru pripojený úplný text
dokumentu ako súbor zhodný s originálom dokumentu v pomere 1 : 1 a v požadovanej kvalite.)
Proces digitalizácie sa skladá z nasledujúcich krokov:
-
Príjem a evidencia zapožičaných originálnych dokumentov na digitalizáciu.
-
Výber dokumentu na digitalizáciu podľa časového hľadiska (termín vrátenia dokumentu autorovi je
štandardne 3 pracovné dni) a rozsahu (počet strán).
-
Skenovanie relevantných strán primárneho dokumentu podľa interného pracovného postupu (rozlíšenie 400
dpi, b/w).
-
Úprava digitálneho obrazu (nastavenie kontrastu a jasu, odstránenie šumu, natočenie, orezanie čiernych
okrajov a pod.).
-
Uchovanie digitálnych obrazov v adresári pod archívnym číslom totožným s archívnym číslom zaslaného
formulára pre daný dokument (formát TIFF).
-
Výstupná kontrola kvality digitálnej kópie podľa určeného pracovného postupu. V prípade nekvality
opätovná digitalizácia.
Po stránke personálnej DP nie je dodnes komplexne dobudované. V súčasnosti je obsadené 3 pracovníčkami (1 VŠ
a 2 SŠ), vykonávajúcimi aj inú odbornú – knihovnícku, resp. ekonomickú – agendu. Digitalizácii sa venujú dve
pracovníčky SŠ v priemere spolu 5 hodín denne, výstupnej kontrole kvality digitálnych obrazov a konverzii
elektronických dokumentov do formátu TIFF sa venuje jedna VŠ pracovníčka priemerne 6 hodín denne. Priemerný počet
zdigitalizovaných a skontrolovaných strán vychádza okolo 300 strán denne, čo síce v súčasnosti postačuje, ale
zároveň predstavuje kapacitný strop spracovateľských možností v UK za súčasného stavu odovzdávania dokumentov PC,
existujúcich pracovných postupov a nasadeného personálu.
V súčasnosti (t. j. po 16 mesiacoch prevádzky) tvorí digitálny archív UK TU vyše 5 000 titulov úplných textov
publikácií autorov z TU, čo je asi 60 000 naskenovaných strán publikácií. Z hľadiska typológie dokumentov je
rozloženie digitálneho archívu nasledujúce: dokumenty v zborníkoch (37 %), ohlasy na publikačnú činnosť (33 %),
dokumenty v časopisoch (18 %), monografie (6 %), iné typy dokumentov (6 %).
Vyhodnotenie a budúci vývoj
Elektronický zber podkladov na registráciu publikačnej činnosti, nasadený na TU od januára 2003, asi
trojnásobne zvýšil počet odovzdaných publikácií na evidenciu a registráciu do UK oproti klasickému odovzdávaniu
podkladov v minulých rokoch (vyplnenie a odovzdanie tlačeného formulára autorom a odovzdanie tlačených kópií
relevantných strán dokumentu do UK na spracovanie). Z hľadiska spracovateľských kapacít UK sa zvýšené objemy
dodaných podkladov na evidenciu spracovávajú pri stále rovnakom personálnom zabezpečení na úseku spracovania. Ide o
dve odborné pracovníčky (SŠ), pričom každej pribudli aj ďalšie agendy (príjem, návrat a evidencia originálnych
podkladov na formálnu verifikáciu, resp. digitalizáciu). Na bibliografickom spracovaní publikačnej činnosti sme
vďaka prvotnej tvorbe metadát samotnými autormi úplne odstránili zdĺhavé prepisovanie dát z tlačeného formulára a
fyzického dokumentu do elektronickej podoby, čím sme výrazne znížili chybovosť. Tiež sme odstránili ťažkopádnu
manipuláciu
s “dokumentom v ruke“ (prípadne s jeho tlačenou kópiou), ktorú nahradila digitálna kópia.
Vývoj a implementácia informačného systému digitálnej knižnice v UK TU si vyžaduje nielen technické
zabezpečenie, ale aj dostatok kvalifikovaných špecialistov na zabezpečovanie nových úloh v oblasti manažmentu,
analýzy a návrhu informačného systému, vývoja informačného systému, výstupnej kontroly kvality a marketingu.
Zároveň je potrebné zabezpečiť podporu používateľov systému (autori) vo forme pravidelných inštruktáží a školení,
neustáleho kontaktu s autormi, ako aj kooperáciu s manažmentom a pracoviskami TU.
Pre rutinnú a kvalitnú prevádzku DP bude potrebné v budúcnosti doriešiť najmä personálne otázky (v súčasnosti
nám chýbajú minimálne 2 pracovníci vývoja) a pokračovať vo vývojových prácach na module
Scan. Systémovým riešením a nasadením vhodného softvéru bude možné omyly pri práci s naskenovanými
dokumentmi do značnej miery eliminovať a zároveň zvýšiť produktivitu pri zabezpečení požadovanej kvality. Vyvinutý
softvér bude mať využitie nielen pri digitalizácii publikačnej činnosti, ale perspektívne aj pri elektronickej
medziknižničnej výpožičke dokumentov. V tomto roku plánujeme ukončiť vyhľadávacie webové rozhranie systému EPC TU a
sprístupniť prvé dokumenty z digitálneho archívu vo forme úplných textov, pripojených k bibliografickému záznamu.
Toto sa uskutoční za predpokladu, že sa podarí doriešiť súvisiace legislatívne otázky (príprava a schválenie
licenčnej dohody uzatvorenej medzi TU a autorom, súhlas autora na zverejnenie dokumentu).
Zoznam bibliografických odkazov:
Open Archives Initiative
[online]. [cit 2004-04-23]. Dostupné na:
http://www.openarchives.org/
Evidencia publikačnej činnosti TU Košice
–
EPC TU [online]. [cit 2004-04-23]. Dostupné na:
http://epc.lib.tuke.sk
TETŘEVOVÁ, Milena – MAŤAŠOVSKÝ, Žigmund: Kooperatívna tvorba digitálnej knižnice v akademickom prostredí na
podporu vzdelávania a výskumu.
In: Informačné správanie a digitálne knižnice : Zborník z medzinárodnej konferencie SÚZA, Bratislava 21. – 22.
máj 2003. Bratislava : CVTI SR, 2003, s. 207-213, ISBN 80-85165-87-2.
|