Digitalizačné pracovisko v UK TU Košice

Zo Slovenska




Budovanie digitálnej knižnice v UK TU

V roku 2001 vznikla v Univerzitnej knižnici (UK) Technickej univerzity v Košiciach (TU) iniciatíva na
budovanie digitálnej knižnice, ktorej súčasťou nie sú len externé zdroje, ale aj vlastný interný fond publikácií
pracovníkov TU. Táto iniciatíva je v súlade s medzinárodným trendom budovania otvorených archívov [1], založených
na princípoch interoperability systémov a ich lepšieho využívania v záujme prístupu k digitálnym zdrojom a službám.
Jadrom projektu digitálnej knižnice UK TU je vývoj a implementácia informačného systému zabezpečujúceho získavanie,
spracovávanie, uchovávanie a sprístupňovanie digitálnych zdrojov na úrovni úplných textov dokumentov publikačnej
činnosti TU – EPC TU [2]. Systém EPC TU je navrhnutý na používateľsky orientované komplexné zabezpečenie celého
procesu evidencie a registrácie publikačnej činnosti (PC) na TU. Niektoré súčasti systému sú už plne funkčné, iné
sú vo vývoji a riešení. Ide o tieto základné procesy:


  • elektronický zber podkladov: tvorba deskriptívnych metadát autormi, t. j. samotnými tvorcami primárnych
    zdrojov, prostredníctvom dynamických elektronických formulárov, s možnosťou pripojenia a prenosu (upload)
    úplného textu primárneho dokumentu;


  • digitalizácia: transformácia jednotlivých strán tlačeného primárneho dokumentu do digitálnej podoby vo
    forme grafických súborov;


  • bibliografické spracovanie: vzhľadom na to, že spracovanie je rozdelené medzi autora a katalogizátora,
    ide o verifikáciu, prípadne editáciu údajov vo formulári podľa digitálnej kópie primárneho dokumentu a pridanie
    administratívnych metadát;


  • výstupná kontrola kvality: kontrola digitálneho obrazu a bibliografického záznamu;


  • vyhľadávanie a prezentácia dát: vyhľadávanie cez webové rozhranie na základe popisných charakteristík
    dokumentu pomocou kľúčových slov, ich kombinácií a fráz, viacúrovňové sprístupňovanie (bibliografický záznam
    dostupný na internete, úplný text dostupný podľa podmienok zmluvy s autorom), prezentácia digitálnych kópií
    primárnych dokumentov v rôznych formátoch (html, doc, xml, pdf);


  • výstupy a štatistiky: automatické generovanie požadovaných zoznamov publikačnej činnosti a ohlasov na
    rôzne využitie (akreditácie pracovísk TU, výstupy podľa požiadaviek grantových agentúr);


  • manažérska nadstavba: štatistiky podľa potrieb pracovísk TU, “autorský systém“ prístupný cez webové
    rozhranie na definovanie prístupových práv k dokumentom (po implementácii digitálneho podpisu).

 


Počiatky digitalizácie

Zriadenie digitalizačného pracoviska (DP) v UK TU sa viaže na december 2001, v ktorom UK z prostriedkov
grantu Ministerstva školstva SR na podporu informačných technológií na vysokých školách (IT MŠ SR 2001), za
spolufinancovania TU, zakúpila vysokorýchlostný dokumentačný skener
Fujitsu so softvérom
VirtualReScan a dokumentačný server. Nutné hardvérové rozšírenie pracoviska, v záujme úschovy veľkého objemu
dát, sme zabezpečili v rámci projektu IT MŠ SR 2002. Týmto boli vytvorené základné technické podmienky na štart
prevádzky DP z hľadiska hardvéru.

V roku 2002 prebiehalo testovanie zariadení DP s následnou tvorbou technických, organizačných a personálnych
návrhov. Zároveň UK iniciovala viaceré rokovania s manažmentom TU a fakúlt s cieľom navrhnúť požiadavky na
informačný systém pre agendu publikačnej činnosti na TU a pracovné postupy akceptovateľné všetkými zúčastnenými,
ako aj ich rôznorodé požiadavky:


  • autori z TU: minimum práce s vykazovaním PC, spracovanie podkladov do databázy v čo najkratšom čase,
    jednoduchý prístup k personálnej bibliografii v požadovanom členení podľa druhu využitia a v štandardizovanej
    forme podľa STN ISO 690 a ISO 690-2.


  • UK TU: z hľadiska používateľov – sprístupnenie digitálneho archívu publikácií autorov z TU používateľom,
    zefektívnenie a podpora zberu publikácií na evidenciu do UK, poskytovanie výstupov podľa požiadaviek, pridané
    funkčnosti a služby pre autorov a manažment TU; z hľadiska interných potrieb UK – zefektívnenie spracovania,
    minimalizácia manuálnych činností, kontrola nad systémom kvôli možnosti finančne nenáročných a flexibilných
    zmien podľa požiadaviek, podpora otvorených štandardov a iniciatív na zlepšenie prístupu používateľov k
    zdrojom, získavanie skúseností v oblasti tvorby digitálnej knižnice;


  • manažment TU: jednoduchý prístup k bibliografii pracovísk a jednotlivcov v požadovanom členení a
    štandardizovanej forme za dané časové obdobie na rôzne využitie, najmä periodické hodnotenia pracovísk
    (akreditácie a evaluácie), grantové agentúry a pod., scientometrické hodnotenia pracovísk a jednotlivcov z TU,
    prezentácia a uchovanie výsledkov tvorivej práce autorov z TU do budúcnosti;


  • študenti TU: jednoduchý 7/24 prístup k základnej študijnej literatúre.

V januári 2003, po ukončení základných vývojových prác na vývoji modulu pre digitalizáciu
Scan a jeho testovacej prevádzky, začalo DP svoju rutinnú prevádzku v nadväznosti na spustenie modulu
elektronického zberu podkladov na publikačnú činnosť
eForm. Proces digitalizácie je viazaný na predchádzajúce vyplnenie a odoslanie elektronického formulára zo
strany autora, keďže ku každému elektronickému formuláru sa dynamicky vygeneruje tzv.
archívne číslo publikácie a
heslo. Archívne číslo je jedinečné pre daný dokument a je väzbovým prvkom medzi elektronickým formulárom,
bibliografickým záznamom o dokumente a digitálnou kópiou úplného textu dokumentu.


Proces digitalizácie

Po vyplnení a zaslaní elektronického formulára autorom a zapožičaní originálu primárneho dokumentu
publikačnej činnosti autora do UK na formálnu verifikáciu údajov (údaje vo formulári vs. údaje podľa dokumentu)
nastáva proces digitalizácie. (Výnimku tvoria prípady, ak bol k elektronickému formuláru pripojený úplný text
dokumentu ako súbor zhodný s originálom dokumentu v pomere 1 : 1 a v požadovanej kvalite.)

Proces digitalizácie sa skladá z nasledujúcich krokov:

  1. Príjem a evidencia zapožičaných originálnych dokumentov na digitalizáciu.

  2. Výber dokumentu na digitalizáciu podľa časového hľadiska (termín vrátenia dokumentu autorovi je
    štandardne 3 pracovné dni) a rozsahu (počet strán).

  3. Skenovanie relevantných strán primárneho dokumentu podľa interného pracovného postupu (rozlíšenie 400
    dpi, b/w).

  4. Úprava digitálneho obrazu (nastavenie kontrastu a jasu, odstránenie šumu, natočenie, orezanie čiernych
    okrajov a pod.).

  5. Uchovanie digitálnych obrazov v adresári pod archívnym číslom totožným s archívnym číslom zaslaného
    formulára pre daný dokument (formát TIFF).

  6. Výstupná kontrola kvality digitálnej kópie podľa určeného pracovného postupu. V prípade nekvality
    opätovná digitalizácia.

 

Po stránke personálnej DP nie je dodnes komplexne dobudované. V súčasnosti je obsadené 3 pracovníčkami (1 VŠ
a 2 SŠ), vykonávajúcimi aj inú odbornú – knihovnícku, resp. ekonomickú – agendu. Digitalizácii sa venujú dve
pracovníčky SŠ v priemere spolu 5 hodín denne, výstupnej kontrole kvality digitálnych obrazov a konverzii
elektronických dokumentov do formátu TIFF sa venuje jedna VŠ pracovníčka priemerne 6 hodín denne. Priemerný počet
zdigitalizovaných a skontrolovaných strán vychádza okolo 300 strán denne, čo síce v súčasnosti postačuje, ale
zároveň predstavuje kapacitný strop spracovateľských možností v UK za súčasného stavu odovzdávania dokumentov PC,
existujúcich pracovných postupov a nasadeného personálu.

V súčasnosti (t. j. po 16 mesiacoch prevádzky) tvorí digitálny archív UK TU vyše 5 000 titulov úplných textov
publikácií autorov z TU, čo je asi 60 000 naskenovaných strán publikácií. Z hľadiska typológie dokumentov je
rozloženie digitálneho archívu nasledujúce: dokumenty v zborníkoch (37 %), ohlasy na publikačnú činnosť (33 %),
dokumenty v časopisoch (18 %), monografie (6 %), iné typy dokumentov (6 %).


Vyhodnotenie a budúci vývoj

Elektronický zber podkladov na registráciu publikačnej činnosti, nasadený na TU od januára 2003, asi
trojnásobne zvýšil počet odovzdaných publikácií na evidenciu a registráciu do UK oproti klasickému odovzdávaniu
podkladov v minulých rokoch (vyplnenie a odovzdanie tlačeného formulára autorom a odovzdanie tlačených kópií
relevantných strán dokumentu do UK na spracovanie). Z hľadiska spracovateľských kapacít UK sa zvýšené objemy
dodaných podkladov na evidenciu spracovávajú pri stále rovnakom personálnom zabezpečení na úseku spracovania. Ide o
dve odborné pracovníčky (SŠ), pričom každej pribudli aj ďalšie agendy (príjem, návrat a evidencia originálnych
podkladov na formálnu verifikáciu, resp. digitalizáciu). Na bibliografickom spracovaní publikačnej činnosti sme
vďaka prvotnej tvorbe metadát samotnými autormi úplne odstránili zdĺhavé prepisovanie dát z tlačeného formulára a
fyzického dokumentu do elektronickej podoby, čím sme výrazne znížili chybovosť. Tiež sme odstránili ťažkopádnu
manipuláciu

s “dokumentom v ruke“ (prípadne s jeho tlačenou kópiou), ktorú nahradila digitálna kópia.

Vývoj a implementácia informačného systému digitálnej knižnice v UK TU si vyžaduje nielen technické
zabezpečenie, ale aj dostatok kvalifikovaných špecialistov na zabezpečovanie nových úloh v oblasti manažmentu,
analýzy a návrhu informačného systému, vývoja informačného systému, výstupnej kontroly kvality a marketingu.
Zároveň je potrebné zabezpečiť podporu používateľov systému (autori) vo forme pravidelných inštruktáží a školení,
neustáleho kontaktu s autormi, ako aj kooperáciu s manažmentom a pracoviskami TU.

Pre rutinnú a kvalitnú prevádzku DP bude potrebné v budúcnosti doriešiť najmä personálne otázky (v súčasnosti
nám chýbajú minimálne 2 pracovníci vývoja) a pokračovať vo vývojových prácach na module
Scan. Systémovým riešením a nasadením vhodného softvéru bude možné omyly pri práci s naskenovanými
dokumentmi do značnej miery eliminovať a zároveň zvýšiť produktivitu pri zabezpečení požadovanej kvality. Vyvinutý
softvér bude mať využitie nielen pri digitalizácii publikačnej činnosti, ale perspektívne aj pri elektronickej
medziknižničnej výpožičke dokumentov. V tomto roku plánujeme ukončiť vyhľadávacie webové rozhranie systému EPC TU a
sprístupniť prvé dokumenty z digitálneho archívu vo forme úplných textov, pripojených k bibliografickému záznamu.
Toto sa uskutoční za predpokladu, že sa podarí doriešiť súvisiace legislatívne otázky (príprava a schválenie
licenčnej dohody uzatvorenej medzi TU a autorom, súhlas autora na zverejnenie dokumentu).


Zoznam bibliografických odkazov:


Open Archives Initiative

[online]. [cit 2004-04-23]. Dostupné na:
http://www.openarchives.org/


Evidencia publikačnej činnosti TU Košice


EPC TU [online]. [cit 2004-04-23]. Dostupné na:
http://epc.lib.tuke.sk

TETŘEVOVÁ, Milena – MAŤAŠOVSKÝ, Žigmund: Kooperatívna tvorba digitálnej knižnice v akademickom prostredí na
podporu vzdelávania a výskumu.
In: Informačné správanie a digitálne knižnice : Zborník z medzinárodnej konferencie SÚZA, Bratislava 21. – 22.
máj 2003. Bratislava :
CVTI SR, 2003, s. 207-213, ISBN 80-85165-87-2.

Zdieľať: