Centrálny register publikačnej činnosti

From Slovakia

Úvod

Publikačná činnosť predstavuje jeden z hlavných ukazovateľov vedeckovýskumnej činnosti vysokej školy a zároveň nastavuje zrkadlo aj kvalite jej pedagogickej činnosti. V roku 2005 bol jej význam podčiarknutý zahrnutím do metodiky rozdeľovania rozpočtových finančných prostriedkov a povinnosť odovzdávania i zverejňovania výsledkov publikačnej činnosti verejnou vysokou školou bola upravená Smernicou č. 13/2005-R z 31. augusta 2005 o bibliografickej registrácii a kategorizácii publikačnej činnosti a ohlasov.

Účelom smernice bolo zabezpečiť jednotný postup pri registrovaní a vykazovaní publikačnej činnosti, vymedziť predmet bibliografickej registrácie, definovať základné pravidlá a kategórie publikácií a ohlasov. Smernica uložila akademickým knižniciam na vysokých školách povinnosť bibliografickej registrácie publikačnej činnosti vysokoškolských učiteľov, výskumných pracovníkov a doktorandov vysokej školy.

Centrálne zhromažďovanie údajov pre potreby rozpočtu z VVŠ na MŠ prebiehalo nárazovo (rok 2005 v papierovej podobe, rok 2006 v elektronickej podobe) a MŠ SR nedisponovalo efektívnym nástrojom pre kontrolu a ďalšie spracovanie doručených záznamov.

Centrálny register evidencie publikačnej činnosti (CREPČ)

Skutočnosť, že publikačná činnosť (EPČ) je registrovaná knižnicami väčšinou ako súčasť knižnično-informačných systémov (KIS), vytvára vhodné podmienky na integráciu údajov o publikačných aktivitách.

Spracovanie údajov o publikáciách v knižnično-informačnom systéme podlieha záväzným pravidlám. Sú to najmä Anglo-americké katalogizačné pravidlá (AACR 2) pre popis publikácií, formát MARC 21/UNIMARC pre štruktúru záznamov, pravidlá ISBD (International Standard Bibliographic Description) pre štruktúru výstupov, ISO 2709 pre výmenu dát, protokol Z 39.50 pre prezentáciu, export, import a ďalšie.

Východiskovým predpokladom bolo, že väčšina vysokých škôl má implementovaný niektorý z profesionálnych KIS (napr. Rapid Library, Virtua, Aleph alebo Dawinci), prípadne samostatné aplikácie vytvorené vo vlastnej réžii. Používané systémy umožňujú webovú prezentáciu údajov a veľká časť vysokých škôl má databázy publikačnej činnosti dostupné cez web a umožňuje ich prehľadávanie prostredníctvom rôznych kritérií, generovanie prehľadov EPČ za jednotlivé pracoviská či VŠ ako celok.

Tento stav viedol k vypísaniu centrálneho rozvojového projektu MŠ SR na vybudovanie centrálneho registra publikačnej činnosti.

Hlavným cieľom projektu bolo vytvorenie centrálneho registra na evidenciu publikačnej činnosti (CREPČ) schopného v čo najvyššej miere automatizovať proces získavania a vyhodnocovania údajov súvisiacich s publikačnou činnosťou verejných vysokých škôl. Získané údaje predstavujú podklady na vytvorenie výročnej správy fakúlt a univerzít o publikačnej činnosti, ako i ročnej databázy o vytvorených alebo publikovaných dielach, ktoré slúžia ako podklad pre dotačnú činnosť Ministerstva školstva SR univerzitám v oblasti vedy, výskumu a vývoja. Zhromaždené údaje majú na úrovni verejnosti poskytovať prehľad o činnosti všetkých (univerzitných) pracovísk a súčasne umožňovať kvalifikované porovnanie a vyhodnotenie činnosti rovnako zameraných pracovísk na rôznych univerzitách. Realizácia projektu bola zložená z nasledujúcich čiastkových cieľov:  

  • analýza možností a definícia formátov a protokolov na transfer údajov z KIS VVŠ na CREPČ MŠ SR,
  • na úrovni CREPČ definovať štruktúru databázy tak, aby bolo možné realizovať výmenu so všetkými univerzitnými pracoviskami a vytvoriť centrálny register publikačnej činnosti ako kombináciu databázového servera a používateľského rozhrania,
  • implementovať funkcie schopné detegovať zdvojené alebo viacnásobné záznamy, tvorbu štatistík, inteligentné vyhľadávanie a triedenie,
  • pre VVŠ, ktoré nedisponujú vhodným riešením pre evidenciu publikačnej činnosti, poskytnúť aplikáciu komunikujúcu s CREPČ.

 
Analýza problematiky a príprava centrálneho registra

Ako prvý krok bolo nutné zmapovať aktuálny stav evidencie publikačnej činnosti na vysokých školách SR, pričom sa potvrdili očakávané predpoklady:

  • väčšina verejných VŠ používa profesionálne IS, typicky ako súčasť riešenia pre ich univerzitnú knižnicu (ARL, DAWINCI, Virtua, Aleph, ProEpc),
  • časť má vlastný systém,
  • časť výkazy realizovala ručnou kompiláciou podkladov.

Na základe posúdenia reálnej situácie bol vzhľadom na nezávislosť, čitateľnosť a potreby unifikácie dát zvolený ako najvhodnejší formát – formát XML definovaný pomocou XSD. Jeho výhody spočívajú v:

  • nezávislosti od štruktúry polí UNIMARC, ani polí MARC21,
  • použiteľnosti aj pre vysoké školy, ktoré nesumarizujú EPČ prostredníctvom KIS,
  • kompatibilite s nástrojmi využívanými na osobných počítačoch (HTML, MS Office dokumenty),
  • kompatibilite so zahraničím,
  • plnom rešpektovaní legislatívy a odporúčaní pre výstavbu štátnych informačných systémov, ich súčastí a protokolov na výmenu dát.

Jedinou nevýhodou formátu zostala nutnosť konverzie údajov z existujúceho KIS do požadovaného formátu. Tento aspekt však bol eliminovaný prostredníctvom rozpočtu projektu, v ktorom boli pre všetkyVVŠ vyčlenené a poskytnuté finančné zdroje umožňujúce vyriešiť požiadavku.

Následne bola pre CREPČ definovaná vo formáte XML dátová štruktúra s cieľom:

  • striktne definovať minimálny záznam pre potreby CREPČ (identifikácia zdroja katalogizácie, druh dokumentu, kód kategórie dokumentu a časové zaradenie, príslušnosť záznamu k pracovisku/pracoviskám, príslušnosť záznamu k autorom – informácie o roli autora a jeho podiele na zázname),
  • definovať povinné i voliteľné elementy a striktne definovať ich vzájomné vzťahy,
  • zabezpečiť prevod všetkých dát nevyhnutných pre funkcie registra (povinné polia) a ďalších dát, ktoré prinášajú dôležitú informačnú hodnotu pre potenciálnych používateľov CREPČ (vedecké agentúry, akreditačná komisia, verejnosť a pod.),
  • minimalizovať chyby vyplývajúce z rozdielov implementácie noriem rôznymi informačnými systémami alebo rôznymi pracoviskami používajúcimi systém rovnakého výrobcu s inými nastaveniami,
  • zabezpečiť formát ľahko implementovateľný aj v informačných systémoch nepoužívajúcich normu ISO 2709 a niektorý z MARC formátov,
  • použiť formát, ktorý bude ľahko rozšíriteľný a modifikovateľný aj pre budúce (a dosiaľ neznáme) funkcie CREPČ alebo jeho systémové rozšírenia (v čom sú MARC formáty obmedzené až nepoužiteľné),
  • presná špecifikácia výmenného formátu je umiestnená priamo na serveri centrálneho registra alebo je k dispozícii na požiadanie.

Súčasťou riešenia bola nutne i komunikačná schéma na výmenu údajov medzi VVŠ a CREPČ pozostávajúca z nasledujúcich krokov:

  • VVŠ vo vlastnej réžii spracováva EPC pracovníkov a v určenom termíne odovzdáva dátový súbor XMLs dávkou pre potreby štatistického zhodnotenia MŠ SR,
  • pred odovzdaním dávky je vhodné realizovať validáciu prostredníctvom štandardných prvkov operačného systému (DOM validátor – súčasť najnovších verzií www prehliadačov) a/alebo prostredníctvom aplikácie na tento účel vyvinutej riešiteľmi projektu,
  • odovzdávanie dávky do CREPČ prebieha prostredníctvom rozhrania na zaslanie dávky, ktoré:
    • umožňuje upload dávky v privátnej sekcii VVŠ,
    • v procese uploadu skontroluje základnú syntaktickú správnosť a v prípade úspechu zobrazuje štatistiku záznamov dávky v štruktúre podľa MŠ SR, pričom vkladajúci má možnosť skontrolovať súlad štatistiky z vlastného KIS so štruktúrou záznamov v odovzdávanej dávke,
    • v prípade nesúladu informuje o nezrovnalostiach a umožní upload dávky opakovať.

Na zabezpečenie funkčnosti komunikačnej schémy bolo navrhnuté nasledujúce rozdelenie zodpovednosti:

  • Za zápis údajov do univerzitnej databázy, dodržanie platných noriem a správu databázy o odborných aktivitách univerzitných pracovísk, spracovanie prehľadov, vyhodnotení a štatistík, ako aj poskytovanie informácií o výsledkoch vedeckovýskumnej činnosti zodpovedá univerzitná knižnica. Podľa aktuálne platného Usmernenia MŠ SR o publikačnej činnosti sa záznam do databázy CREPČ dostane až po overení úplnosti a správneho zaradenia záznamu.
  • Za usmerňovanie a vyhodnocovanie vedeckovýskumnej a odbornej činnosti zodpovedá prorektor pre vedu a výskum na univerzite a prodekani pre vedu a výskum na fakultách.
  • Za zber prvotných údajov a ich obsah zodpovedajú odborné pracoviská univerzity.
  • Za technickú a programovú podporu zberu údajov a prevádzku informačného systému na univerzite zodpovedá univerzitné IT pracovisko.
  • Za prevádzku centrálneho registra publikačnej činnosti zodpovedá MŠ SR, ktoré túto zodpovednosť prenieslo na riešiteľov projektu.
  • Proces bibliografickej registrácie a následného vykazovania publikačnej činnosti, resp. evidencie publikačnej činnosti (EPC) sa delí na etapy, na ktorých sa podieľajú vedeckí a pedagogickí pracovníci vysokých škôl, pracovníci akademických knižníc a príslušné pracoviská vysokej školy pre vedu a výskum.

Softvérová realizácia registra

Po vykonaní analýzy a popísaní procesov bolo pristúpené k softvérovej realizácii projektu. Webovým sídlom projektu sa stala doména http://www.crepc.sk, ktorá počas vývoja slúžila na výmenu technickýchúdajov a informácií medzi riešiteľmi projektu a zástupcami zúčastnených VVŠ. Fyzicky je CREPČ umiestnený na UKF v Nitre.

Následne bol vytvorený portál poskytujúci:

  • anonymné rozhranie na vyhľadávanie údajov a získavanie štatistík EPC na priereze rokov, univerzít i univerzitných pracovísk, zamestnancov, kategórií publikácií a pod. (obr. 1);
  • autorizované rozhranie na odovzdávanie dávok univerzitami a poskytovanie ich hodnotenia prostredníctvom súborov generovaných systémom a na základe manuálnych kontrol (obr. 2)
  • štatistiky podľa potreby a zadania.

skalka1.jpg (189074 bytes)
Obr. 1 Možnosti vyhľadávania bez nutnosti autorizácie

skalka2.jpg (63256 bytes)

Obr. 2 Autorizované rozhranie

 

Práca s údajmi

V prvej fáze bol portál naplnený údajmi z roku 2007. Kompletným importom dát všetkých dotknutých organizácií tak vznikla unikátna databáza evidencie publikačnej činnosti, na základe ktorej bolo možné analyzovať možné typy a výskyty chýb, multiplicít i percentuálneho rozdelenia publikácií medzi viac pracovísk (univerzít).

Na získané údaje boli postupne nasadzované viaceré techniky kontroly úplnosti, sémantickej správnosti záznamov a kontroly duplicít. Tieto techniky v sebe integrujú pravidlá pre efektívnu a sofistikovanú kontrolu údajov v aktuálnom, ale aj ďalších rokoch. Kontrola správnosti údajov pozostáva z:

  • automatizovanej kontroly úplnosti položiek záznamov (realizovanej už vlastnosťami výmenného formátu),
  • automatizovanej kontroly duplicít pozostávajúcej z kontroly na:
    • duplicitu publikácie v rámci odovzdanej dávky univerzity (tá istá/takmer totožná publikácia sa vyskytuje v rámci dávky viackrát),
    • duplicitu publikácie autora v rámci viacerých VVŠ (viac univerzít vykazuje tú istú publikáciu – zamestnanec zrejme pôsobí na viacerých univerzitách),
    • duplicitu publikácie v rámci viacerých VVŠ pri viacerých autoroch (percentuálne podiely autorov prípadne i kategórie v záznamoch viacerých univerzít nie sú totožné),
  • manuálnej/poloautomatizovanej kontroly údajov vo vnútri CREPČ v aktuálnom roku síce prebiehajúcej mimo CREPČ, no v budúcnosti sa odporúča využívať na tento účel vytvorené formuláre systému umožňujúce:
    • kontrolu zaradenia publikácie do kategórie na základe rozsahu dokumentu,
    • kontrolu zaradenia publikácie do kategórie na základe obsahu dokumentu,
    • manuálne odhalené duplicity a pod.,
  • následného odoslania výsledkov kontroly príslušnej VVŠ, ktorá paralelne s opravou údajov dávky opravuje údaje vo svojom KIS. Návrhy z CREPČ môže:
    • odsúhlasiť a opraviť,
    • v prípade zamietnutia návrhu CREPČ odôvodniť zamietnutie navrhovanej opravy s odovzdaním v privátnej sekcii,
    • v rámci tejto aktivity nie je potrebné obmedziť pridávanie nových záznamov.

Medzi dvoma importmi údajov do CREPČ môžu niektoré záznamy zo systému z rôznych dôvodov vypadnúť alebo častejšie nové záznamy v rámci už uzavretého obdobia pribudnúť. V prípade odstránenia záznamu v KIS VVŠ, je tento záznam v rámci CREPČ po importe novej dávky tiež odstránený a v prípade pridania nového záznamu, ktorý je vykazovaný v už spracovanom období, je tento do systému doplnený a vykazovaný v rámci už spracovaného obdobia (VVŠ sa tým ochudobňuje o záznam).

Záver

CREPČ sa v súčasnosti stará o verejnú prezentáciu výsledkov univerzitných pracovísk, poskytuje zdroj údajov pre potreby manažmentu finančných prostriedkov a vnútorne zabezpečuje elimináciu duplicít v rámci jednej i medzi univerzitami.

Do budúcnosti sa predpokladá jeho rozšírenie o ďalšie typy vysokých škôl (štátne, súkromné), SAV, o poskytovanie údajov o publikačnej činnosti ďalším subjektom (grantové agentúry, akreditačná komisia a pod.) a riešenie evidencie ohlasov.

Share: