Štandardizácia v oblasti informačných systémov o vede a
výskume je medzi odbornou verejnosťou na Slovensku takmer neznámym pojmom. Dátový
formát CERIF (Common European Research Information Format) je odporúčaný
Európskou komisiou a rozvíjaný na pôde profesionálnej asociácie prevádzkovateľov
informačných systémov o vede EuroCRIS.
Ako môžeme najvýstižnejšie charakterizovať CERIF? Odporučený
dátový formát, štandard určený pre oblasť automatizácie vedeckovýskumných
informácií. Zjednodušene ho môžeme nazvať UNIMARC-om informačných systémov o vede
a výskume.
Jeho podstatou je dátový model umožňujúci metadátovú
reprezentáciu výskumných entít, ich aktivít a vzájomných väzieb, ako aj ich
výsledkov. Umožňuje spracovanie informácií o výskume v adekvátnej kvalite,
ich archiváciu, sprístupňovanie a vzájomnú výmenu. Podporuje transfer znalostí
širokej škále subjektov: výskumníkom, manažérom, tvorcom výskumných stratégií,
vydavateľom vedeckých publikácií, médiám aj širokej verejnosti.
Prvky CERIF majú definovanú základnú štruktúru, sémantiku a
väzby a delia sa do piatich hierarchicky usporiadaných kategórií:
- Základné entity (Core Entities)
- Entity 2. úrovne (2nd Level Entities)
- Entity určujúce vzájomné prepojenia dát (Link
Entities)
- Entity určené na vytváranie jazykových verzií (Language-related
Entities)
- Klasifikačné entity (Sémantická vrstva)
(Classification Entities-Semantic Layer)
Formát definuje 4 základné entity (moduly informačného
systému):
- Osoby: experti vedy a výskumu; personálna databáza;
- Projekty;
- Subjekty: organizácie výskumu a vývoja, ich služby a
infraštruktúra;
- Výsledky: najmä publikácie, ale aj patenty, produkty, podujatia.
Každá entita musí mať definované svoje atribúty, vlastnosti,
ktoré ju charakterizujú. Tieto atribúty (položky) sú v rámci formátu presne
určené. Napríklad u osoby sú to základné osobné údaje: meno, priezvisko, tituly,
profesionálne zameranie a pod. Na základné entity sú naviazané ďalšie súvisiace
objekty – entity 2. úrovne.
V rámci slovenského informačného systému o vede a výskume
(Centrálny informačný portál pre výskum, vývoj a inovácie – CIP VVI) sú
softvérovo aj obsahovo spracované všetky základné entity okrem výsledkov výskumu.
Ich štruktúra však v súčasnosti nezodpovedá formátu CERIF. S aktuálnou
štruktúrou a úrovňou prepojenia dát súvisí aj relatívne obmedzená možnosť
extrahovania agregovaných informácií zo systému.
Vzájomné prepojenia dát jednotlivých modulov (entít) sú v
rámci CERIF presne definované entitami tretieho typu (Link Entities). Entitou tohto typu
je napríklad objekt nazvaný Person_ResultPublication, ktorý určuje vzťah medzi osobou
(záznamom v entite 1. úrovne Person, t. j. v databáze osôb) a publikáciou (záznamom
v entite 1. úrovne Result Publication, t. j. Publikácie/výsledky výskumu a vývoja).
Podobne ako entity 1. a 2. úrovne, aj táto „prepojovacia“ entita je definovaná
špecifickými atribútmi.
Obrázok 1 CERIF – Entity 1. a 2. úrovne
Výsledkom implementácie uvedeného dátového modelu (samozrejme
za podmienky naplnenia modelu reálnymi dátami) je komplexný pohľad na spracované
údaje a ich vzájomné súvislosti. Často žiadané sú napríklad informácie o
projektoch, ktoré riešia konkrétne organizácie, alebo zoznam projektov z určitej
oblasti. Tieto údaje poskytuje aj aktuálna verzia systému. Neexistuje však možnosť
vyhľadať publikácie konkrétneho vedeckého pracovníka, vybrať z nich tie
publikácie, ktoré napísal vo vzťahu k zamestnávateľskej organizácii (aj v prípade,
že má viacerých zamestnávateľov), či vo vzťahu ku konkrétnemu projektu (t. j.
výsledky výskumu a vývoja konkrétneho pracovníka). Získavanie širšieho spektra
informácií je podmienkou, aby mohol informačný systém plniť všetky svoje funkcie.
Informačný systém o vede a výskume s implementovaným
štandardom CERIF môže plniť tieto funkcie:
- Informačná a popularizačná funkcia spočíva v propagácii
vedeckej práce, jej subjektov a výsledkov medzi odbornou aj laickou verejnosťou doma i
v zahraničí.
- Analyticko-metodická funkcia umožňuje rozhodovacej sfére získať
argumentačnú bázu slúžiacu na tvorbu stratégií a nástrojov na cielenú podporu
vedy a výskumu vrátane finančnej.
- Kontrolná funkcia umožňuje riadiacej sfére získavať
informácie o tom, či sú prostriedky prideľované na vedu a výskum zo štátneho
rozpočtu hospodárne vynakladané a či vedeckovýskumné aktivity prinášajú
adekvátne výsledky.
- Implementačná funkcia spočíva v podpore prenosu informácií
medzi subjektmi vedy a výskumu na jednej strane a podnikateľskými subjektmi na druhej
strane. Výsledkom je ekonomický prínos vedy a výskumu pre spoločnosť, inovácie.
Dátový formát CERIF sa priebežne vyvíja v súlade s aktuálnymi
trendmi zberu a spracovania dát o vede a výskume v jednotlivých krajinách EÚ. Tvorbou
štandardov a vývojom CERIF sa zaoberá špeciálna pracovná skupina v rámci asociácie
EuroCRIS. Implementácia štandardov do informačných systémov o vede a prevádzka
týchto systémov je vo viacerých európskych krajinách vecne aj inštitucionálne
prepojená s akademickým prostredím a nezriedka spadá do pôsobnosti vedeckých a
akademických knižníc a informačných centier.
CVTI SR ako prevádzkovateľ Centrálneho informačného portálu a
informačného systému pre oblasť výskumu, vývoja a inovácií (CIP VVI) sa v rámci
národného projektu Národný informačný systém podpory výskumu a vývoja na
Slovensku – prístup k elektronickým informačným zdrojom, financovaného z OP
Výskum a vývoj, bude od roku 2009 venovať prispôsobeniu CIP VVI štandardom EÚ,
reprezentovaným dátovým modelom CERIF. Toto prispôsobenie umožní zapojenie Slovenska
do efektívnej výmeny dát a umožní prístup k vedeckovýskumným informáciám v celom
európskom priestore.
Zdroje:
EuroCRIS, Online: http://www.eurocris.org
[4.11.2008]
Jörg, Brigitte: CERIF 2008 Tutorial. Online: http://www.eurocris.org/fileadmin/Upload/CERIF/CERIF2008_Tutorial_Brigitte_Joerg_June2008_Maribor.ppt
[4.11.2008]
|