CERIF: štandardizácia informácií o vede

Zo Slovenska

Štandardizácia v oblasti informačných systémov o vede a
výskume je medzi odbornou verejnosťou na Slovensku takmer neznámym pojmom. Dátový
formát CERIF (Common European Research Information  Format) je odporúčaný
Európskou komisiou a rozvíjaný na pôde profesionálnej asociácie prevádzkovateľov
informačných systémov o vede EuroCRIS.

Ako môžeme najvýstižnejšie charakterizovať CERIF? Odporučený
dátový formát, štandard  určený pre oblasť automatizácie vedeckovýskumných
informácií. Zjednodušene ho môžeme nazvať UNIMARC-om informačných systémov o vede
a výskume.

Jeho podstatou je dátový model umožňujúci metadátovú
reprezentáciu výskumných entít, ich aktivít a vzájomných väzieb, ako aj ich
výsledkov. Umožňuje spracovanie informácií o výskume  v adekvátnej kvalite,
ich archiváciu, sprístupňovanie a vzájomnú výmenu. Podporuje transfer znalostí
širokej škále subjektov: výskumníkom, manažérom, tvorcom výskumných stratégií,
vydavateľom vedeckých publikácií, médiám aj širokej verejnosti.

Prvky CERIF majú definovanú základnú štruktúru, sémantiku a
väzby a delia sa do piatich hierarchicky usporiadaných kategórií:

  • Základné entity  (Core Entities)
  • Entity 2. úrovne (2nd Level Entities)
  • Entity určujúce vzájomné prepojenia dát (Link
    Entities)
  • Entity určené na vytváranie jazykových verzií  (Language-related
    Entities)
  • Klasifikačné entity (Sémantická vrstva)
    (Classification Entities-Semantic Layer)

Formát definuje 4 základné entity (moduly informačného
systému):

  • Osoby: experti vedy a výskumu; personálna databáza;
  • Projekty;
  • Subjekty: organizácie výskumu a vývoja, ich služby a
    infraštruktúra;
  • Výsledky: najmä publikácie, ale aj patenty, produkty, podujatia.

Každá entita musí mať definované svoje atribúty, vlastnosti,
ktoré ju charakterizujú. Tieto atribúty (položky) sú v rámci formátu presne
určené. Napríklad u osoby sú to základné osobné údaje: meno, priezvisko, tituly,
profesionálne zameranie a pod. Na základné entity sú naviazané ďalšie súvisiace
objekty –  entity 2. úrovne.

V rámci slovenského informačného systému o vede a výskume
(Centrálny informačný portál pre výskum, vývoj a inovácie – CIP VVI) sú
softvérovo aj obsahovo spracované všetky základné entity okrem výsledkov výskumu.
Ich štruktúra však v súčasnosti nezodpovedá formátu CERIF. S aktuálnou
štruktúrou a úrovňou prepojenia dát súvisí aj relatívne obmedzená možnosť
extrahovania agregovaných informácií zo systému.

Vzájomné prepojenia dát jednotlivých modulov (entít) sú v
rámci CERIF presne definované entitami tretieho typu (Link Entities). Entitou tohto typu
je napríklad objekt nazvaný Person_ResultPublication, ktorý určuje vzťah medzi osobou
(záznamom v entite 1. úrovne Person, t. j. v databáze osôb) a publikáciou (záznamom
v entite 1. úrovne Result Publication, t. j. Publikácie/výsledky výskumu a vývoja).
Podobne ako entity 1. a 2. úrovne, aj táto „prepojovacia“ entita je definovaná
špecifickými atribútmi.

zendul.jpg (66679 bytes)

Obrázok 1  CERIF –  Entity 1. a 2. úrovne

Výsledkom implementácie uvedeného dátového modelu (samozrejme
za podmienky naplnenia modelu reálnymi dátami) je komplexný pohľad na spracované
údaje a ich vzájomné súvislosti. Často žiadané sú napríklad informácie o
projektoch, ktoré riešia konkrétne organizácie, alebo zoznam projektov z určitej
oblasti. Tieto údaje poskytuje aj aktuálna verzia systému. Neexistuje však možnosť
vyhľadať publikácie konkrétneho vedeckého pracovníka, vybrať z nich tie
publikácie, ktoré napísal vo vzťahu k zamestnávateľskej organizácii (aj v prípade,
že má viacerých zamestnávateľov), či vo vzťahu ku konkrétnemu projektu (t. j.
výsledky výskumu a vývoja konkrétneho pracovníka). Získavanie širšieho spektra
informácií je podmienkou, aby mohol informačný systém plniť všetky svoje funkcie.

Informačný systém o vede a výskume s implementovaným
štandardom CERIF môže plniť tieto funkcie:

  • Informačná a popularizačná funkcia spočíva v propagácii
    vedeckej práce, jej subjektov a výsledkov medzi odbornou aj laickou verejnosťou doma i
    v zahraničí.
  • Analyticko-metodická funkcia umožňuje rozhodovacej sfére získať
    argumentačnú bázu slúžiacu na tvorbu stratégií a nástrojov na cielenú podporu
    vedy a výskumu vrátane finančnej.
  • Kontrolná funkcia umožňuje  riadiacej sfére získavať
    informácie o tom, či sú prostriedky prideľované na vedu a výskum zo štátneho
    rozpočtu hospodárne vynakladané a či vedeckovýskumné aktivity prinášajú
    adekvátne výsledky.
  • Implementačná funkcia spočíva v podpore prenosu informácií
    medzi subjektmi vedy a výskumu na jednej strane a podnikateľskými subjektmi na druhej
    strane. Výsledkom je ekonomický prínos vedy a výskumu pre spoločnosť, inovácie.

Dátový formát CERIF sa priebežne vyvíja v súlade s aktuálnymi
trendmi zberu a spracovania dát o vede a výskume v jednotlivých krajinách EÚ. Tvorbou
štandardov a vývojom CERIF sa zaoberá špeciálna pracovná skupina v rámci asociácie
EuroCRIS. Implementácia štandardov  do informačných systémov o vede a prevádzka
týchto systémov je vo viacerých európskych krajinách vecne aj inštitucionálne
prepojená s akademickým prostredím a nezriedka spadá do pôsobnosti vedeckých a
akademických knižníc a informačných centier.

CVTI SR ako prevádzkovateľ Centrálneho informačného portálu a
informačného systému pre oblasť výskumu, vývoja a inovácií (CIP VVI) sa v rámci
národného projektu Národný informačný systém podpory výskumu a vývoja na
Slovensku – prístup k elektronickým informačným zdrojom
, financovaného z OP
Výskum a vývoj, bude od roku 2009 venovať prispôsobeniu CIP VVI štandardom EÚ,
reprezentovaným dátovým modelom CERIF. Toto prispôsobenie umožní zapojenie Slovenska
do efektívnej výmeny dát a umožní prístup k vedeckovýskumným informáciám v celom
európskom priestore.

 

Zdroje: 

EuroCRIS, Online: http://www.eurocris.org
  [4.11.2008]

Jörg, Brigitte: CERIF 2008 Tutorial. Online: http://www.eurocris.org/fileadmin/Upload/CERIF/CERIF2008_Tutorial_Brigitte_Joerg_June2008_Maribor.ppt
[4.11.2008]

Zdieľať: