Systém informácií o vede SK CRIS na štartovacej čiare

Vedaelektronické informačné zdrojeinformačné zdrojeprojekty

Čím viac sa blíži okamih odovzdania nového systému do prevádzky, tým častejšie dostávame od súčasných i potenciálnych používateľov otázky. Sú zamerané hlavne na dve oblasti: prečo príprava nového systému zameraného na vedu trvá tak dlho a čím sa bude líšiť od svojich predchádzajúcich verzií. V tomto článku, ktorý nadväzuje na príspevok Systém SK CRIS – slovenská veda na dlani , uverejnený v čísle 1/2012, sa pokúsim na tieto otázky aspoň čiastočne odpovedať.

Údaje SK CRIS

SK CRIS bude pracovať s viacerými druhmi údajov. Ich štruktúra vychádza z odporučení Európskej komisie pre oblasť automatizácie vedeckovýskumných informácií a zodpovedá dátovému formátu CERIF.

Nebudujeme však nový systém „na zelenej lúke“, ale systém, ktorý obsahovo vychádza hlavne z databázy CIP VVI. Údaje SK CRIS môžeme podľa zdroja deliť na už zozbierané údaje, ktoré budú do SK CRIS premigrované zo súčasného systému, a na údaje pochádzajúce z externých systémov, ktoré budú do SK CRIS integrované.

Migrované údaje

Aktuálna databáza CIP VVI obsahuje nasledujúce registre:

  • Register projektov (projekty financované z verejných zdrojov, predovšetkým APVV, VEGA, KEGA, Stimuly VaV)
  • Register organizácií (štatistika výskumno-vývojového potenciálu a žiadosť o hodnotenie spôsobilosti)
  • Register expertov (posudzovatelia projektov MŠVVaŠ)
  • Infraštruktúra výskumu a vývoja (laboratóriá a zariadenia)

Registre sú však do značnej miery samostatnými celkami, bez vzájomných väzieb. Z uvedeného vyplýva jednak duplicita viacerých údajov a v mnohých prípadoch aj ich nejednotný zápis, čoho dôsledkom je obmedzená vyhľadateľnosť zozbieraných dát a sťažená identifikácia väzieb medzi nimi.

Preto v rámci prípravy dát na migrácie bolo potrebné vykonať viacero krokov. V prvom rade sme museli identifikovať v rámci zozbieraných údajov položky zodpovedajúce formátu CERIF[1]. Následne bolo treba údaje zjednotiť, t. j. opraviť zápis údajov nachádzajúcich sa v rôznych registroch tak, aby ich systém dokázal rozpoznať ako totožné. Nekompletnosť údajov sme riešili tak, že sme ich manuálne vyhľadali a doplnili.

Ďalšou úlohou bola identifikácia prepojení medzi migrovanými údajmi.

Najviac práce sme mali s registrom projektov. Stretli sme sa s absenciou akéhokoľvek identifikátora riešiteľov projektov, dôsledkom čoho bol problém priradenia týchto osôb k organizáciám riešiacim projekt. Triedenie dát komplikovali rôzne dátové štruktúry menných položiek a v rámci nich aj rôzne spôsoby zápisu mien osôb či spoluriešiteľských organizácií. Vyskytol sa aj zápis údajov bez diakritiky alebo s preklepmi. Tu, samozrejme, zlyhávali všetky pokusy o nasadenie softvérových nástrojov na vytvorenie spojení  a zostávali dve možnosti: údaje buď manuálne opraviť, alebo ich zaradiť do kategórie „nepoužiteľné“ a z migrácie ich vynechať.

Počet objektov (záznamov ) migrovaných do SK CRIS sa nachádza v tabuľke 1.

Tab. 1 Migrácia dát (údaje CIP k 20.10.2012)

Názov položky

Počet záznamov

Projekty

10 004

Výskumníci – experti MŠVVaŠ

1 123

Výskumníci – zodpovední riešitelia a riešitelia projektov

2 852

Organizácie registrované

858

–          v tom hodnotenie spôsobilosti

281

Organizácie neregistrované – spoluriešitelia projektov

526

Spolupráca s externými systémami

Nutnosť spolupráce informačného systému SK CRIS s inými systémami vyplýva zo zámeru:

  • dobudovať register projektov financovaných z verejných zdrojov,
  • vytvoriť register výskumníkov (vyše 20 000 osôb),
  • vytvoriť databázu výsledkov výskumu a vývoja (publikácie, patenty, produkty a inovácie).

Softvérovým nástrojom spolupráce budú hlavne webové služby (web service) umožňujúce import údajov z iných systémov v tvare xml. Týmto spôsobom budú do SK CRIS importované najmä projekty z registrov grantových agentúr (APVV, VEGA, KEGA). Na uvedenej báze bude však založená aj komunikácia s Centrálnym registrom publikačnej činnosti (CREPČ) s cieľom identifikovať publikácie, ktoré vznikli ako výsledok riešenia projektu, alebo publikácie, ktoré patria k profilu výskumníka – najčastejšie autora.

Niektoré údaje však budú integrované do systému SK CRIS priamo, súčasne s migráciou dát. Pôjde o vybrané údaje registra zamestnancov VŠ a registra zamestnancov SAV (v súlade so zákonom o ochrane osobných údajov). Aktualizácia týchto údajov sa predpokladá raz ročne.

Výpočet spolupracujúcich externých systémov nie je uzavretý a v priebehu prevádzky SK CRIS môžu pribúdať aj ďalšie systémy. Prehľad externých systémov, s ktorými bude SK CRIS spolupracovať, sa nachádza v tabuľke 2.

Tab. 2 Údaje z externých systémov

Typ dát

Názov systému

Správca

Počet záznamov *

Projekty

IS grantovej agentúry

APVV

2 000

Projekty

VEGA

SAV

2 300

Projekty

VEGA

MŠVVaŠ SR – sekcia VŠ

1 800

Projekty

Medzinárodná spolupráca

SAV

1 500

Projekty

KEGA

MŠVVaŠ SR – sekcia VŠ

300

Projekty

ITMS – ŠF EÚ

ASFEU MŠVVaŠ

500

Publikačná činnosť

CREPČ

MŠVVaŠ SR – sekcia VŠ

Viac ako 300 000 **

Publikačná činnosť

PČ SAV

SAV

Viac ako 300 000 **

Výskumníci

Register výskumníkov

SAV

3 000

Výskumníci

Register zamestnancov VŠ

MŠVVaŠ SR – sekcia VŠ

14 000

*   Očakávaný objem dát v SK CRIS v roku 2013

**  Odhadovaný počet záznamov v databáze externého systému, ktoré budú k dispozícii pre požiadavky zo strany SK CRIS

 Prínos SK CRIS

Čím teda bude systém SK CRIS výnimočný?

  1. Predovšetkým rozsahom zozbieraných dát, ich konkrétnosťou a štruktúrou. Umožní získať odpovede na otázky, ktoré zaujímajú rozhodovaciu sféru, vedeckú obec, ale aj širokú verejnosť:
  • Ktoré publikácie z oblasti prírodných vied publikoval autor X za organizáciu O?
  • Koľko projektov z oblasti jadrovej fyziky riešili v období 2007 2011 vysoké školy?
  • Aké sú konkrétne výsledky projektu Z (publikácie, patenty, produkty)?
  • Na riešení ktorých projektov sa podieľal expert Y?

 

  1. Používateľ nebude musieť opakovane vkladať do systému rovnaké informácie. Nepôjde len o údaje o organizáciách, výskumníkoch či projektoch. Spolupráca s externými systémami rozšíri túto funkciu predovšetkým na výsledky výskumu, hlavne na publikácie, prípadne patenty. Keď sa budú bibliografické údaje o vybranej publikácii už nachádzať v registri publikačnej činnosti, nebude nutné ich kvôli priradeniu tejto publikácie k projektu opakovane zadávať.

Ukážka práce so systémom sa nachádza na obrázkoch 1 až 3.

Systém SK CRIS sa bude vyznačovať najmä orientáciou na koncového používateľa, ktorý by sa z neho mal dozvedieť základné údaje o „kľúčových hráčoch“ a aktivitách v oblasti vedy, výskumu, vývoja a inovácií financovaných z verejných zdrojov. Dôraz je preto kladený najmä na detailne prepracovanú funkcionalitu systému a na kvalitu a konzistenciu prezentovaných dát. Subjekty vedy a výskumu by zasa mali oceniť používateľskú prijateľnosť rozhraní pre vstup dát a optimalizáciu ich zberu.

Budeme radi, ak bude vedeckou obcou vnímaný nie ako represívny a kontrolný prostriedok – „bič“, ale radšej ako „cukor“ – ponúknutú príležitosť prezentovať svoju prácu a jej výsledky doma i v zahraničí.

Systém je v súčasnosti v záverečnej fáze testovania. Spustenie do ostrej prevádzky sa uskutoční v decembri 2012. O prvých skúsenostiach so systémom SK CRIS si prečítate niekedy nabudúce…

Zdroje:

  1. Národný projekt NISPEZ, aktivita 4.1 Analytická štúdia – Súhrnná správa. Zost. Cvik, O. – gestor aktivity 4.1 . Bratislava, CVTI SR, marec 2010 . [Online]. [cit. 25.10.2012] Dostupné na: <http://nispez.cvtisr.sk/index.php?&menu=107>
  2. Turňa, J.; Noge, J.; Zendulková, D.: The system SK CRIS, scientific publications and theses – mirror of Slovak science. In: Jeffery, Keith G; Dvořák, Jan (eds.): E-Infrastructures for Research and Innovation: Linking Information Systems to Improve Scientific Knowledge Production: Proceedings of the 11th International Conference on Current Research Information Systems (June 6-9, 2012, Prague, Czech Republic). Pp. 211-220. ISBN 978-80-86742-33-5. [cit. 25.10.2012]. Dostupné na: http://www.eurocris.org/Uploads/Web%20pages/CRIS%202012%20-%20Prague/CRIS2012_23_full_paper.pdf    
  3. Valkovič, L. : Detailná funkčná špecifikácia systému SK CRIS. Bratislava, 2011. [cit. 25.10.2012]
  4. Zendulková, D.: Systém SK CRIS – slovenská veda na dlani. In: ITlib. Informačné technológie a knižnice, roč. 16, č.1/2012, str. 7-10 ISSN 1335-793X. [cit. 25.10.2012].  Dostupné na: http://www.cvtisr.sk/itlib/itlib121/zendulkova.htm

 



[1] Obsah a funkcionalita z doterajšieho systému, ktorá je nad rámec CERIF a slúži pre potreby rozhodovacej sféry,  zostáva aj v novom systéme plne zachovaná. 

Zdieľať: