Systém informácií o vede SK CRIS na štartovacej čiare
Vedaelektronické informačné zdrojeinformačné zdrojeprojektyČím viac sa blíži okamih odovzdania nového systému do prevádzky, tým častejšie dostávame od súčasných i potenciálnych používateľov otázky. Sú zamerané hlavne na dve oblasti: prečo príprava nového systému zameraného na vedu trvá tak dlho a čím sa bude líšiť od svojich predchádzajúcich verzií. V tomto článku, ktorý nadväzuje na príspevok Systém SK CRIS – slovenská veda na dlani , uverejnený v čísle 1/2012, sa pokúsim na tieto otázky aspoň čiastočne odpovedať.
Údaje SK CRIS
SK CRIS bude pracovať s viacerými druhmi údajov. Ich štruktúra vychádza z odporučení Európskej komisie pre oblasť automatizácie vedeckovýskumných informácií a zodpovedá dátovému formátu CERIF.
Nebudujeme však nový systém „na zelenej lúke“, ale systém, ktorý obsahovo vychádza hlavne z databázy CIP VVI. Údaje SK CRIS môžeme podľa zdroja deliť na už zozbierané údaje, ktoré budú do SK CRIS premigrované zo súčasného systému, a na údaje pochádzajúce z externých systémov, ktoré budú do SK CRIS integrované.
Migrované údaje
Aktuálna databáza CIP VVI obsahuje nasledujúce registre:
- Register projektov (projekty financované z verejných zdrojov, predovšetkým APVV, VEGA, KEGA, Stimuly VaV)
- Register organizácií (štatistika výskumno-vývojového potenciálu a žiadosť o hodnotenie spôsobilosti)
- Register expertov (posudzovatelia projektov MŠVVaŠ)
- Infraštruktúra výskumu a vývoja (laboratóriá a zariadenia)
Registre sú však do značnej miery samostatnými celkami, bez vzájomných väzieb. Z uvedeného vyplýva jednak duplicita viacerých údajov a v mnohých prípadoch aj ich nejednotný zápis, čoho dôsledkom je obmedzená vyhľadateľnosť zozbieraných dát a sťažená identifikácia väzieb medzi nimi.
Preto v rámci prípravy dát na migrácie bolo potrebné vykonať viacero krokov. V prvom rade sme museli identifikovať v rámci zozbieraných údajov položky zodpovedajúce formátu CERIF[1]. Následne bolo treba údaje zjednotiť, t. j. opraviť zápis údajov nachádzajúcich sa v rôznych registroch tak, aby ich systém dokázal rozpoznať ako totožné. Nekompletnosť údajov sme riešili tak, že sme ich manuálne vyhľadali a doplnili.
Ďalšou úlohou bola identifikácia prepojení medzi migrovanými údajmi.
Najviac práce sme mali s registrom projektov. Stretli sme sa s absenciou akéhokoľvek identifikátora riešiteľov projektov, dôsledkom čoho bol problém priradenia týchto osôb k organizáciám riešiacim projekt. Triedenie dát komplikovali rôzne dátové štruktúry menných položiek a v rámci nich aj rôzne spôsoby zápisu mien osôb či spoluriešiteľských organizácií. Vyskytol sa aj zápis údajov bez diakritiky alebo s preklepmi. Tu, samozrejme, zlyhávali všetky pokusy o nasadenie softvérových nástrojov na vytvorenie spojení a zostávali dve možnosti: údaje buď manuálne opraviť, alebo ich zaradiť do kategórie „nepoužiteľné“ a z migrácie ich vynechať.
Počet objektov (záznamov ) migrovaných do SK CRIS sa nachádza v tabuľke 1.
Tab. 1 Migrácia dát (údaje CIP k 20.10.2012)
Názov položky |
Počet záznamov |
Projekty |
10 004 |
Výskumníci – experti MŠVVaŠ |
1 123 |
Výskumníci – zodpovední riešitelia a riešitelia projektov |
2 852 |
Organizácie registrované |
858 |
– v tom hodnotenie spôsobilosti |
281 |
Organizácie neregistrované – spoluriešitelia projektov |
526 |
Spolupráca s externými systémami
Nutnosť spolupráce informačného systému SK CRIS s inými systémami vyplýva zo zámeru:
- dobudovať register projektov financovaných z verejných zdrojov,
- vytvoriť register výskumníkov (vyše 20 000 osôb),
- vytvoriť databázu výsledkov výskumu a vývoja (publikácie, patenty, produkty a inovácie).
Softvérovým nástrojom spolupráce budú hlavne webové služby (web service) umožňujúce import údajov z iných systémov v tvare xml. Týmto spôsobom budú do SK CRIS importované najmä projekty z registrov grantových agentúr (APVV, VEGA, KEGA). Na uvedenej báze bude však založená aj komunikácia s Centrálnym registrom publikačnej činnosti (CREPČ) s cieľom identifikovať publikácie, ktoré vznikli ako výsledok riešenia projektu, alebo publikácie, ktoré patria k profilu výskumníka – najčastejšie autora.
Niektoré údaje však budú integrované do systému SK CRIS priamo, súčasne s migráciou dát. Pôjde o vybrané údaje registra zamestnancov VŠ a registra zamestnancov SAV (v súlade so zákonom o ochrane osobných údajov). Aktualizácia týchto údajov sa predpokladá raz ročne.
Výpočet spolupracujúcich externých systémov nie je uzavretý a v priebehu prevádzky SK CRIS môžu pribúdať aj ďalšie systémy. Prehľad externých systémov, s ktorými bude SK CRIS spolupracovať, sa nachádza v tabuľke 2.
Tab. 2 Údaje z externých systémov
Typ dát |
Názov systému |
Správca |
Počet záznamov * |
Projekty |
IS grantovej agentúry |
APVV |
2 000 |
Projekty |
VEGA |
SAV |
2 300 |
Projekty |
VEGA |
MŠVVaŠ SR – sekcia VŠ |
1 800 |
Projekty |
Medzinárodná spolupráca |
SAV |
1 500 |
Projekty |
KEGA |
MŠVVaŠ SR – sekcia VŠ |
300 |
Projekty |
ITMS – ŠF EÚ |
ASFEU MŠVVaŠ |
500 |
Publikačná činnosť |
CREPČ |
MŠVVaŠ SR – sekcia VŠ |
Viac ako 300 000 ** |
Publikačná činnosť |
PČ SAV |
SAV |
Viac ako 300 000 ** |
Výskumníci |
Register výskumníkov |
SAV |
3 000 |
Výskumníci |
Register zamestnancov VŠ |
MŠVVaŠ SR – sekcia VŠ |
14 000 |
* Očakávaný objem dát v SK CRIS v roku 2013
** Odhadovaný počet záznamov v databáze externého systému, ktoré budú k dispozícii pre požiadavky zo strany SK CRIS
Prínos SK CRIS
Čím teda bude systém SK CRIS výnimočný?
- Predovšetkým rozsahom zozbieraných dát, ich konkrétnosťou a štruktúrou. Umožní získať odpovede na otázky, ktoré zaujímajú rozhodovaciu sféru, vedeckú obec, ale aj širokú verejnosť:
- Ktoré publikácie z oblasti prírodných vied publikoval autor X za organizáciu O?
- Koľko projektov z oblasti jadrovej fyziky riešili v období 2007 − 2011 vysoké školy?
- Aké sú konkrétne výsledky projektu Z (publikácie, patenty, produkty)?
- Na riešení ktorých projektov sa podieľal expert Y?
- Používateľ nebude musieť opakovane vkladať do systému rovnaké informácie. Nepôjde len o údaje o organizáciách, výskumníkoch či projektoch. Spolupráca s externými systémami rozšíri túto funkciu predovšetkým na výsledky výskumu, hlavne na publikácie, prípadne patenty. Keď sa budú bibliografické údaje o vybranej publikácii už nachádzať v registri publikačnej činnosti, nebude nutné ich kvôli priradeniu tejto publikácie k projektu opakovane zadávať.
Ukážka práce so systémom sa nachádza na obrázkoch 1 až 3.
Systém SK CRIS sa bude vyznačovať najmä orientáciou na koncového používateľa, ktorý by sa z neho mal dozvedieť základné údaje o „kľúčových hráčoch“ a aktivitách v oblasti vedy, výskumu, vývoja a inovácií financovaných z verejných zdrojov. Dôraz je preto kladený najmä na detailne prepracovanú funkcionalitu systému a na kvalitu a konzistenciu prezentovaných dát. Subjekty vedy a výskumu by zasa mali oceniť používateľskú prijateľnosť rozhraní pre vstup dát a optimalizáciu ich zberu.
Budeme radi, ak bude vedeckou obcou vnímaný nie ako represívny a kontrolný prostriedok – „bič“, ale radšej ako „cukor“ – ponúknutú príležitosť prezentovať svoju prácu a jej výsledky doma i v zahraničí.
Systém je v súčasnosti v záverečnej fáze testovania. Spustenie do ostrej prevádzky sa uskutoční v decembri 2012. O prvých skúsenostiach so systémom SK CRIS si prečítate niekedy nabudúce…
Zdroje:
- Národný projekt NISPEZ, aktivita 4.1 Analytická štúdia – Súhrnná správa. Zost. Cvik, O. – gestor aktivity 4.1 . Bratislava, CVTI SR, marec 2010 . [Online]. [cit. 25.10.2012] Dostupné na: <http://nispez.cvtisr.sk/index.php?&menu=107>
- Turňa, J.; Noge, J.; Zendulková, D.: The system SK CRIS, scientific publications and theses – mirror of Slovak science. In: Jeffery, Keith G; Dvořák, Jan (eds.): E-Infrastructures for Research and Innovation: Linking Information Systems to Improve Scientific Knowledge Production: Proceedings of the 11th International Conference on Current Research Information Systems (June 6-9, 2012, Prague, Czech Republic). Pp. 211-220. ISBN 978-80-86742-33-5. [cit. 25.10.2012]. Dostupné na: http://www.eurocris.org/Uploads/Web%20pages/CRIS%202012%20-%20Prague/CRIS2012_23_full_paper.pdf
- Valkovič, L. : Detailná funkčná špecifikácia systému SK CRIS. Bratislava, 2011. [cit. 25.10.2012]
- Zendulková, D.: Systém SK CRIS – slovenská veda na dlani. In: ITlib. Informačné technológie a knižnice, roč. 16, č.1/2012, str. 7-10 ISSN 1335-793X. [cit. 25.10.2012]. Dostupné na: http://www.cvtisr.sk/itlib/itlib121/zendulkova.htm
[1] Obsah a funkcionalita z doterajšieho systému, ktorá je nad rámec CERIF a slúži pre potreby rozhodovacej sféry, zostáva aj v novom systéme plne zachovaná.