Ako zaškatuľkovať vedu a výskum?

NISPEZ predstavuje

Koľko percent organizácií, ktoré vykonávali výskum a vývoj
v roku 2008, sa nachádza v Bratislavskom kraji? Aké projekty z oblasti ekológie boli
riešené na Slovensku za posledných päť rokov? Kto sú najvýznamnejší odborníci z
oblasti nanotechnológií? … Kde nájdeme fundovanú odpoveď na podobné otázky?

Na podrobnosti o slovenskej vede sa pýtajú nielen pracovníci
ústredného orgánu štátnej správy zodpovední za financovanie výskumných aktivít.
O informácie tohto typu sa zaujíma aj manažment vedy a výskumu, vedci a výskumníci
zo Slovenska i spoza hraníc a tiež predstavitelia médií, vedeckej žurnalistiky a v
neposlednom rade zaujímajú nás všetkých. Veda a výskum je predsa platená aj z
našich daní. Kde možno získať odpoveď na podobné otázky? No predsa v informačnom
systéme zameranom na vedu a výskum.

Na úvod trošku teórie. Informačný systém je dátový systém
pozostávajúci zo siete komunikačných kanálov [1]. Je charakterizovaný takými
atribútmi, ako sú ľudia, dátové záznamy a aktivity spracúvajúce údaje a
informácie [2]. Informačný systém o vede (Current research information system; CRIS)
môžeme definovať ako informačný systém verejnej správy zabezpečujúci zber,
spracovanie, poskytovanie a využitie údajov o výskume, vývoji a inováciách
podporovaných z verejných zdrojov. Je to skrátka systém, ktorý zbiera a spravuje
informácie, aby ich poskytoval ľuďom [3].

Nás však zaujíma, čo vlastne tento pojem znamená v praxi, aké
informácie nám dokáže poskytnúť a ako by mal vyzerať, aby dokázal odpovedať na
podobné zvedavé otázky o vede, ako sú tie v úvode článku.

Na tento účel bola v CVTI SR vypracovaná štúdia, realizovaná v
rámci národného projektu Národný informačný systém podpory výskumu a
vývoja v SR – Prístup k elektronickým informačným zdrojom
(NISPEZ)
,
konkrétne v rámci jeho špecifického cieľa č. 4: Rozširovanie Centrálneho
informačného portálu pre výskum, vývoj a inovácie (CIP VVI) o nové funkčnosti s
rešpektovaním štandardov EÚ a zameraním na efektívnu prácu s projektmi vrátane
prepojenia s inými informačnými systémami.
Národný projekt, ktorého nositeľom
je CVTI SR, sa realizuje v rámci Operačného programu Výskum a vývoj a je financovaný
z Európskeho fondu regionálneho rozvoja (ERDF).

V rámci tejto štúdie sme sa pokúsili zmapovať informačné
systémy o vede a výskume na národnej úrovni (najmä) v krajinách EÚ. Zamerali sme sa
na ich používateľské rozhrania a ich funkcionalitu a používateľskú
príťažlivosť. Výsledkom sú námety využiteľné pre rozvoj slovenského
informačného systému, ktorého aktuálnu verziu možno nájsť na adrese: https://www.vedatechnika.sk/SK/stranky/webaccess.aspx?Page=BasicSearch
(pozri obr. č. 1).

zend1.jpg (223017 bytes)

 
Obr. č. 1 FRIS: Expert, jeho zamestnávateľ,
riešiteľský tím a riešené projekty

Informácie sme získavali viacerými spôsobmi. Už od roku 2008
CIP VVI v rámci rubriky Veda v EÚ – Informačné systémy v EÚ [4] zverejňuje odkazy
na zaujímavé informačné systémy z európskych krajín. Cenné informácie sme
získali zo zdrojov asociácie prevádzkovateľov informačných systémov o vede EuroCRIS
[5], ktorej členom je CVTI SR od roku 2007. Množstvo informácií bolo získaných aj
použitím štandardných vyhľadávacích nástrojov internetu.

Čo sa týka obsahu informačného systému, hodnotili sme, či
systém obsahuje základné databázy v zmysle dátového formátu CERIF [6],
odporúčaného Európskou komisiou a rozvíjaného na pôde asociácie EuroCRIS. Tento
formát je štruktúrovaný do entít, pričom základnými entitami (entitou rozumieme
modul, databázu) sú Organizácie, Projekty, Personálna databáza a Výsledky výskumu a
vývoja. Cieľom použitia formátu CERIF je kompatibilita zbieraných dát o vede a
výskume vo svete a možnosť výmeny dát medzi informačnými systémami jednotlivých
krajín.

Čo sa týka príťažlivosti a funkčnosti používateľského
rozhrania, hodnotili sme ho z pohľadu používateľa, ktorý o databáze, ktorú má pred
sebou, nevie prakticky nič. Všetci sa zhodneme, že pokiaľ prezentačná internetová
stránka informačného systému obsahuje iba rámček určený na zápis vyhľadávacieho
termínu a tlačidlo Hľadaj, z pohľadu neinformovaného používateľa to nestačí.

Používateľské rozhranie hodnotených informačných systémov
prevažne obsahovalo jednoduché aj rozšírené vyhľadávanie v najmenej troch zo
štyroch „povinných“ modulov odporúčaných formátom CERIF. Väčšinou nechýbal
návod na prácu so systémom ani dvojjazyčnosť, čiže okrem verzie v národnom jazyku
aj verzia v angličtine. Viaceré systémy mali implementovaný formát CERIF, čo
znamenalo prepojenie jednotlivých databáz medzi sebou a možnosť získania informácií
o vzájomných vzťahoch medzi jednotlivými prvkami (ako príklad možno uviesť
vyhľadanie publikácií daného autora vo vzťahu ku konkrétnemu projektu). A predsa…
Niektoré systémy mali ešte pridanú hodnotu navyše, funkciu či vlastnosť, ktorá
nás z zaujala. Napríklad:

V Belgicku je prevádzkovaný informačný systém FRIS
(Flanders Research Information Space [7]. Informačný systém je členený na štyri
databázy: Projekty (takmer 18 000 záznamov), Organizácie (viac ako 3 300
záznamov), Výskumníci (vyše 16 000 osôb) a Grantové programy (460
programov). Zo základných modulov odporúčaných formátom CERIF chýbajú výsledky
výskumu a vývoja. Obsah databáz a internetové stránky sú k dispozícii v
angličtine. Prehľadnosť používateľského rozhrania možno hodnotiť pozitívne,
miernym nedostatkom je malá variabilita vyhľadávania. Zobrazenie záznamov je detailné
a prehľadné. Ukážka záznamu o expertovi s kontaktnými údajmi, zamestnávateľskou
organizáciou a riešenými projektmi sa nachádza na obrázku č. 1. Skutočnosť, že je
uvedená funkcia experta v riešiteľskom tíme, poukazuje na detailné spracovanie rolí
subjektov v zmysle formátu CERIF [13].

Čím je tento informačný systém výnimočný? Sú to
predovšetkým zabudované grafické funkcie. Ku všetkým objektom je
možné zobraziť diagram spolupráce a umiestnenie organizácie na mape (obr. 2).

zend2.jpg (309408 bytes)

Obr. č. 2 FRIS: Organizácia, jej umiestnenie na mape a
diagram spolupráce


V systéme je zabudovaná aj funkcia exportu dát vo formáte XML, PDF alebo
RSS.

V Českej republike je prevádzkovaný Informačný
systém výskumu, vývoja a inovácií
(ISVV) [8]. Údaje v systéme sú usporiadané
do siedmich navzájom logicky prepojených databáz: Poskytovatelia podpory VaV (25),
Výskumné zámery (takmer 900), Programy (vyše 200), Subjekty (4
600), Výsledky (vyše 550 000), Verejné súťaže (vyše 400) a Projekty
(32 500). Zo základných modulov podľa formátu CERIF chýba personálna databáza
expertov.

Počtom spracovaných záznamov a hlavne šírkou obsiahnutej
problematiky je tento systém na prvom mieste medzi porovnávanými informačnými
systémami o vede. Systém má skoro samé prednosti: Má vytvorený používateľsky
prijateľný vyhľadávací mechanizmus s množstvom kritérií a v rámci nich
zabudovaných číselníkov a ponukových menu. Systém je bilingválny (čeština aj
angličtina), má kvalitný obsah i rozsah spracovaných údajov. Systém neobsahuje
grafické funkcie.

Jeho prednosťou je bohaté hypertextové prepojenie objektov
(obr. č. 3) medzi sebou a možnosť exportu vyhľadaných údajov vo
formáte XLS alebo DBF.

zend3.jpg (375051 bytes)

Obr. č. 3 ISVV: Záznam o projekte s hypertextovým
prepojením na poskytovateľa, program a verejnú súťaž

Estónsky informačný systém Estonian Research Portal
ETIS
[9] obsahuje všetky štyri základné moduly informačného systému o vede v
zmysle formátu CERIF – Organizácie (v členení na vedecké a výskumné
subjekty, v rámci nich aj divízie; spolu do 500 inštitúcií a asi 1 500
organizačných jednotiek), Projekty (4 400), Experti (8 000) a Výsledky
výskumu a vývoja
(vyše 70 000 záznamov o publikáciách) – vzájomne
previazané, obsahovo, rozsahovo aj kvalitatívne veľmi dobre spracované. Je naplnený
údajmi prevažne v angličtine, niektoré názvy projektov sú len v estónčine.
Prepojenia medzi organizáciou, projektmi, expertmi a publikáciami je zachované. Tento
systém nemá implementovanú funkcionalitu, ktorá by ho odlíšila od ostatných
systémov prevádzkovaných v európskych krajinách. Jeho najväčšou prednosťou je vyrovnanosť
kvality spracovania dát aj softvéru a obsahová kompletnosť
.

NARCIS – Gateway to Dutch Scientific Information
[10] je holandský informačný systém obsahujúci údaje v piatich databázach:
244 751 vedeckých publikácií (181 318 z nich sú open access), 6 368 dátových
kolekcií
z oblasti umenia, humanitných a sociálnych vied, personálna databáza
výskumníkov obsahuje 10 000 expertov, 7 500 VŠ učiteľov a 36 000
výskumníkov, výskumné projekty (20 000 prebiehajúcich a 22 000 uzavretých
projektov) a výskumné organizácie (750 subjektov).

Systém má všetky prednosti, ktorými disponujú kvalitné
informačné systémy o vede. Obsahuje kvalitné a rozsahovo široko spracované a
navzájom prepojené dáta v štruktúre CERIF a je budovaný bilingválne. Pri
organizácii je zobrazené jej umiestnenie na mape. Používateľský komfort by zvýšila
prítomnosť rozšíreného vyhľadávania, resp. zabudovanie číselníkov a ponukových
menu do vyhľadávacieho rozhrania. Rezervu má aj dizajn, ktorý by mal byť adekvátny
kvalite obsahu databáz.

Najväčšou prednosťou systému je skutočnosť, že vyhľadávanie
je možné naraz vo všetkých databázach
(obr. č. 4). Zabudované hypertextové
prepojenie kľúčových slov
má za cieľ vytvorenie kontextuálneho
vyhľadávania: kliknutím na kľúčové slovo je možné vyhľadať záznamy, ktoré
uvedené slovo obsahujú (obr. č. 5). Okrem toho systém obsahuje navonok neviditeľnú
funkciu, ktorou je jednoznačná identifikácia subjektov personálnej databázy
pomocou DAI (Digital Author Identifier). Cieľom implementácie DAI je prideliť každému
autorovi unikátny identifikátor, využiteľný pri priraďovaní publikácií k ich
autorom najmä v prípade rovnakých mien viacerých osôb, variantných mien jednej osoby
a pod.

zend4.jpg (206291 bytes)

Obr. č. 4 Vyhľadávanie vo všetkých databázach
systému NARCIS súčasne

zend5.jpg (292043 bytes)

Obr. č. 5 NARCIS: Záznam experta s ukážkou vyhľadania
záznamov obsahujúcich kľúčové slovo

Maďarsko prevádzkuje informačný systém HunCRIS [11],
ktorý obsahuje tri databázy: Organizácie (3 530, z toho samostatných asi 1/3,
ostatné sú výskumné útvary a tímy), Projekty (viac ako 6 500) a Personálna
databáza
(riešitelia projektov, výskumníci, spolu takmer 14 000 osôb). V systéme
chýba databáza výsledkov výskumu a vývoja. Vstup do systému a vyhľadávacie
rozhranie je k dispozícii v maďarčine aj v angličtine, spracované údaje majú
kvalitný bilingválny obsah. Zo základných funkcií chýba hypertextové prepojenie
súvisiacich objektov (napríklad možnosť kliknutím na meno riešiteľa projektu
zobraziť všetky projekty, ktoré riešil).

Pozoruhodnou vlastnosťou informačného systému, ktorú nemá
žiaden iný systém posudzovaný v rámci štúdie, je implementácia ôsmich
tezaurov
(mená organizácií a ich členenie podľa regiónov, mená expertov,
pre kľúčové slová charakterizujúce projekty sú to tezaurus Ortelius, maďarská
vedecká klasifikácia a voľne tvorené kľúčové slová), ukážka je na obr. č. 6.
Vyhľadávacie rozhranie s tezaurami pracuje, čo umožňuje používateľovi prakticky
pri každej položke výber vyhľadávacieho termínu z bohatej ponuky. Na základe tejto
funkcie sa aj neinformovaný používateľ ľahko zorientuje v obsahu databáz a vo
vyhľadávacích kritériách.

zend6.jpg (219198 bytes)

Obr. č. 6 Použitie tezauru v systéme HunCRIS

Slovinský informačný systém SICRIS (Slovenian
Current Research Information System) obsahuje nasledujúce databázy: Výskumníci
(vyše 13 000 osôb), Organizácie VaV (800 organizácií), Výskumné skupiny a
tímy
(asi 1 300), Projekty (vyše 5 000), Programy (do 1 000). Pri
prezeraní údajov v systéme zaujme kvalita obsahu a rozsah spracovaných dát,
slovinská aj anglická verzia internetových stránok aj dát, bohaté hypertextové
prepojenie údajov, ktoré poukazuje na dôsledne implementovaný formát CERIF. Najmä v
porovnaní s HunCRIS-om vyniká negatívum, že vo všetkých databázach SICRIS-u chýba
akákoľvek ponuka vyhľadávacích termínov (tezaurus/slovník).

Najsilnejšou stránkou je netradičné riešenie absentujúceho
modulu výsledkov výskumu a vývoja prepojením údajov o expertovi na
jeho publikačnú činnosť (obr. č. 7), zaevidovanú v národnom online
knižničnom katalógu Slovinska v systéme COBISS.

zend7.jpg (413284 bytes)

Obr. č. 7 Expert v systéme SICRIS a jeho publikačná
činnosť

Nórsko prevádzkuje Informačný systém FRIDA [12],
ktorý obsahuje štyri základné moduly určené formátom CERIF: Výsledky výskumu,
Profily výskumníkov (personálna databáza expertov), Katalóg
projektov
a Výskumné tímy/organizácie. Počty záznamov v
jednotlivých moduloch nie sú známe. Frida je systém určený na dokumentovanie
výsledkov vedy, výskumu a akademických aktivít. Údaje sú väčšinou okrem nórčiny
aj v angličtine. Je to jeden z mála systémov, v ktorom sú vytvorené všetky moduly
formátu CERIF, avšak jeho riešenie neobsahuje žiaden netradičný a zároveň
atraktívny prvok.

Spomenuli sme 7 najkompletnejších a najzaujímavejších
systémov. Podobne by sa dalo pokračovať aj ďalej, pretože v rámci štúdie boli
spracované údaje z 27 krajín EÚ a aj niektoré systémy mimo krajín EÚ. Zistili sme,
že informačný systém o vede na celoštátnej úrovni prevádzkuje 12 krajín
vrátane Slovenska. Treba zdôrazniť, že prieskum nie je kompletný, keďže niektoré
krajiny prevádzkujú informačné systémy výlučne v národných jazykoch. Neexistuje
záruka, že ich bežné internetové nástroje dokázali pri zadaní kľúčových slov v
angličtine nájsť. Z dvanástich IS 8 rešpektuje formát CERIF, štandard
odporúčaný Európskou komisiou. Zaujímavá je skutočnosť, že z ôsmich IS o vede,
založených na štandardoch EÚ, sa 5 nachádza v krajinách strednej a východnej
Európy. Tieto krajiny sa vyznačujú centralizovaným riadením vedy a výskumu, ale aj
podpriemerným percentuálnym podielom výdavkov na vedu z HDP. Zo spomínaných krajín
má najviac Slovinsko (1,59 %), kým priemer EÚ za rok 2006 je 1,84 %.

Ďalej v 11-tich krajinách sú prevádzkované portály
zverejňujúce informácie z oblasti vednej politiky na celoštátnej úrovni, z toho v
troch krajinách prevádzkujú portály zamerané na analytické a štatistické
informácie týkajúce sa oblasti vedy, techniky, výskumu a inovácií. Viaceré krajiny
prevádzkujú bibliografické a článkové databázy na národnej úrovni.

Z európskej dvadsaťsedmičky 13 krajín neprevádzkuje žiaden
portál
venovaný štátnej podpore vedy a výskumu, ani informačný systém. Táto
skutočnosť však neznamená absenciu akýchkoľvek informácií. Každá z uvedených
krajín zverejňuje sledované informácie aspoň v obmedzenej miere prostredníctvom
internetového sídla príslušného ministerstva alebo iného ústredného orgánu
štátnej správy.

Kam zaradiť do spomínaného zoznamu Slovensko? Je známa vec, že
informačný systém o vede garantuje Ministerstvo školstva SR už od roku 2000. Od roku
2002 je jeho prevádzkovateľom CVTI SR a od roku 2008 je tento systém dostupný cez CIP
VVI [14].

Slovenský informačný systém o vede obsahuje tri zo štyroch
základných modulov CERIF, chýba samostatné spracovanie databázy Výsledky výskumu a
vývoja. Po obsahovej a rozsahovej stránke sú dáta na pomerne dobrej úrovni, najmä v
moduloch Organizácie a Projekty. Anglická verzia systému je realizovaná
čiastočne, podobne to platí aj pre hypertextové prepojenia objektov. Vyhľadávacie
kritériá sú pomerne variabilné, avšak nie celkom reflektujú potreby používateľov
[13]. Možno povedať, že slovenský IS o vede sa nachádza niekde v strede pomyselného
pelotónu európskych informačných systémov o vede.

Treba konštatovať, že v súčasnosti existujú softvérové aj
vecné predpoklady na vzájomné prepojenie dát. Systém potrebuje technický upgrade
týkajúci sa najmä implementácie formátu CERIF a z tohto formátu vyplývajúcich
úprav softvéru aj v minulosti zozbieraných dát najmä s ohľadom na vyhľadávanie
informácií vo vzájomných súvislostiach s rešpektovaním sémantiky. Úpravy, ktoré
navrhujeme v štúdii, sú sčasti inšpirované práve systémami, ktoré sme
charakterizovali v tomto článku.

Cieľom aktivít, ktoré sú realizované v rámci aktivity 4.1
národného projektu NISPEZ, je vytvorenie funkčného, kvalitného a používateľsky
atraktívneho informačného systému, ktorý bude kompatibilný s podobnými systémami
CRIS v Európe a poskytne jeho používateľom pri práci žiadané informácie
v adekvátnej forme a potrebný komfort pri ich vyhľadávaní.

 

Zdroje:

[1]    
wordnetweb.princeton.edu/perl/webwn  
[2]     en.wikipedia.org/wiki/Information_System
[3]     www.thecomputerfolks.com/i.htm

[4]     https://www.vedatechnika.sk/SK/VedaATechnikaVEU/Stranky/Informa%c4%8dn%c3%a9syst%c%a9myvE%c3%9a.aspx

[5]     http://www.eurocris.org
[6]     http://www.eurocris.org/cerif/cerif-releases/

[7]     http://www.researchportal.be/en/index.faces

[8]     http://aplikace.isvav.cvut.cz/

[9]     https://www.etis.ee/index.aspx?lang=en

[10]   http://www.narcis.info/index
[11]   https://nkr.info.omikk.bme.hu/

[12]   https://wo.uio.no/as/WebObjects/frida.woa/4/wa/fres?la=en

[13]   Cvik Oleg: O smerovaní informačného systému pre výskum a vývoj na
Slovensku, In: Informačné systémy o vede v EÚ. Štandardizácia a kompatibilita.
Zborník z medzinárodnej konferencie, CVTI SR, Bratislava 23. 4. 2009 Online: http://conf.cvtisr.sk/KonferenciaIS2009/userfiles/file/Zbornik_konferencia_SK.pdf
 
[14]   https://www.vedatechnika.sk/SK/ISVVP/Stranky/default.aspx

Zdieľať: