Správa údajov – nová výzva pre knižnice? Spoločný seminár OpenAire/LIBER (Gent 28. 5. 2013)

Podujatiaknižniceopen accessvedecká komunikácia

V ostatných rokoch možno sledovať nárast zdieľania a opakovaného využívania výskumných údajov v rámci viacerých vedeckých komunít. To môže mať významný vplyv na výskumné organizácie a knižnice nielen z hľadiska štandardov, metaúdajov a sprístupňovania, ale aj z hľadiska infraštruktúry, kvalifikácie a praxe. Zriaďovatelia kladú na knihovníkov naliehavé požiadavky ohľadne správy čoraz komplexnejších výstupov výskumu, akými sú napríklad súpravy experimentálnych alebo empirických údajov. Navyše, mnohí vedeckí pracovníci a výskumníci nemajú k dispozícii zodpovedajúce datacentrá a často sami hľadajú pomoc v knižnici. Aj preto je potrebné, aby si výskumné organizácie a knižnice uvedomili svoje možnosti a poslanie v tomto meniacom sa prostredí a navrhli potrebné podporné mechanizmy. Hľadanie odpovedí na tieto otázky bolo náplňou spoločného seminára riešiteľov projektu OpenAIRE a expertov LIBER, ktorý bol zaradený ako predkonferencia do rámca pravidelného výročného stretnutia expertov Európskej skupiny pre automatizáciu knižníc (ELAG) [1].

Cieľom pracovného seminára bolo určiť súčasnú a naznačiť budúcu rolu a pozíciu knižníc v životnom cykle vedeckých a výskumných údajov.

Nosnou témou spoločného seminára projektu EU OpenAIRE [2] a združenia európskych vedeckých knižníc LIBER bolo preskúmať súčasnú pozíciu knižníc v oblasti správy výskumných údajov a načrtnúť očakávania najbližšej budúcnosti.

Projekt OpenAIRE sa zameriava na podporu rôznorodej komunity zainteresovaných strán, menovite aj knihovníkov a výskumných pracovníkov, pri správe, uchovávaní, vyhľadávaní a prepájaní výsledkov výskumu. LIBER sa zameriava na podporu vedeckých knižníc pri transformácii tradičných a rozvoji aktivít v nových oblastiach, medzi ktoré patrí okrem iného práve manažment výskumných údajov a rozvoj vedeckej informačnej infraštruktúry. Program seminára sa preto zameral na životný cyklus, citovanie a publikovanie údajov, ako aj na tvorbu metaúdajov a informačných systémov. Výskumní pracovníci referovali o svojich skúsenostiach a praxi pri používaní, zdieľaní a prepájaní výskumných údajov z viacerých vedeckých oblastí. Seminár uzavrela panelová diskusia o budúcich kvalifikačných požiadavkách na knihovníkov s názvom Vedecká komunikácia a infraštruktúra pre výskum

Erik Mannens (UGent, MMLAB) uviedol seminár prednáškou Otvorená veda z pohľadu výskumníka (What is open science, a researcher’s perspective). Zdôraznil, že otvorenosť prístupu k údajom sa má stať štandardom a knižnice môžu pritom zohrať významnú úlohu katalyzátora transformačných procesov. Na to je potrebné, aby výskumníci a knihovníci navzájom poznali komodity a metódy svojej práce a pochopili širšie súvislosti opakovaného využívania údajov. Knižnice by mali poskytovať infraštruktúru a nástroje, prinajmenšom by mali poznať dostupné nástroje a orientovať sa v nich. Otvorený prístup treba zavádzať do každodennej praxe.

Sarah Callaghan (British Atmospheric Data Centre) prezentovala v príspevku Prehľad výskumných údajov (Research Data Overview) systematický pohľad na životný cyklus údajov, tvorbu údajových súprav, problematiku rozsiahlych údajov (big data) a okrajových údajov (long tail data), ako aj na tvorbu metaúdajov vrátane požiadaviek na infraštruktúru dátových centier z repozitárov. Podelila sa so skúsenosťami tvorby dát pri vlastnom výskume. Prácu s dátami prirovnala ručnému úpletu, ktorý možno rekonštruovať len vtedy, ak poznáte všetky podrobnosti a okolnosti jeho vzniku (t. j. metaúdaje, ale aj širší kontext pôvodného zámeru). Zdôraznila potrebu propagácie korektných metaúdajov ako základnej podmienky na dlhodobú ochranu a sprístupňovanie výskumných údajov a ich agregátov. Odporučila, aby sa pri správe údajov venovala pozornosť dôveryhodnosti výsledkov a ich producentov.

Program seminára pokračoval panelovou diskusiou na tému V ústrety vedcom – pohľad výskumníka (Meet the scientists – A Researcher’s perspective), v ktorej sa pozvaní panelisti Aaike de Wever (Royal Belgian Institute of Natural Sciences, Biofresh Data Portal), Joris Van Zundert (Huygens ING) a Dirk Van den Poel (UGent) venovali požiadavkám a očakávaniam výskumných pracovníkov v oblasti využívania a zdieľania získaných údajov. Priblížili vlastné pracovné postupy pri praktickom narábaní s údajmi a vyjadrili názor o možnej podpore zo strany knižníc pri systematickom manažmente výskumných údajov.

J. V. Zundert charakterizoval svoje údaje ako veľmi neštruktúrované a na ich zdieľanie a publikovanie je potrebné získať kľúč. Zdôraznil, že výskumníci nie sú obvykle z komunity správcov dát. Knižnice by mohli v tomto pôsobiť ako predmetové repozitáre údajov, ktoré chýbajú najmä v oblasti spoločenských vied. A. de Wewer potvrdila, že aj pre prírodné vedy pociťujú nedostatok pamäťových kapacít, resp. dátových centier. Problematické sú tiež zavedené akreditačné mechanizmy, ktoré sa publikovaním údajov nezaoberajú. Knižnice by mali zohrať úlohu pri podpore repozitárov a prepájaní výstupov výskumu, t. j. vedeckých publikácií a relevantných výskumných údajov. Mali by pomáhať výskumníkom pri orientácii v repozitároch a spôsobe uchovávania výsledkov výskumu. D. Van den Poel upozornil, že väčšina údajov je senzitívnych a ani ich anonymizácia nemusí byť vždy bezpečná. Konštatoval, že vďaka dostupným otvoreným softvérovým produktom rastie záujem o zdieľanie výstupných údajov výskumu, no tento spôsob správy údajov je časovo náročný. Tu by mohli knižnice podporiť výskum napríklad pri návrhu pracovných postupov údajov a pri ich správe tak, aby ich bolo možné opakovane interpretovať inými výskumníkmi. Pravdou však je, že požiadavky na správu údajov sú zo strany takmer každej vedeckej disciplíny odlišné.

Programový blok Procesy publikovania údajov (The data publishing process) naplnili dve prezentácie. Peggy Schaeffer (Dryad) v prednáške Podpora vedeckých komunít publikovaním údajov (Supporting scientific communities by publishing data) poskytla komplexný prehľad o systéme a aktivitách univerzálneho repozitára DataDryad. Fiona Murphy (Wiley Publishers) sa v prednáške Publikovanie údajov z pohľadu vydavateľa (Data Publication: a Publisher’s perspective) venovala všeobecne problému publikovania údajov a zdôraznila potrebu ich citovania a akreditácie. Výskumných pracovníkov by malo zaujímať, ako často sú ich údaje využívané a citované. Knižnice by mohli prispieť najmä pri procesoch šírenia publikovaných údajov, nakoľko majú kompetencie v oblasti informačného manažmentu po teoretickej i praktickej stránke.

V programovom bloku Aktívna podpora manažmentu údajov – prístup troch výskumných inštitúcií (Actively Supporting Data Management : Learning from the Approach of Three Research Institutions) odzneli prípadové štúdie Robin Rice (Data Librarian, Edinburgh University Data Library) Vývoj online nástrojov na správu údajov pre výskumníkov a knihovníkov (Developing online data management resources for researchers and librarians, Ellen Verbakel (Data Librarian, 3TU.Datacentrum, Delft University) 3TU Datacentrum and Data Intelligence pre knihovníkov: podpora personálu a výskumníkov pri správe údajov (’3TU.Datacentrum and Data Intelligence for Librarians: support to staff and researchers on data management) a Andrew Cox(University of Sheffield) RDMRose – otvorený vzdelávací prameň o správe údajov pre informačných profesionálov (RDMRosean open educational resource on Research Data Management tailored for information professionals). Príspevky predstavovali príklady najlepšej praxe pri manažmente výskumných údajov v troch veľmi rozdielnych knižniciach. R. Rice prezentoval cestovnú mapu správy výskumných údajov na svojej univerzite. Predstavil kurz rozvoja zručností knihovníkov a príslušné pomocné materiály na zvládnutie tejto úlohy. V rámci konzorcia troch univerzít 3TU sa spracovala metodika správy výskumných údajov (Data intelligence for library staff) určená pre knihovníkov a začínajúcich výskumníkov. Snahou je posunúť knižnicu do stredu podpory vied s intenzívnymi dátami. RDMRose je vzdelávací program pre informačných profesionálov postavený na princípe učenie je prax. Cieľom je pomôcť knihovníkom pochopiť, čo sú výskumné údaje, a naučiť, ako ich spravovať. Spomedzi ďalších metodických materiálov stojí za zmienku publikácia Setting up a research data service [3].V záverečnom programovom bloku Služby a nástroje (Services and tools) odzneli prezentácie informačných systémov na správu vedeckých publikácií a údajov. Repozitár ZENODO projektu OpenAIRE predstavil Lars Holm Nielsen (OpenAIRE) v príspevku ZENODO – inovatívna služby na zdieľanie úplných výsledkov výskumu (ZENODO – A new innovative service for sharing all research outputs). ZENODO je inovovaný repozitár osirelých diel projektu OpenAIRE, rozšírený o možnosť ukladania údajov. Je vhodný na dlhodobé uchovávanie. Dovoľuje reexport údajov a publikácií do lokálnych repozitárov. Je vybudovaný na báze otvoreného systému Invenio. Joss Winn (Orbital project, University of Lincoln library) predstavil v príspevku CKAN – Nástroj na správu údajov (CKAN – A Research Data Management Tool) skúsenosti z implementácie systému na univerzite University of Lincoln. Konštatoval, že hoci správa výskumných údajov je relatívne nový fenomén, zahŕňa procesy, ktorými sa knižnice zaoberajú „od nepamäti“: viditeľnosť, objaviteľnosť, správa, ochrana, publikovanie… CKAN je podľa neho vhodnou alternatívou  na správu výskumných údajov v knižniciach. Je to flexibilný a rozšíriteľný RDM systém (Research Data Management), ktorý môže prospieť výskumníkom, knihovníkom a ich inštitúciám.

Seminár zavŕšila panelová diskusia expertov pri okrúhlom stole. Kevin Ashley (DCC), Wilma van Wezenbeek (TU Delft Library), Wolfram Horstmann (University of Oxford Library), Lukas Koster (Library of the University of Amsterdam) diskutovali o nových úlohách knižníc pri podpore výskumu, osobitne v oblasti rozvoja služieb správy údajov, o organizačných otázkach a o nových kvalifikačných požiadavkách na knihovníkov. Podelili sa so svojimi skúsenosťami a poznatkami v danej oblasti a podnietili účastníkov seminára k hľadaniu odpovedí na tieto aktuálne výzvy. Diskutovalo sa o optimálnej účasti knižníc na životnom cykle výskumných údajov a možnosti zužitkovať generické funkcie a služby knižníc. Z diskusie vyplynulo, že knižnice majú kompetenciu na poradenstvo, školenie a propagáciu v oblasti systematickej správy údajov. Môžu prispieť k viditeľnosti, vyhľadateľnosti a k pridanej hodnote formou prepájania údajov a publikácií v rôznych kontextoch. Knižnica má rozhodujúcu úlohu na začiatku životného cyklu údajov (plánovanie, formálne charakteristiky) a na jeho konci najmä z hľadiska opakovaného využívania a dlhodobého uchovávania. Z podobných úvah vychádza aj desať odporúčaní na správu údajov z dielne združenia LIBER [4]. Spoločný seminár expertov European Libraries Automation Group a Ligue de Bibliotheques Européennes de Recherche prispel k lepšiemu pochopeniu procesov tvorby a publikovania výskumných údajov. Naznačil perspektívy knižníc v oblasti správy a sprístupňovania nových typov informačných objektov a súborov. Poukázal na potrebu nových kvalifikačných predpokladov a znalostí pracovníkov knižníc potrebných na podporu výskumu, vedy a vzdelávania. Predstaviteľom týchto zmien by mal byť tzv. dátový knihovník (data librarian). Knižnice by nemali pôsobiť izolovane. Majú dôležitú funkciu pri presadzovaní štandardov.

Zdôraznila sa potreba rozvoja špeciálnych služieb na podporu správy údajov a ich previazania s vedeckou literatúrou a ďalšími výstupmi výskumu. Knižnice by mali prevziať úlohu metodického dozoru pri usmerňovaní výskumníkov v oblasti využívania repozitárov a prevziať zodpovednosť pri plánovaní a realizácii komplexných procesov správy výskumných údajov.

 

Poznámky

[1]http://elag2013.org/openaireliber-workshop/

[2]http://www.openaire.eu/en/component/content/article/9-news-events/462-recordings-available-dealing-with-data

[3]Setting up a research data service (http://www.dcc.ac.uk/resources/how-guides/how-develop-rdm-services)

[4]http://www.libereurope.eu/news/ten-recommendations-for-libraries-to-get-started-with-research-data-management

 

 

Zdieľať: