Preprintové servery

Hlavné články



Pod preprintom sa všeobecne rozumie verzia príspevku, ktorý je zo strany autora “výskumne ukončený”, ale
z hľadiska publikovania je v procese prípravy na publikovanie. Z hľadiska vedeckej komunity je však dôležité,
aby výsledky boli čo najskôr dostupné. Preprinty sa distribuovali štandardnými prostriedkami – poštou, priamou
výmenou na konferenciách ap. Základnými vlastnosťami procesu distribuovania bola rýchlosť a to, že boli
“zdarma”. Mimoriadne zrýchlenie šírenia a sprístupnenia nových vedeckých výsledkov vo forme
preprintov/e-printov spôsobili informačné a komunikačné technológie. Umožnili zrýchliť proces prístupu, ale
predovšetkým umožnili vytvoriť prostredie na uchovávanie a sprístupňovanie preprintov, e-printov
prostredníctvom elektronických archívov. Príspevok opisuje motív vytvárania preprintových/e-printových
serverov, metódy a prostriedky ich sprístupňovania i samotného vytvárania.



Úvod

Enormný nárast nových vedeckých informácií a skracovanie inovačných technologických cyklov je spojený aj s
požiadavkami na ich rýchle sprístupnenie širokej vedeckej komunite, ako aj ich používateľom v praxi. Prejavilo sa
to zvýšením frekvencie komunikácie medzi vedcami, vedeckými tímami i celými inštitúciami. Zvýšil sa počet vedeckých
konferencií a vedeckých časopisov. Ani to však nestačilo. Vedecká komunita požadovala zrýchlenie prístupu k novým
výsledkom. Predovšetkým pri časopisoch čas od zadania príspevku do časopisu na publikovanie do jeho skutočného
publikovania v danom časopise bol, a treba povedať, že stále je, príliš dlhý. Nezanedbateľný je tiež fakt, že autor
podpisuje kontrakt s vydavateľom časopisu, ktorý preberá zodpovednosť za distribuovanie a šírenie predložených
výsledkov prostredníctvom daného časopisu. Súčasťou kontraktu je aj podmienka odborného posúdenia kvality a
originality predložených výsledkov. To, pochopiteľne, zaberalo nemálo finančných prostriedkov a času.

Autorom zostala ešte jedna možnosť – prevziať “zodpovednosť” do vlastných rúk a zabezpečiť distribúciu ešte
nepublikovaných výsledkov, tzv. preprintov, vlastnými prostriedkami a cestami. Pod preprintom sa všeobecne rozumie
verzia príspevku, ktorý je zo strany autora “výskumne ukončený”, ale z hľadiska publikovania je v procese prípravy
na publikovanie (Tomaiuolo, 2000). Ide o príspevok, ktorý je z hľadiska publikovania v procese recenzovania, a teda
nie je ani isté, či (a prípadne v akej konečnej forme) bude publikovaný. Z hľadiska vedeckej komunity je však
dôležité, aby výsledky boli čo najskôr dostupné. Vyžadovalo si to vytvorenie primeraného počtu preprintov a ich
distribúciu. Išlo zvyčajne o “papierovú formu” príspevku. Distribúcia sa robila štandardnými prostriedkami, ako je
pošta, fax, ale i osobná distribúcia, ktorá sa robila najčastejšie na konferenciách, ale aj priamych alebo
nepriamych návštevách. K rýchlosti takto pribudol ďalší nezanedbateľný faktor – cena. Preprinty sa distribuovali v
podstate zdarma.

Mimoriadne zrýchlenie sprístupnenia “preprintov” spôsobili informačné a komunikačné technológie. Umožnili
prezentovať výsledky výskumu v nepapierovej, elektronickej forme. Informačné a komunikačné technológie však
umožnili “pridať k danému dokumentu ďalšie hodnoty”. Zrýchlili proces prístupu, ale predovšetkým vytvorili
prostredie na uchovávanie a sprístupňovanie preprintov prostredníctvom elektronických archívov. Takýmto spôsobom sa
začali sprístupňovať aj príspevky už publikované (postprinty), ktoré sa spolu s preprintmi označujú ako e-printy.
Tvorcom a dodávateľom dokumentov do archívu je samotný autor a sú také flexibilné, že môžu koexistovať spolu s
predchádzajúcimi systémami na spracovanie publikácií alebo vyústiť do niečoho lepšieho, čo spĺňa potreby
výskumníkov (Ginsparg, 2000). Ich využiteľnosť si vyžaduje nielen IT prostredie, ale aj celý rad dohovorov a
štandardov. Zďaleka nejde iba o elektronickú reprezentáciu pôvodných článkov. Súčasný stav prekročil aj rámec siete
a hovorí sa o spoločnom využívaní poznatkov.


Počiatky preprintov

Preprinty boli dlhé obdobie známe predovšetkým v odboroch základného výskumu. Najčastejšie sa hovorí o
fyzike. V 70. rokoch minulého storočia sa v komunite fyzikov zaoberajúcich sa vysokými energiami začali šíriť
najnovšie výsledky formou ešte nepublikovaných prác – preprintov. Motív bol veľmi jednoduchý: urýchliť prenos, ale
aj sprístupniť najnovšie výsledky výskumu. Často sa v tejto súvislosti hovorí aj o priorite. Pre autorov bolo
nevyhnutné čo najskôr rozšíriť príspevok s ich menom v príslušnej komunite.

Ak sa autorom pripisuje prevzatie “zodpovednosti” za šírenie svojich výsledkov formou ešte nepublikovaných
prác, je nutné uvedomiť si, že práca nemusela prejsť recenzným procesom, a teda autori museli fakticky prebrať
“zodpovednosť” za pravdivosť obsahu predmetného príspevku. Tento problém “zodpovednosti” je komplexnejší a pretrval
dodnes.


Archívy preprintov, e-printov

Mimoriadnu pozíciu pri rozvíjaní myšlienok šírenia nových vedeckých poznatkov prostredníctvom preprintov a
neskôr e-printov malo Los Alamos National Laboratory (LANL), jedna z najväčších multidisciplinárnych inštitúcií na
svete. Práve tu sa zúročili skúsenosti zo šírenia nových vedeckých výsledkov cez preprinty, ktoré vyústili do
systému zahŕňajúceho
archív dokumentov spolu s požadovanými
službami. Autorovi zostala hlavná úloha – dodať materiál do archívu – a služba zabezpečila distribúciu a
sprístupnenie materiálov. Zavedenie archívov znamenalo aj zavedenie určitého systému do problematiky šírenia nových
vedeckých poznatkov. Ten umožnil poskytovanie služieb nielen jednotlivcovi, ale celej komunite. Aby túto funkciu
mohol efektívne plniť, bolo potrebné špecifikovať požiadavky na formu a spôsob dodávaných materiálov a
štandardizovať ich. Kľúčovú úlohu tu zohrali informačné a komunikačné technológie. Predovšetkým materiály v
elektronickej podobe neboli len preprinty, ale záber sa rozšíril aj na už publikované príspevky, a preto hovoríme o
e-printoch. Rovnako sa rozšírili a zrýchlili aj služby. Vytvorili sa špecializované servery na uchovávanie
e-printov a poskytovanie služieb.

Archívy sa často porovnávajú s časopismi. Nikdy však nebolo úmyslom archívov stať sa časopismi, nikdy sa
nepočítalo s tým, že by sa robila recenzia príspevkov v archívoch. Archív je repozitár pre elektronické verzie
článkov, poskytujúci vedcom vhodný spôsob spoločného využívania ich výsledkov so svojimi kolegami. Pretože nie
všetky nové príspevky sú recenzované, ich používateľ sa musí spoľahnúť na vlastný úsudok, pokiaľ ide o pravdivosť
predmetného príspevku, ktorý si z archívu stiahne (Luce, 2001).


Elektronické archívy

Pridanou hodnotou informačných a komunikačných technológií k problematike distribúcie nových vedeckých
poznatkov – preprintov – nie je iba ich “digitalizácia” a elektronická forma. Vytvorenie špecializovaných serverov
obohatilo nielen uchovávanie e-printov v štandardizovanej podobe, ale obohatilo predovšetkým služby, a to pre
autorov e-printov aj pre ich používateľov. Ak sme hovorili, že archívy umožňujú poskytovanie služieb nielen
jednotlivcovi, ale celej komunite, tak to o to väčšmi platí pre e-archívy. Zvyčajne nejde teda o “osobný” archív
individuálneho vedca, ale slúži väčšej komunite. Aj vzhľadom na rozsah príspevkov bývajú e-archívy
špecializované.

Štrukturálne je e-archív rozdelený na dve základné časti:

  • databáza dokumentov,
  • služby na ukladanie a vyhľadávanie dokumentov.

Na prvý pohľad by sa mohlo zdať, že digitalizácia a elektronická prezentácia dokumentov ukladaných do
e-archívu vyriešila všetky problémy spojené s ich využívaním cez e-archív. Aj keď, samozrejme, prispela k
flexibilnosti manipulácie s e-dokumentmi, priniesla aj celý rad problémov. Predovšetkým je to rôznorodosť
prostriedkov na zápis a prezentáciu daných dokumentov. Na prípravu e-dokumentov bolo vytvorených veľa prostriedkov
– od “klasických Word procesorov” až po prostriedky umožňujúce používať štandardné zápisy tej-ktorej vednej
disciplíny, ako sú napr. rôzne formáty TeX, HTML, PDF, Postscript.

Používateľov dokumentov e-archívu však nezaujíma iba samotný text. Chcú poznať aj ďalšie informácie: kto je
autor, či a kde bol daný dokument publikovaný, či bol recenzovaný a pod. Práve použitie databázových systémov nám
nielen umožňuje, ale dokonca nás núti spájať s daným dokumentom vhodné atribúty cez metadáta. Metadáta umožňujú
opísať každú položku uloženú v databáze.

Cieľom e-archívov je sprístupniť vedecké poznatky širokej odbornej verejnosti čo najrýchlejšie a hlavne
zdarma. Na podporu jednoduchého vytvárania e-archívov v rámci inštitúcií bol na Univerzite Southampton vo Veľkej
Británii vyvinutý softvér Eprints, ktorý je rovnako prístupný zdarma na stránke eprint.org. V súčasnosti sa používa
v 163 známych archívoch.


OpCit

Ak sme medzi motívy vytvárania preprintov a ich rýchlu distribúciu uviedli aj “zviditeľnenie” sa autora ako
“prvého”, ktorý s daným výsledkom prišiel, nemožno sa čudovať ani snahe zabudovať do e-archívov spojitosť s
vedeckými dokumentmi, ktoré sa na daný zdroj odvolávajú. Vo vedeckej komunite je táto spojitosť dokumentov
vyjadrená citáciami. Citácie sú významným ukazovateľom kvality publikovaného vedeckého výsledku. V “papierovej”,
časopiseckej forme má toto prepojenie, ako aj systém sledovania citácií jednotlivých článkov dlhú tradíciu.

V rámci “arXiv.org” vznikol projekt
The Open Citation Linking Project, ktorého cieľom bolo citačné prepojenie dokumentov v archíve arXiv.
Vzhľadom na význam citácií a zložitosť ich vyhľadávania ide o významnú službu autorom a presahuje myšlienku
samotného rýchleho distribuovania/sprístupňovania nových vedeckých výsledkov. Bezprostredne sa týka napr. online
časopisov. Ale vzniká tu aj “rozpor” s objednávaním a platbou týchto časopisov. Samozrejme, že otvorenou zostáva aj
otázka copyrightu. Vzhľadom na vážnosť celej problematiky vstupujú do tohto procesu významné medzinárodné
organizácie či už zo sféry “publishing”, či aj také organizácie ako UNESCO.


OAI

Dobré skúsenosti s e-archívmi v jednom vednom odbore mali za následok rýchle rozširovanie e-archívov v
ďalších vedných odboroch, ale aj inštitúciách poskytujúcich takéto služby. Vznikla preto prirodzená požiadavka
interoperability týchto systémov. V roku 1999 sa uskutočnilo stretnutie reprezentantov inštitúcií prevádzkujúcich
e-archívy i tých, ktorí na takýchto archívoch ešte iba pracovali. Jedným z výsledkov tohto stretnutia bola
iniciatíva
The Open Archives Initiative (OAI;
www.openarchives.org) a následné spísanie konvencie pre technický a
organizačný rámec na podporu interoperability e-archívov, tzv. The Santa Fe Convention (
www.openarchives.org/sfc/sfc_entry.htm). O tom, že ide
o vážny problém a že otázka štandardov sa nerieši ľahko, svedčí aj následný seminár uskutočnený už v júni 2000,
venovaný zhodnoteniu dohovoru zo Santa Fe, jeho revízii a aktualizácii, ktorá vyústila do dokumentu
Open Archives Initiative Protocol for Metadata Harvesting (Protocol Version 1.0;
www.openarchives.org/OAI/openarchivesprotocol.htm),
ktorý platí od začiatku roku 2001. Posledná konferencia sa konala v Southamptone 28. 2. – 1. 3. 2005.


Preprintové servery

Množstvo preprintových serverov stále rastie. Pre zaujímavosť uvádzame aspoň niekoľko z nich.


arXiv

(
http://www.arxiv.org)

Azda najznámejší elektronický archív je arXiv vytvorený na LANL Paulom Ginspargom, často nazývaný “Los Alamos
e-print archive” a pôvodne známy ako “xxx” (xxx.lanl.gov). Pôvodným zámerom bolo vytvoriť e-archív s požadovanými
službami na výmenu vedeckých dokumentov z oblasti teoretickej fyziky vysokých energií, teda v oblasti, kde P.
Ginsparg pracoval. Dobré skúsenosti z tejto oblasti sa však rýchlo rozšírili aj na matematiku, nelineárne vedy a
počítačovú vedu.

ondris1.jpg (49492 bytes)


CogPrints

(
http://cogprints.org/)

Elektronický archív pre kognitívne vedy ako psychológia, lingvistika, počítačová veda, filozofia, medicína,
antropológia atď. Vznikol v auguste 1997 a patrí medzi prvé archívy, ktoré neboli zamerané na oblasť
fyziky.


E-LIS

(
http://eprints.rclis.org/)

Archív obsahuje vyše 2 000 e-printov z oblasti knižničnej a informačnej vedy a príbuzných disciplín.

ondris2.jpg (45872 bytes)


Chemical Physics Preprint Server (
www.chem.brown.edu/chem-ph.html)

Elektronický archív a distribučný server určený pre oblasť teoretickej chémie.


CERN Document Server

(
http://preprints.cern.ch/)

Obsahuje viac ako 650 000 bibliografických záznamov a 320 000 plných textov dokumentov týkajúcich se CERN a
fyziky vysokých energií. Okrem preprintov obsahuje knihy, články, fotografie, periodiká a pod.


BioMed Central

(
www.biomedcentral.com)

Prvý komerčný vydavateľ poskytujúci bezplatný prístup k dokumentom z oblasti medicíny a biológie a preprintové
služby pre výskumné správy.

ondris3.jpg (51170 bytes)


Preprint Archive

(
www.sciencedirect.com/preprintchive)

Preprintový server z oblasti chémie, matematiky a výpočtovej techniky.


PhilSci Archive

(
http://philsci-archive.pitt.edu/)

Preprintový server z oblasti filozofie vedy.




Záver

Vznik e-archívov je výborným príkladom spolupráce v rámci vedeckej komunity a odrazom reality vedeckej
komunity 21. storočia: exponenciálny nárast nových vedeckých poznatkov, nutnosť byť “informovaný a informovať” o
dosiahnutých výsledkoch čo najrýchlejšie, nut-

nosť dohody o spôsobe prezentácie výsledkov, využiť súčasný stav IKT.

E-archívy zaznamenali za krátke obdobie svoje opodstatnenie a prednosti. Podľa štatistík archívu (
http://arxiv.org/cgi-bin/show_stats) pribúda mesačne viac ako 3
500 nových príspevkov. Vznikajú nové e-archívy.

Existuje však veľa otvorených problémov technologického rázu, ale aj obsahového, spojeného s problémom
copyrightu. Prínosy v oblasti služieb však dávajú e-archívom veľkú budúcnosť.


Zoznam bibliografických odkazov:

Self-Archivig FAQ [online]. In
Eprints.org. Southampton : University of Southampton, 2002 [cit. 2005-04-15]. Dostupné na internete:
http://www.eprints.org/self-faq/.

GINSPARG, P. 1995. First Steps Towards Electronic Research Communication. In
Computers in Physics. 1995, vol 8, no. 4 [cit. 2005-04-14], s. 390-396. Dostupné na internete:
http://xxx.lanl.gov .

GINSPARG, P.1996. Winners and Losers in the Global Research Village. Invited contribution, UNESCO
Conference HQ, Paris, 19-23 Feb. 1996 [cit. 2005-04-17]. Dostupné na internete:
http://xxx.lanl.gov/blurb/
pg96unesco.html

GINSPARG, P. 2000. Creating a Global Knowledge Network: Don’t Just Clone the Paper Methodology. In
Freedom of Information Conference: (6-7 July 2000: New York Academy of Medicine). [s.j.:s.n.], 2000 [cit.
2005-04-17]. Dostupné na internete:
http://www.biomedcentral.com/meetings/2000/foi/editorials/ginsparg.
 

HARNAD, S. 2003.
For Whom the Gate Tolls? How and Why to Free the Refereed Research Literature Online Through
Author/Institution Self-Archiving, Now
[online]. 2003 [cit. 2005-04-15]. Dostupné na internete:
http://www.cogsci.soton.ac.uk/

~harnad/Tp/resolution.htm#Harnad/Oppenheim


Integrating and navigating e-print archives through citation linking [online]. [cit. 2005-04-17].
Dostupné na internete:



http://www.

cogsci.soton.ac.uk/~harnad/citation.html
.

LUCE, R. E. 2001. E-prints Intersect the Digital Library : Inside the Los Alamos arXiv. In
Issues in Science and Technology Librarianship [online]. Vol. 29, Winter 2001. [s.l.]: Association of
College & Research Libraries, 2001 [cit. 2005-04-15]. ISSN 1092-1206. Dostupné na internete:
http://www.istl.org/01-winter/article3.html.

SUBER, P. 2005.
Timeline of the Open Access Movement [online]. Aktualiz. v apríli 2005 [cit. 2005-04-15]. Dostupné na
internete:
http://www.earlham.edu/~peters/fos/timeline.htm.
 

TOMAIUOLO, N. G. 2000. PreprintServers : Pushing the Envelope of Electronic Scholarly Publishing. In
Searche., Vol. 8, no. 9, Oct. 2000 [cit. 2005-04-12]. Dostupné na internete:
http://www.infotoday.com/searcher/oct00/tomaiuolo&packer.htm.
 

Zdieľať: