Historik versus markup. O interdisciplinárnom workshope Elektronické edície latinských prameňov na báze XML

Zo seminárov a konferencií

Myšlienka zorganizovať podujatie sa zrodila už pred niekoľkými rokmi. V tom čase tvorcovia  digitálnej knižnice pre historické tlače a rukopisy Manuscriptorium (www.manuscriptorium.com) vytvorili softvérové predpoklady na to, aby bolo možné do otvoreného katalógu historických fondov okrem popisov dokumentov
a ich digitálnych kópií integrovať aj plné texty historických dokumentov a ich preklady. Tento predpoklad umožnil postupné dopĺňanie databázy o elektronické edície historických tlačí, rukopisov a ich sprístupňovanie. V októbri 2008 Ústredná knižnica SAV a Katedra klasických jazykov Trnavskej univerzity zorganizovali v podnázve článku uvedený workshop.

Elektronické edície historických dokumentov vznikajú na základe odporúčaní konzorcia TEI (Text Encoding Initiative, www.tei-c.org). Konzorcium vzniklo na konci 80. rokov a koncentruje sa na projekty súvisiace s vývojom štandardov na prezentáciu textu v digitálnej forme. V súčasnosti funguje ako nezávislé združenie akademických inštitúcií z USA a Európy. V roku 1994 publikovalo prvú inštrukciu zameranú na značkovanie textov z oblasti humanitných a sociálnych vied a lingvistiky (TEI P3), ktorá dodnes prekonala niekoľko úprav a aktualizácií (TEI P4, TEI P5). Inštrukcie TEI sa  začali používať vo vedeckej komunite a stali sa nástrojom v explózii elektronických textov. Preformovali mnohé oblasti vedeckého sveta. Predchádzali vzniku DTD MASTER (Manuscript Access through Standardization of Electronic Records) – európskeho štandardu pre popis rukopisov na báze XML. TEI stanovila pravidlá transkripcie primárneho textového materiálu a tieto pravidlá otestovala. Boli bázou na vytvorenie DTD (document type definition) pre úplné texty (fulltexty) rukopisov v Manuscriptoriu.

kollarova1.jpg (97572 bytes)

V súčasnosti obsahuje Manuscriptorium približne 250 fulltextov elektronických dokumentov vytvorených na báze XML. Sú výsledkom práce kodikológov, historikov a filológov. Je to začiatok. Elektronické edície tohto typu by v budúcnosti mali umožniť úplne nový spôsob práce s historickým textom. Víziou je funkčná publikológia. Umožní ju bohato štruktúrovaná a zároveň flexibilná definícia typu dokumentu.

Vďaka nej vzniká text ako kombinácia štruktúrovaných, semištruktúrovaných a neštruktúrovaných dát. Zmyslom značkovania je na úrovni informačno-komunikačných technológií systémová interoperabilita, na úrovni producentsko-recipientskej umožnenie strojovej práce s textom, využívanie automatických a poloautomatických postupov. Pri markupe sa stretávajú schopnosti, skúsenosti, znalosti a fantázia, a to tak v prípade vytvárania, ako aj v prípade využívania. Pritom ideálnou požiadavkou je, aby producent jedného publikologicky reprezentovaného textu bol zároveň recipientom iného, a naopak, aby sa sprístupňovanie a využívanie do istej miery prelínalo.1 Takýto spôsob práce s textom v elektronicko-digitálnom informačnom a znalostnom prostredí presahuje tradičný profesionálny rámec knihovníctva či kodikológie. Vyžaduje a zároveň vytvára platformu pre interdisciplinárnu spoluprácu. Tvorcovia databázy implementujú ideu markupu do prostredia, v ktorom dosiaľ vznikali predovšetkým klasické – papierové – edície historických textov. Ústredná knižnica SAV ako partner konzorcia Manuscriptorium pripravila workshop s cieľom rozšíriť ideu XML medzi vedeckých pracovníkov, historikov, klasických filológov, archivárov a kodikológov, teda u tých, ktorí disponujú odborným potenciálom tvoriť elektronické edície.

Spoluorganizátorom workshopu bola Katedra klasických jazykov Filozofickej fakulty Trnavskej univerzity a hlavným lektorom PhDr. Zdeněk Uhlíř z Národnej knižnice ČR, jeden z hlavných propagátorov a tvorcov spomenutej databázy Manuscriptorium, v súčasnosti najväčšej európskej digitálnej knižnice pre historické dokumenty.

Workshop bol rozdelený na tri časti – informačnú, tréningovú a diskusnú. Cieľom prvej bolo zoznámiť účastníkov zo súčasným stavom, víziami a možnosťami otvoreného katalógu Manuscriptorium a zároveň poskytnúť  základné informácie o jazyku XML a štandardoch konzorcia TEI pre tvorbu fulltextu. Účastníci – historici, literárni historici, kodikológovia, odborníci špecializovaní na prácu s historickými knižničnými zbierkami zo Slovenska a Čiech – sa oboznámili so základnou štruktúrou a jednotlivými elementmi používanými pri tvorbe fulltextu historického dokumentu, s ich zmyslom a použitím.

Druhá časť workshopu mala tréningový charakter. Na posilnenie predbežnej akceptácie štandardu pripravili a rozoslali organizátori účastníkom príručku s výkladom štandardu, príkladmi a odkazmi na relevantné webové zdroje. Na podujatí si potom každý účastník s asistenciou lektorov vyskúšal značkovanie vlastného historického prameňa v XML editore.

Zrejme najdôležitejšia bola záverečná diskusia. Naznačila efekt podujatia a momentálne naladenie jeho účastníkov voči XML. Reakcie ukázali, že akceptujú značkovanie v XML ako možný budúci spôsob práce s historickým textom, prejavili potenciál naďalej ho testovať, učiť sa značkovať a tiež prispievať do tvorby virtuálneho bádateľského prostredia vlastnými produktmi. Ukázalo sa tiež, že by uvítali vytvorenie akejsi platformy pre tvorbu projektov. Podujatie bolo prvým krokom. Čas a ďalšia komunikácia v komunite ukáže, či vznikne reálny potenciál pre tvorbu edícií u jednotlivcov či tímov. Jednoznačne možno konštatovať, že workshop vygeneroval záujem o spoluprácu ako nevyhnutný predpoklad tvorby virtuálneho prostredia pre oblasť historických prameňov. Môže totiž vznikať len ako výsledok nadinštitucionálnej kooperácie IT špecialistov, odborníkov na prácu s historickými knižničnými a archívnymi zbierkami a odborníkmi na obsah týchto dokumentov.

kollarova2.jpg (189207 bytes)

kollarova3.jpg (199038 bytes)

 

1 Uhlíř, Zdeněk: Teorie a metodologie elektronicko-digitálního zpracování rukopisů a hybridní knihovna. Praha : Národní knihovna ČR, 2002, s. 181.

Zdieľať: