Manuscriptorium a nové trendy v digitálním zpřístupnění písemného a dokumentárního dědictví

1. Úvod

Manuscriptorium (http://www.manuscriptorium.com) vzniklo roku 2003 v návaznosti na evropský projekt MASTER (Manuscript Access through Standard for Electronic Records – http://xml.coverpages.org/master.html) nejprve jako tzv. otevřený katalog historických fondů shrnující katalogové záznamy o rukopisech a posléze také inkunábulích a starých tiscích jak Národní knihovny České republiky, tak dalších českých knihoven a nakonec i některých zahraničních, zejména středoevropských knihoven. Vzápětí však v souvislosti s digitalizačními aktivitami Národní knihovny České republiky, během nichž vznikl standard DOBM (http://digit.nkp.cz/knihcin/digit/WWW/doc/digitiz.htm) pro komplexní digitální dokument v podobě virtuální knihy, byla vytvořena extenze standardu pro popis rukopisů, tj. MASTER+ (http://digit.nkp.cz/MMSB/1.1/msnkaip.xsd), a tak se také dosavadní otevřený katalog historických fondů rozšířil, tj. změnil v digitální knihovnu rukopisů a dalších historických dokumentů. Během krátké doby pak následovaly první pokusy o integraci dat na dálku, tzn. z původní centralizované digitální knihovny se už v letech 2005-2006 začal vytvářet zdroj, který připouštěl distribuované uložení dat při zachování principu centralizace matadat. Už tehdy byl sice učiněn první krok k vybudování zdroje integrujícího distribuované komplexní digitální dokumenty, avšak bez zavedení rutinních postupů, takže budování Manuscriptoria jako distribuovaného zdroje bylo v té době spíše jen pomyslnou než skutečnou záležitostí. Přece však se ukázalo, kudy je třeba se nadále ubírat a kam napřít další úsilí.

Po náležité analýze celé otázky se tudíž Národní knihovna České republiky rozhodla, že je nutné navrhnout a zorganizovat rozsáhlý mezinárodní projekt, který vyřeší všechny problémy, jež se vyskytují při rutinizaci vytváření distribuovaného zdroje pro zpřístupnění písemného a dokumentárního dědictví. Tak vznikl evropský projekt ENRICH (European Networking Resources and Information concerning Cultural Heritage – http://enrich.manuscriptorium.com), jehož řešení probíhalo od 1. prosince 2007 do 30. listopadu 2009. Vzhledem k tomu, že shrnutí postupu prací, jakož i výsledků a výstupů projektu ENRICH vyjde v dohledné době v 21. ročníku časopisu Knihovna – knihovnická revue (ISSN 1801-3252 – http://knihovna.nkp.cz/), není nutné, abych se tomu znovu speciálně věnoval ještě na tomto místě. Stačí jenom shrnout hlavní ideu a základní koncepty a pak se věnovat otázkám spíše širšího zaměření, jež z řešení poskytnutého projektem ENRICH vyplývají a které vytváření poměrně dalekou perspektivu, k níž je třeba při digitálním zpracování a zpřístupnění písemného a dokumentárního dědictví soustředit zájem, postupně ji hlouběji analyzovat a posléze soustavně řešit.

2. Agregace

Podstatným rysem digitálního síťového prostředí je integrace uživatelského prostředí a agregace dat, takže je lze charakterizovat bonmotem, že to, co není integrováno, neexistuje. To je v naprostém protikladu k tomu, co bylo charakteristické pro dosud dominantní tradiční prostředí tištěné. Základním problémem už není jak informaci shromáždit, ale jak ji zpracovat a uspořádat tak, aby byla v první řadě reprezentována informace relevantní a aby naopak byl vyloučen informační balast. Na významu naopak ztrácí informace pouze pertinentní, poněvadž ta je do značné míry redundantní a ve větším počtu se právě tak stává informačním balastem. Integrace uživatelského prostředí a agregace dat je tak rozsáhlým úkolem, že nedovoluje používat tradiční postupy typické pro tištěné informační a komunikační prostředí a založené na práci s jednotlivým jevem, jejichž charakteristikou vlastností je důraz na homogenizaci datových a metadatových standardů. Pro digitální síťové prostředí typická práce s hromadným jevem homogenizaci datových a metadatových standardů nedovoluje, protože se pro ně stává jednak činností svým rozsahem organizačně nezvládnutelnou, jednak počínáním v zásadě nerozumným: představuje totiž příliš razantní sémantickou redukci, která vede k nezanedbatelné ztrátě informace, tedy k tomu, čeho se informační příprava, zpracování informace a informační podpora musí v každém případě vyvarovat. Integrace uživatelského prostředí a agregace dat tudíž znamená úsilí o vyjád-
ření mnohotvárnosti hromadného jevu pokud možno beze ztráty informace, ale také bez její multiplikace.

a. Heterogennost dat a metadat

Pro digitální síťové informační a komunikační prostředí je tudíž nutno počítat s heterogenností dat a metadat, která se zakládá jak na samé mnohotvárné povaze zachycených fenoménů, tak na rozmanitosti používaných datových a metadatových standardů. Aplikace různých standardů na týž zachycený fenomén, tzn. externí, reálný objekt se pak ukazuje jako naprosto rozumný přístup, protože datový model – vyjádřený právě v datovém či metadatovém standardu – je zřetelným vyslovením hlediska, z kterého se na daný fenomén nazírá, a účelu, resp. kontextuálního rámce, v jakém je příslušný fenomén zařazen. Jednoduše řečeno, každý datový a metadatový standard je vhodný k vyjádření konkrétní kategorie specifických dílčích rysů a obsahů, jež jsou v daném fenoménu explicitně nebo jen implicitně obsaženy. A jelikož kategorií je tolik, kolik je možných obecných otázek, tak také standardů je tolik, kolik je možných kategorií specifických dílčích rysů a obsahů. Obecné otázky, kategorie a standardy jsou tudíž v tomto pohledu nezaměnitelné, a tak je rovněž nepřípustné nivelizovat a homogenizovat standardy v domnění, že informaci se tak dostane přesnějšího a dokonalejšího zpracování.

uhlir1.jpg (469618 bytes)

Při jakékoli práci s písemným a dokumentárním dědictvím je třeba rozlišit na jedné straně vnější znaky či formální rysy a na druhé straně vnitřní znaky či obsahové rysy. Nelze je vzájemně zaměňovat, protože vypovídají o různých rovinách skutečnosti. Jakkoli přiznáváme, že vnější skutečnost je jen jedna jediná, v žádném případě to neznamená, že je jednostejná. V žádném případě tudíž nelze předpokládat, že se někdy podaří skutečnost sjednotit tím, že se jí vnutí takový řád, který ji vystihuje jenom částečně, a proto nedostatečně. Tímto způsobem se stane toliko to, že se jednotlivé pohledy na skutečnost a jednotlivé větve jejího zkoumání od sebe oddělí takřka neprostupnou hranicí. To je však nežádoucí. V tradičním tištěném informačním a komunikačním prostředí byly vnější znaky či formální rysy pokládány za podstatný rys objektů písemného a dokumentárního dědictví, protože na jejich základě se evaluoval dokument ve své podobě nosiče. Popis dokumentu se tedy většinou naprosto výlučně soustřeďoval na jejich detailní popis, zatímco popis nitřních znaků či obsahových rysů se omezoval na velice stručný popis blokový a důkladný analytický popis se neprováděl. Nebylo tomu však kvůli praktickému ohledu na jeho velkou časovou náročnost, nýbrž z teoretického důvodu jeho nedůležitosti. V síťovém digitálním prostředí však platí sentence not container but content. Tím se pohled převrací a podstatné důležitosti nabývají vnitřní znaky a jejich popis, zatímco vnější znaky a jejich zaznamenání se stává méně důležitým. Nadto v některých případech popis vnějších znaků vůbec není nutno provádět, protože uživatel je má v přímém názoru na digitální kopii. Při budování digitálních knihoven, které tendují k transformaci do virtuálního badatelského prostředí, jak je tomu v případě Manuscriptoria, se tudíž podstatným stává důraz na analytický popis. Tím ovšem dochází ke střetu paradigmat a řada pracovníků školených ještě v paradigmatu platném pro tištěné prostředí soustředění na analytický popis odmítá a v některých případech proti němu i aktivně vystupuje. Nástup nových trendů v digitalizaci je tak zároveň ostrým střetem se zastánci trendů starších.

Ale rozmanitost pohledů se nevyčerpává jen napětím mezi vnějšími a vnitřními znaky. Jsou zde také různé předměty, tj. obory a dílčí specializace, jakož i různá témata. Zde všude je nutno brát ohled na to, že na různých místech tohoto širokého spektra se zájem o některé otázky projevuje a o jiné naopak neprojevuje a že spolu s tím některý druh údajů je považován za informaci, ale jiný nikoli. Právě to je důvod existence řady různých datových modelů, standardů a formátů. Proti takové rozmanitosti nemá smysl bojovat, protože by to byl boj předem ztracený. Tato rozmanitost totiž není nepořádkem, ale výrazem bohatství, kterým oplývá skutečnost a jímž se vyznačuje lidské jednání. S touto rozmanitostí je třeba se vyrovnat, harmonizovat ji, nikoli homogenizovat. Toho lze dosáhnout snáze, než se obvykle na základě paradigmatu odvozeného z fungování tradičního tištěného prostředí myslí, jen se při to musí postupovat systematicky.

b. Konverze dat a metadat

K harmonizaci heterogenních datových a metadatových standardů je nutné jejich mapování. Jím se určí, které elementy a atributy příslušných standardů sobě odpovídají. Snazší je to v případě definic typu dokumentu nebo schémat vnitřně strukturujících značkovacích jazyků (prakticky XML, dříve také SGML), jakož i standardů, jež jsou jimi zapisovány (např. TEI), než v případě tradičnějších standardů, s nimiž pracují obvyklé knihovní informační systémy (např. MARC-ové formáty) a které jsou vlastně jen transpozicí obyčejných katalogových lístků dřívější doby. I tak se ovšem ukáže, že jsou v jednotlivých standardech elementy a atributy, které sobě v žádném případě neodpovídají. Na tom není vůbec nic divného, protože právě z toho důvodu jsou to různé standardy, aby popisovaly fenomény a objekty nejenom jinak, ale aby postihovaly na fenoménech a objektech jiné vlastnosti a rysy. Právě to je příčinou, proč je existence různých standardů nutná a proč proti ní nelze nic dělat: shrnout úplně všechny možné vlastnosti a rysy fenoménů a objektů v absolutní extenzi i intenzi představuje neřešitelný úkol. Přes tuto obtíž je porovnávání a mapování standardů řešitelným úkolem; jestliže se provede pečlivě, je výsledek zpravidla lepší, než byl první dojem. Ale je nutno si uvědomit, že beze ztráty informace se to neobejde – tím spíše je nutno dbát na opravdu pečlivé mapování.

Mapování standardů je třeba vždy provádět tak, aby jeden z nich byl cílový, do kterého se provede konverze ze všech ostatních, které jsou reálně k dispozici, tzn. takových, v nichž jsou dostupná relevantní data. Do cílového standardu se transformují či konvertují data (prakticky jde o popisná a strukturální metadata komplexních digitálních dokumentů) připravená původně v jiných standardech a centralizují se v místě agregace. Jejich centralizace je důležitá kvůli indexování, jež jednak urychluje vyhledávání, jednak umožňuje, aby vyhledávání bylo konzistentní. Bez konzistentnosti vyhledávání by jakákoli informační hloubka neměla žádný význam, protože vyhledávání by bylo neúčinné, a to zejména pokud jde o zacílení do vnitřní struktury dat a informace. Mapování a konverze standardů je nezbytnou složkou agregace dat, a to jak jednotlivých dokumentů, tak celých zdrojů – na rozdíl od marného úsilí o standardovou homogenizaci je technicky relativně snadno proveditelné a také po organizační stránce bez obtíží uskutečnitelné.

Enormně důležité na konverzi je to, že ji lze provádět online. Samozřejmě to předpokládá partnery, resp. zdroje na jistém stupni vyspělosti a pokročilosti, nicméně nyní už to není nic neobvyklého. Stačí jenom implementovat sofistikovanější komunikační protokol (zpravidla OAI-PMH, nikoli jen v knihovnách oblíbený a vlastně povinný Z39.50) a do něj příslušný profil. Praktickou výhodou je, že takovýto konektor vytváří agregátor a nikoli agregovaný partner či zdroj. Samozřejmě to pro agregátora znamená jisté finanční náklady a také pracovní a časové náklady nemusí být banální, s rozšiřováním sítě partnerů a zdrojů však se to stává méně náročným. I když lze partnerům, kteří s digitalizací teprve začínají, doporučit, aby užívali standardu, který je zároveň vnitřním standardem agregujícího systému, protože je to tak mnohem jednodušší, pracovně mnohem méně náročné a s velmi malými náklady na agregaci, agregace na základě konektorů je v širokém rozsahu jediným schůdným řešením, které je organizačně zvládnutelné, protože se zakládá na jasných a bez problémů proveditelných principech, přičemž nevnucuje svá pravidla okolí. Jsou samozřejmě možná i offline řešení konverze dat, ale ta jsou vhodná jen v případě malého objemu dat; v případě většího objemu dat je vždy lépe dát přednost konverzi online.

c. Distribuovaný zdroj

Připuštění heterogenity standardů jako základní princip nových digitalizačních trendů a zároveň s tím důraz na jejich efektivní konverzi za použití komunikačních protokolů umožňuje budovat distribuovaný zdroj. To má různé výhody, které vedou k dalšímu rozvoji síťového digitálního prostředí. Mezi ně patří zejména to, že v distribuovaném zdroji se centralizují a zpřístupňují pouze deskriptivní a strukturální metadata, zatímco data a případná technická metadata jsou uložena v původním zdroji. Distribuovaný přístup je tedy mnohem méně náročný na místo a zpracování, než by byl přístup důsledně centralizovaný, tzn. centralizující kromě metadat také data. Nadto je to výhodné i z hlediska bezpečnosti dat, protože agregovaně se zpřístupňují pouze data sekundární, odvozená, zatímco data primární, původní, archivní jsou uložena v původních zdrojích u jednotlivých partnerů Manuscriptoria. Primární data tudíž nejsou zvnějšku běžně přístupná, což je vzhledem k jejich vysoké hodnotě nesmírně důležité. A ke všemu má distribuované uložení pozitivní vliv i na technickou pokročilost partnerů, poněvadž je to jednak nutí implementovat široce využitelné sofistikované komunikační protokoly, jednak je to nezbytně vede k tomu, aby svým repozitářům, v nichž uchovávají a z nichž poskytují data pro zpřístupnění, dali jasný a jednotný řád. Celkové síťové digitální prostředí se tím standardizuje a harmonizuje, aniž musí mít homogenní povahu a podobu. To je zdrojem dalších možností jeho širšího využívání a cestou k tomu, aby se stalo dominantním.

Distribuovaná agregace však má význam i pro praktickou organizaci integrovaného zpřístupnění písemného a dokumentárního dědictví pro koncové uživatele. Poskytovatelé dat a knihovnicko-informačních služeb samozřejmě vždy tvrdí, že všechna jejich činnost je zaměřena uspokojení zájmů, potřeb a požadavků koncových uživatelů, nicméně nelze nevidět, že zájmy, potřeby a požadavky koncových uživatelů a poskytovatelů dat, tzn. jednotlivých partnerů agregovaného zdroje a integrovaného rozhraní v žádném případě nejsou stejné. Koncoví uživatelé se zajímají primárně o informace a potažmo o dokumenty, v nichž jsou informace uloženy, nikoli však (nebo přinejmenším až v některém z dalších plánů) o instituce, kde se příslušné dokumenty nacházejí. Zatímco tedy poskytovatelé dat-jednotliví partneři agregovaného zdroje a integrovaného rozhraní chtějí být pokud možno co nejvýrazněji reprezentováni, poněvadž na tom do jisté, ne-li značné míry závisí jejich financování, koncového uživatele právě to spíše zdržuje a obtěžuje. Distribuovaný zdroj však dovoluje tento rozpor řešit vhodným a pro obě strany přijatelným kompromisem. U každého agregovaného dokumentu při každé jeho stránce se umístí odkaz na primární uložení (domovská stránka příslušné instituce či příslušného zdroje), přičemž jedním kliknutím je možno přejít právě tam. Poskytovatel je tak dostatečně reprezentován a koncový uživatel zároveň není zatěžován dalšími údaji, o něž v danou chvíli nemá zájem. Problém se tak redukuje pouze na ultrakonzervativní poskytovatele dat, kteří si prostě nedovedou představit, že by se digitální podoba dokumentů vůbec mohla hledat někde jinde než v instituci, kde je tento dokument uložen ve své fyzické podobě. Naštěstí takových ultrakonzervativních poskytovatelů dat není příliš mnoho, takže úspěšná agregace dat a integrace zpřístupnění pak už závisí jen na uspořádání prvních vztahů mezi všemi partnery distribuovaně agregovaného zdroje v podobě licenčních a podlicenčních smluv.

3. Personalizace

Personalizace (a potažmo customizace) platí pro každé počínání založené na dělbě práce jako základní podmínka úspěšnosti a nejinak je tomu při poskytování knihovnicko-informačních, resp. znalostně-informačních služeb. Bylo by však omylem myslet si, že personalizace se primárně týká poskytovatelů dat, resp. agregátora dat a integrátora prostředí. Ačkoli samozřejmě všichni pracovníci jak všech poskytovatelů dat, tak agregátora dat a integrátora prostředí musí mít k dispozici všechny potřebné nástroje ke své práci, je třeba si uvědomit, že jejich práce je podřízena výhradně účelu uspokojení potřeb koncového uživatele. Personalizací se tudíž rozumí, že veškerá příprava dat i jejich zpracování, jakož i všechny nástroje pro práci s nimi, tj. pro vyhledávání a prohlížení, informační strukturování a případné kombinace na jeho základě musí uspokojovat koncového uživatele, přičemž je třeba si uvědomit, že informační pracovník a zejména knihovník má zájmy, potřeby a požadavky jiné, které v žádném případě nelze zaměňovat za zájmy, potřeby a požadavky koncového uživatele. Je třeba varovat před tím, aby knihovníci prosazovali své zájmy na úkor koncových uživatelů, jak se tomu v tradičním knihovnictví vázaném na kamenné knihovny zhusta děje a jak se to snaží přenést i do síťového digitálního prostředí.

a. Interní a externí nástroje

V Manuscriptoriu jako v každé jiné digitální knihovně je nutno rozlišovat mezi interními a externími nástroji či moduly. Interní nástroje jsou neoddělitelnou součástí informačního systému digitální knihovny, protože vůbec umožňují její náležité fungování po technické stránce nebo její odpovídající vlastnosti v uživatelském pohledu. Z koncovouživatelského hlediska je to zejména vyhledávací stroj a jeho jednotlivé moduly, jakož i viewer. V případě vieweru je důležité, aby byl zcela interoperabilní s webovým prohlížečem (browserem), tzn. aby si koncový uživatel nemusel stahovat a instalovat žádný plugin, což by ho zbytečně zatěžovalo. Pokud jde o vyhledávací systém, samozřejmostí jsou možnosti jak vyhledávání v jediné položce dotazu, tak kombinované vyhledávání za použití operátorů, a rovněž tak pokročilé vyhledávání s různými filtry apod. Je sice pravda, že naprostá většina koncových uživatelů digitálních knihoven i jiných informačních systémů neovládá žádný sebeméně sofistikovaný způsob vyhledávání, avšak jsou také, byť nemnozí, vyspělí uživatelé, kteří tyto možnosti ocení. Jde jen o to, aby jimi méně vyspělý uživatel nebyl zbytečně znepokojován. Takový uživatel naopak ocení zvláštní sadu položek dotazu, které imitují dotazy formulované v přirozeném jazyce bez explicitního použití operátorů a filtrů. A všichni uživatelé zajisté ocení vyhledávání za použití grafických variant. Historické texty totiž postrádají normativní gramatiku a standardizovanou grafiku, takže jedno slovo se může vyskytovat zapsáno různým způsobem (a přece je to proti dnešnímu očekávání správně). Modul využívající grafické varianty dokáže vyhledat totéž slovo i tehdy, jestliže je zapsáno jinak, než jak je zapsáno v položce dotazu. Je zřejmé, že modul grafických variant musí sestávat z dílčích modulů pro jednotlivé jazyky, poněvadž slova i jejich zápisy nejsou sama o sobě, ale vždy jen součástí nějakého jazyka. V Manuscriptoriu je nyní implementována čeština, latina, němčina, angličtina a francouzština, případně však mohou být implementovány i další jazyky.

Vedle interních nástrojů mohou být (a v nepříliš vzdálené budoucnosti také zaručeně budou) do práce s Manuscriptoriem zapojeny i nástroje externí. Zejména se to týká nástroje pro práci s plnými texty, především pro jejich srovnávání, jakož i nástroje pro porovnávání obrazů a vyhledávání stejných či podobných. Srovnávač plných textů funguje už nyní jako offline prototyp a v nynější době se pracuje na jeho zprovoznění jakožto webové služby s perspektivou dokončení zhruba do dvou let. Pro srovnávač plných textů platí totéž co pro běžné vyhledávání v Manuscriptoriu, totiž že žádný historický text nemá normativní gramatiku a standardizovanou grafiku. Aby tudíž srovnávání založené na vektorové statistice vůbec bylo efektivní a relevantní, musí do něj právě tak jako do běžného vyhledávání být implementován modul grafických variant. Předpokládaným výstupem srovnávače plných textů jakožto webové služby je jak prosté statistické vyhodnocení pořadí příbuznosti textů, tak grafické znázornění jejich vztahů a souvislostí. Vývoj nástroje pro srovnávání obrazů je teprve před svým zahájením; předpokládaným výsledkem bude nástroj vyhledávající v databázi Manuscriptoria i v síťovém digitálním prostředí vůbec ikonograficky nebo kompozičně stejné či podobné obrazy. Oba tyto nástroje nepochybně slouží rozvoji jak humanitních, tak technických disciplín.

b. Heuristika

Manuscriptorium sice už dříve dosáhlo kritického množství dat v českém národním rámci, ale v průběhu řešení projektu ENRICH dosáhlo kritického množství dat i v mezinárodním a nadnárodním rámci evropském. Digitální knihovna Manuscriptorium tedy není pouhou ilustrací vývoje písemného a dokumentárního dědictví nebo pouhou pedagogickou či didaktickou pomůckou, nýbrž stala se heuristickým prostředím, v němž je možno získávat metainformace a nové znalosti. Manuscriptorium tak učinilo první krok k tomu, co je jeho konečným cílem, kterým není prostá digitální knihovna, ale skutečné virtuální badatelské prostředí pro práci s historickými fondy, resp. s písemným a dokumentárním dědictvím. Je tudíž nezbytné, aby kromě byť sofistikovaných, přece jen spíše obvyklých nástrojů poskytovalo i nástroje výrazně heuristické povahy, které koncovému uživateli dovolí pracovat nejenom s daty a informacemi, ale také metainformacemi a znalostmi. To je oproti dosavadní teorii a metodologii humanitních věd paradigmatická změna, která zaručeně bude mít dalekosáhlé následky, jichž si dnes ještě nejsme plně vědomi.

uhlir2.jpg (454425 bytes)

Personalizované prostředí Manuscriptoria kromě obvyklého využívání samotné digitální knihovny dovoluje nastavit si osobní účet a v jeho rámci vytvářet statické a dynamické virtuální kolekce. Možnost metodické práce s virtuálními kolekcemi je právě projevem paradigmatické změny, kterou využití informačních a komunikačních technologií pro práci s písemným a dokumentárním dědictvím přináší. Statická virtuální kolekce spočívá v ručním výběru jednotlivých dokumentů z Manuscriptoria, resp. i z jiných zdrojů a v jejím umístění do vlastního personalizovaného prostoru, přičemž může být následně využívána pouze svým tvůrcem, anebo může být sdílena, a to buď přesně vymezeným dalšímu uživateli, anebo zcela všeobecně. Statická virtuální kolekce tedy má tedy charakter dovolující jak uzavřenost, tak otevřenost, a to podle arbitrárního rozhodnutí jejího tvůrce. Má také charakter dovolující jak dokončenost, tak nedokončenost, a to právě tak podle arbitrárního rozhodnutí jejího tvůrce. Je však zřejmé, že směřuje spíše k dokončenosti, protože její další, čím dál tím organizačně náročnější doplňování bude ve stále větším rozporu se snižující se informační hodnotou přírůstků či doplňků. Dynamická virtuální kolekce naproti tomu spočívá v uložení dotazu a vždy novém vyhledávání dokumentů, které podle příslušného dotazu do ní patří, při každém jejím dalším vyvolání či otevření. Právě tak jako pro statickou virtuální kolekci pro ni platí, že může být následně využívána pouze svým tvůrcem, anebo může být sdílena, a to buď přesně vymezeným dalšímu uživateli, anebo zcela všeobecně. Dynamická virtuální kolekce má tudíž charakter uzavřenosti či otevřenosti podle vůle jejího tvůrce, čímž se shoduje se statickou virtuální kolekcí, jednoznačně má však charakter nedokončenosti, čímž se od statické virtuální kolekce odlišuje. A tak vidíme, že i virtuální kolekce jsou součástí paradigmatických změn, ke kterým dnes při zpracování a využívání písemného a dokumentárního dědictví dochází. Kromě efektivnějšího zpracování a využití vnitřních znaků či obsahových rysů a kromě snadného zkoumání hromadného jevu, který prostředek virtuálních kolekcí umožňuje, je tu ještě další charakteristický rys stávající paradigmatické změny, a to tendence k otevřenosti a nedokončenosti, v tomto případě zdroje. To má závažné důsledky pro konceptualizaci jak heuristických korpusů a tezaurů, tak pro konstruování faktů a modelů. A nadto vidíme, že práce s virtuálními kolekcemi přináší novou kvalitu do oblasti vědecké komunikace a elektronického publikování, ačkoli v tomto případě bude ještě nutno leccos dalšího udělat.

c. Zpracování

Vlastní zpracování dílčích výsledků poskytnutých výstupy jak externích nástrojů pro srovnávání plných textů a obrazů, tak heuristických nástrojů pro vytváření virtuálních kolekcí a virtuálních dokumentů je pro všechny humanitní disciplíny obrovskou výzvou i velikou nadějí. Sice už se o tom ztratilo mnoho – leckdy zbytečných a směšných – slov, nicméně nelze než opakovat, že stojíme na rozhraní epoch a že novou platformou Manuscriptoria jsme překročili Rubikon a dostáváme se do oblasti, odkud není návratu. Obvykle se mluví o digitální historii a digitální filologii, aniž je přesně patrné, o co jde nebo o co má jít. Přesvědčivěji už vypadá koncept kvantitativní kodikologie, která se věnuje rukopisům jako hromadnému jevu, skupinám a sériím rukopisů podle jejich struktury a funkce. Už ty nástroje, které jsou nyní součástí Manuscriptoria, umožňují to, co tradičními pomocněvědnými metodami buď vůbec není možné, nebo to lze jen velice obtížně. Shromáždění obrovského množství různorodého materiálu pocházejícího z různých kultur a civilizací přináší výzvu multilingvalismu nikoli v tradičním smyslu lokalizace systému Manuscriptoria a jazykových mutací doprovodných a vysvětlujících textů, nýbrž ve smyslu automatického překladu a následně multilingválního vyhledávání jak v metadatech-katalogových záznamech, tak v datech-plných textech a v důsledku toho komplexního studia civilizací a kultur, srovnávacího studia civilizací a kultur, inter- a transkulturních, jakož i inter- a transcivilizačních studií. Možnosti zpracování jsou tedy takřka bezbřehé, jen se nesmíme bát jejich nesmírnosti.

4. Elektronické publikování

Manuscriptorium jakožto virtuální badatelské prostředí nemůže nevyústit ve zpřístupnění výsledků práce s písemným a dokumentárním dědictvím v co nejširším smyslu, tzn. v elektronické publikování. Elektronické publikování se nesmíme představovat pouze jako desktop publishing nebo ztvárňování webových stránek, nýbrž především jako činnost mnohem těsněji vázanou na získávání a zpracování informace. Je jenom přirozené, že bude součástí takové digitální knihovny, která kromě obvyklého prohlížení digitálních objektů poskytuje nástroje pro heuristickou práci s nimi i nástroje pro jejich automatické zpracování a nadto je poskytuje v personalizovaném prostředí uživatelských účtů. O tom, že v síťovém digitálním prostředí do značné míry splývají role autora, distributora a recipienta, se dlouho jenom mluvilo, Manuscriptorium to však nyní ukazuje jako reálnou možnost. Dřívější a ještě nedávná role kamenných nakladatelství a kamenných knihoven se tím velmi dramaticky mění. Vzniká tím velký tlak na změnu tradiční knihovnicko-informační profese poskytující převážně subalterní servis jinak profilovanou profesi znalostně-informační. Síťový knihovník (cybrarian) bude přibližovat uživateli-tvůrci a na druhé straně uživatel-tvůrce se bude přibližovat síťovému knihovníku. Tato wikizace nebude sice všeobecná, jak si představovali a dosud ještě představují někteří snílkové, nicméně bude pravděpodobně docela fundamentální. I tady stojíme na rozhraní epoch.

a. Příprava

Každému publikování nejprve musí předcházet práce, v tomto případě badatelská práce. Ta není na první pohled ničím efektním, nýbrž představuje sice vysoce kvalifikovanou, nicméně přece jenom rutinu. Zejména se to týká jejích průběžných stupňů. Na počátku sice musí být nápad, idea a její konceptuální rozvržení, což je práce nepochybně tvůrčí, ale obtížně postižitelná, protože se v zásadě nedá formalizovat a následně sdělit a naučit. Ale jakékoli plánování a veškerá příprava má v zásadě standardizovaný a rutinní charakter. Spočívá samozřejmě v použití některých ověřených tradičních metod a postupů humanitních disciplín, které se rozvíjely už od dob starověku a středověku. V tomto případě však jsou zajímavé a hlavně důležité především metody a postupy zakládající se na využití informačně-komunikačních technologií, jež jsou nové a většinou ještě neustálené, protože veškerá teorie a metodologie související s nynějšími paradigmatickými změnami je ve stadiu zrodu a utváření. V zásadě však předpokládá využití více méně všech nástrojů, o kterých až dosud byla řeč, tzn. jak těch pro vytváření statických či dynamických virtuálních kolekcí a virtuálních dokumentů, tak oněch pro srovnávání plných textů (a v nedaleké budoucnosti i obrazů), jakož i dalších s Manuscriptoriem nikterak nespojených, např. lemmatizátorů apod. Na tom není nic pozoruhodného, protože ve vědě a výzkumu jako ostatně všude jinde vždy jde o využití všech dostupných prostředků. Nové a zvláštní je však v tomto případě to, že se tak děje v prostředí, které není, či alespoň nemusí být striktně odděleno od prostředí skupinového a dokonce veřejného. V tom se právě mnohem více než dříve sbližuje role tvůrce a uživatele a naopak.

b. Sdílení

Zvláštností není to, že přípravná práce může být týmová a kooperativní, protože to nebylo nic neobvyklého ani dříve, ale to, že ji lze provádět v prostředí, které je zároveň prostředím digitální knihovny, tzn. prostředím zdrojových dokumentů, v tomto případě historických pramenů, jakož i prostředím, v němž budou výsledky práce také publikovány. Právě tak, jak se stírá rozdíl mezi tvůrci a uživateli, stírá se i rozdíl mezi jednotlivými spolupracovníky a členy týmu.
A děje se tak prostým sdílením personálních uživatelských účtů, resp. přesněji jejich dílčích částí. Nutno však říci, že technika a technologie jsou v tomto případě před metodologií a metodikou práce humanitních disciplín a hlavně před obyčejnou lidskou představivostí. Ta je v procesu tvorby paradoxně výrazně ovlivněna extrémně individualisticky chápanými autorskými právy, ačkoli v oblasti recepce a využívání dominuje spíše opačný přístup, tedy extrémně kolektivistický odpor proti týmž autorským právům. Nevyplývá to však z libertariánského prosazování individuálních práv a odmítání intelektuálních práv jakožto merkantilistického intervencionismu, nýbrž právě naopak z úsilí o vytvoření komunitární občiny, kde by někteří požívali výnosů, ale všichni by nesli náklady; v některých kruzích se typicky hovoří o manuscript commons. Je to tedy typická „tragédie obecní občiny“ nebo obvyklý „problém černého pasažéra“ znovu se rozmáhající v nynějších společnostech sociálního státu blahobytu. Skutečné sdílení bude možné teprve tehdy, až budou tyto afekty a resentimenty překonány. Dění posledních let nasvědčuje tomu, že by to mohlo nastat, třebaže odpor proti tomu je silný.

c. Zveřejnění

Zveřejnění výsledků práce s obsahem Manscriptoria nemusí nutně následovat jako další stupeň navazující na kooperativní či týmové sdílení, může samozřejmě vycházet hned z prvního stupně individuální přípravy. Zdá se dokonce, že v tom okruhu, jaký reálně existuje v humanitních disciplínách, je tato možnost pravděpodobnější. Rozhodně se totiž ukazuje, že kooperativní týmové sdílení se nyní provozuje spíše pro ně samo a pro uspokojení požadavků financovatelů projektů, než aby bylo zaměřeno na skutečné dosažení upotřebitelných výsledků. Technické překážky však už v přítomné době pro zveřejnění ať už individuálních nebo týmových výsledků nejsou. V zásadě to znamená jen trojí: za prvé napsat základní text příslušného sekundárního dokumentu, tzn. dokumentu vycházejícího z primárních, originálních historických dokumentů, nebo se na nich jakýmkoli způsobem zakládajícího, za druhé připojit odkazy na odpovídající statické virtuální kolekce či virtuální dokumenty, resp. na jeden z přechodných stavů virtuálních dynamických kolekcí (který musí být pro tento účel uložen na zvláštním místě) a konečně za třetí připojit odkazy na příslušné výsledky srovnání obrazů (které jakožto přechodné dokumenty opět musí být za tímto účelem na zvláštním místě uloženy). Vyhovění těmto třem bodům stačí k tomu, aby digitální knihovna Manuscriptorium byla doplněna o publikační modul skutečně a nikoli jenom v možnosti. Samozřejmě musíme předpokládat, že výstupy elektronického mohou být a jistě i budou strukturálně složitější, nicméně dokud nemáme žádnou reálnou zkušenost ani s touto nejjednodušší podobou, naše představivost v tomto ohledu selhává. Vidíme však, že virtuální badatelské prostředí, kterým Manuscriptorium chce být, není žádnou futurologickou chimérou, nýbrž zcela snadno uskutečnitelnou věcí.

5. Závěr

Už dříve bylo jasné, že digitalizace není jen dělání obrázků. Nyní se ukázalo, že digitalizace ani není jenom připojování hluboce strukturovaných a informačně bohatých metadat či připojování skrze hyperlinky dalších souvisejících digitálních objektů. Poslední trendy, které se vynořily v souvislosti a agregací dat a integrací prostředí, ke kterým přistoupil tým Manuscriptoria před více než dvěma lety, dokazují, že konečným cílem digitalizace je přidaná hodnota v podobě metainformace, transinformace a znalosti. Vyjádření o nastávající změně paradigmatu tedy nejsou planými proklamacemi, ale stávají se realitou.

Manuscriptorium a nové trendy v digitálním zpřístupnění písemného a dokumentárního dědictví

Zdieľať:

Číslo: 2/2010

Obsah čísla