Jednání sekce SDRUK pro IT zaměřené na oblast digitalizace a portálů

Zo zahraničia

Ve dnech 13. – 14. 2. 2007 se v Olomouci konalo další, v pořadí již třetí jednání sekce Sdružení knihoven pro informační technologie. Jednání se zúčastnilo přes 45 účastníků především z řad knihoven, ale i vysokých škol a nově muzeí, kteří se zajímali o problematiku služeb knihoven v elektronickém prostředí. Pro případné zájemce o tuto problematiku doplňuji, že sekce je deklarována jako otevřená (tzn. práce v ní a jejich setkání se může zúčastnit každý zájemce, kterého daná problematika zajímá; přihlásit se do elektronické konference sekce je možné na adrese rekakt@mlp.cz). První den setkání byl věnován problematice digitalizace, druhý pak knihovním portálům. Postupně byly představeny následující prezentace:

Digital Library Initiative – Mgr. Adolf Knoll (NK ČR)

Jde o společnou iniciativu Evropské unie založenou na strategii i-2010. Původní záměr byl rozšířen z kulturního dědictví i na dědictví vědecké (s důrazem na otevřený přístup k informacím). Na počátku vzniklo nedorozumění – členské státy očekávaly prostředky na digitalizaci z EU, ale rozhodnutí Evropské komise bylo od počátku stejné, tj. financuje pouze “evropskou přidanou hodnotu” a výsledek spojení národních iniciativ. Naopak na národní úrovni si musí jednotlivé země samy zajistit digitalizaci, zpřístupnění a archivaci. Očekávání spojená s iniciativou jsou dvě – vyrovnat se s tempem digitalizace asijských zemí a s aktivitami Googlu.

Je ale zatím nejasné, jakou podobu a roli má Evropská digitální knihovna mít. Proto byla v únoru 2006 vytvořena pracovní skupina expertů, která se podílela na zpracování doporučení Komise s cílem jasněji formulovat dělbu práce na evropské a národní úrovni. (http://ec.europa.eu/information_society/activities/digital_libraries/doc/recommendation/comm_recomm/cs.pdf)

Další rozvolněná doporučení formou indikativní tabulky akcí byla přijata i na úrovni ministrů školství členských států, obvykle se v ní ale vytrácí důraz na budování center pro masovou digitalizaci. V 7. rámcovém programu se připravuje podpora konkrétních institucí a jejich digitalizačních center (“network of excellence”). Základem Evropské digitální knihovny je nyní TEL (http://theeuropeanlibrary.org/), základním komunikačním standardem je protokol OAI-PMH.

Přednáška byla doplněna analýzou aktivit výzkumu a vývoje evropských národních knihoven souvisejících s digitalizací, která byla provedena po jejich postupném zapojování do TEL-ME-MOR a jeho pokračování EDL (v rámci programu eContent+). Ukázalo se, že původní hypotéza (staré členské země jsou na tom dobře, nové členské země se podaří začlenit a ostatní ne) neplatí. Mezi zkoumaná kritéria patřil objem prostředků na vědu a výzkum, účast v mezinárodních projektech, různorodost pokročilých systémů, kvalita připojení k Internetu, speciální technologie digitálních knihoven (více pozornosti metadatům než obrazům), ochrana digitálních dat, množství digitálních dat ve srovnání s asijskými zeměmi (např. Korejská národní knihovna má více než 39 národních knihoven dohromady, a to z nich Francouzi a Španělé vytvořili více než 75%), analýza množství digitálních dat podle stáří/druhu dokumentu, aplikace metod zpřístupnění, spolupráce s uživateli, podíl knihoven, muzeí a archivů uváděný ve strategických dokumentech.

Z následné debaty vzešel podnět na jednání mezi knihovnami a ochrannými svazy s cílem následování rakouské praxe, která po obdobné dohodě je možné zveřejňování kopií novin do r. 1935 (70 let ne od smrti, ale od uveřejnění díla). Aktuální zkušenost z AV s digitalizovanými dokumenty a zveřejňováním vědeckých prací je na základě jednání jednoho z ústavů AV a Springeru taková, že pokud autorská práva nejsou při zveřejnění díla v elektronické podobě ošetřena, Springer tuto situaci řeší vyhlášením (má-li autor námitky, nechť se ozve). Je to možná cesta, byť podle některých názorů jde o protiprávní postup.

Manuscriptorium v roce 2007 – Mgr. Adolf Knoll (NK ČR)

V druhé přednášce představil Mgr. A. Knoll další plány rozvoje Manuscriptoria. Důraz je kladen na rozšíření mezinárodní spolupráce, jeho rozvoj bude spojen s projektem ENRICH, který byl přijat v druhé výzvě programu eContent+. Jde o dvouletý projekt plánovaný na jaro 2007-2008. Jednotlivé etapy projektu tvoří analýza dostupnosti digitalizovaných rukopisů, technické podmínky pro vzájemnou komunikaci a integraci, konverze MASTERu z formátu TEI P4 na TEI P5, implementace OAI-PMH harvesteru, implementace kontejneru METS coby interního formátu, zvýšení podpory UNICODE, přívětivost vůči uživateli, zpracování sbírek, umožnění přispívání on-line (personalizace), testování, validace a propagace.

Následná diskuse se zabývala mj. zpracováním a zpřístupňování mapových sbírek a listin. Zazněla informace, že došlo ke koordinaci projektu www.staremapy.cz s kartografickou konferencí na Historickém ústavu AV.

Mgr. Adolf Knoll doplnil, že Manuscriptorium nemá v této oblasti dostatek vlastních sil pro výraznější angažmá. Obecně lze říci, že chybí kompetenční centrum pro digitalizaci, které by mohlo sloužit jako poradenský orgán pro ty typy dokumentů a objektů, které nejsou běžné.

IS MU z pohledu studijní administrativy dotýkající se knihoven – Ing. Jitka Brandejsová (Masarykova univerzita v Brně)

V prezentaci šlo o představení informačního systém MU s důrazem na agendy vyvinuté pro knihovny MU. Jde především o oblasti publikace z informačního systému do katalogu knihovny, závazky čtenářů vůči knihovně a archiv závěrečných prací. Základní parametry pro archiv závěrečných prací jsou určeny takto: bez omezení velikosti souborů, sledování životního cyklu práce (zadání, práce, posudky, obhajoba); distribuované úložení dat, zveřejnění všech prací, automatická konverze do textového formátu a do formátu pdf a doplnění funkce pro vyhledávání plagiátů. S užíváním informačního systému panuje spokojenost, veřejný archiv má řadu výhod (růst kvality prací, zveřejnění výsledků vědy atp.). V roce 2007 bude vývoj zaměřen na uživatelskou studii rozhraní a chování uživatelů a doplněn novým projektem – digitalizací vybraných starších závěrečných prací (cca 200 tis. stran, o obsahu budou rozhodovat fakulty). Obecně je možné začlenění diplomových prací do oborových bran – do budoucna se s ohledem na registr VŠ kvalifikačních prací plánuje doplnění OAI-PMH, se kterým umí pracovat např. JIB.

Nové možnosti systému Kramerius – René Michálek (Qbizm)

Vystoupení se zabývalo implementací metadatového kontejneru METS do prostředí digitální knihovny Kramerius (jehož vývoj financovaly NK ČR a Knihovna AV ČR a za udržování jeho hlavní verze nyní odpovídá fa Qbizm). Na začátku proběhla stručná charakteristika současné verze systému –vlastní software je poskytován pod licencí GPL, obsahuje podporu pro dva typy dokumentů – monografie a periodika, dále replikaci titulů mezi jednotlivými instalacemi Krameria, export části titulů do formátu pdf/html (pouze pro periodika), podporu protokolu OAI-PMH pro publikování metadat do jiných systémů (např. TEL). Nově byla zabudována podpora formátu METS a jeho zapouzdření do protokolu OAI-PMH. Formát METS zapouzdřením umožňuje výrazně rozšířit spolupráci s externími systémy. Kramerius implementuje všechny sekce kromě <behaviourSec>. V dmdSec podporuje Dublin Core a MARCXML, v admSec podporuje PREMIS, MIX a METS-rights. Protože DTD pro monografie/periodika neobsahují administrativní metadata, tato se importují samostatně. Obecně je okruh použitelných DTD vymezen jednak tím, zda jsou vůbec definovány (NK v roce 2003 definovala kromě periodik a knih ještě muzejní objekty a zvukové dokumenty), jednak musí být podporovány a implementovány v Krameriovi (nyní to platí pouze pro monografie a periodika). Přehled již digitalizovaných novin a časopisů je uloženen v Českém registru reformátovaných dokumentů (viz http://www.nkp.cz/pages/page.php3?page=weba_seznam.htm).

Podrobné představení METSu bylo předmětem následující přednášky.

Formát METS a metadata – Mgr. Jan Hutař (NK)

Ve světě je v rámci formátu METS běžná podpora pro tato schémata popisných metadat: MARCXML, MODS (lze automaticky generovat z MARCXML, převodníky nabízí Kongresová knihovna – viz http://www.loc.gov/standards/mods/v3/MARC21slim2MODS.xsl) a Dublin Core. Pro administrativní metadata se používá techMD (MIX, PREMIS objects) – jejich extrakce typicky probíhá automatizovaně (např. pomocí JHOVE; dále rightsMD (METS rights, PREMIS rights); sourceMD a digiprovMD (PREMIS events). Lze používat volitelně další dostupná schémata ve všech sekcích (např. EAD). V NK se nyní rozhoduje o výběru polí, které se budou v jednotlivých sekcích vyplňovat. Výběr perzistentních identifikátorů v Krameriovi by měl proběhnout během letošního roku (jde o hledání schématu, bude se pravděpodobně používat více typů).

Digitální knihovna šedé literatury – Mgr. Petr Novák (STK)

Petr Novák se na začátku svého příspěvku věnoval vymezení pojmu “šedé literatury”, do kterého zahrnul např. zdrojové kódy programů, schémata aj. Svým pojetím patří šedá literatura do Koncepce trvalého uchování knihovních sbírek. Hlavní část příspěvku byla věnována projektu Národního úložiště šedé literatury budované v STK. To bude přijímat dokumenty z následujících zdrojů:

  • národní registr VŠKP
  • VŠ repozitáře
  • AV ČR (ASEP)
  • rezidua SIGLE v STK
  • soukromé/podnikové VÚ

Preferovaným komunikačním protokolem bude OAI-PMH nebo vlastní XML rozhraní, popisná metadata bude tvořit Dublin Core, otázkou zůstává výběr formátů dokumentů (pdf, xml, Tex, …). Přidanou službou by bylo dodání plného textu (nejlépe on-line). Pro zapouzdření objektů bude rovněž použit METS kontejner. Značný důraz chce klást STK na možnosti a kontrolu zpřístupnění nejen uživatelům-lidem, ale i uživatelům-agentům. V letošním roce by měl proběhnout kvalifikovaný výběr systému.

Jako bod k podrobné analýze se ukazuje samotná volba formátu PDF. Má řadu verzí a rozšíření samotnou firmou Adobe. Obsahem pdf nemusí být jen text, ale i jiné objekty (audio, video, obrázek, JavaScript aj.). Ve formátu pdf lze zajistit bezpečnost obsahu pdf dokumentu různými způsoby, který z nich zvolit? (plug-in, heslo, …)

Zpřístupňování eVŠKP – PhDr. Iva Horová (AMU)

Další prezentace se věnovala problematice zpřístupňování vysokoškolských kvalifikačních prací. Zde se lze ztotožnit s příkladem IS MU, který slouží jako vlajková loď, jak by měly být VŠKP zpřístupňovány. Vysoké školy se staví ke zveřejňování různorodě, některé pozitivně, některé negativně (jedná se o citlivý výzkum, obchodní tajemství, postoj archivářů). Pro usnadnění budování repozitářů VŠKP vydala Asociace knihoven vysokých škol ČR několik doporučení, z nichž nejdůležitější je standard popisných metadat.

O zpřístupňování byl proveden průzkum v prosinci 2006 formou dotazníkové akce, respondenty byly knihovny (26 odpovědí – 19 univerzit). Z něj vyplynulo, že zajištění a koordinace této agendy probíhá většinou na úrovni univerzity obvykle je pověřena univerzitní knihovna. Většina vysokých škol byla pro nebo už byla na změnu připravena, nejčastěji se objevily změny se vztahem k technickým parametrům, formální úpravě, archivaci elektronické verze, způsobu trvalého zpřístupňování. U popisných metadat převaha škol používá doporučený standard a zpřístupňuje bibliografické záznamy (většinou formou katalogu knihovny a/nebo zvláštní databází).

Povinnost elektronické verze – 15 škol z 19 sbírá elektronickou podobu textových prací, toto není ale vždy stanoveno jako povinnost; u netextových prací je sběr elektronické podoby nižší. Plné texty se většinou zpřístupňují na Intranetu, na Internetu již méně. Použitá software je nyní 3x na míru, 1x komerční, 1x open source; plánované systémy budou většinou integrované jakou součást IS na míru. Probíhá příprava národního registru (společný projekt 10 škol, koordinátorem VŠE). Projekt ovšem nebyl přijat, a tak nyní školy hledají další možnosti financí.

Zpřístupňování výzkumných zpráv a dalších výstupů AV v digitální podobě – Jana Doleželová (KNAV)

Pohled na problematiku z hlediska zpracovatele dat, centrálního správce dat a vědce. Od roku 1994 se datuje vznik databáze ASEP (bibliografické záznamy publikací ústavů AV ČR). Vybraná data se pravidelně exportují do RIV (každým rokem úpravy podle požadavků Úřadu vlády – některé ústavy se tomu přizpůsobují velmi pružně). Současné zpracování probíhá v systému ARL (EPCA) – katalog je k dispozici na stránkách KNAV ČR. Má možnost připojení plného textu a jeho filtrování. Plný text může být umístěn lokálně, vzdáleně nebo k volně dostupným zdrojům v Internetu. V případě plných textů ze zahraničních impaktovaných titulů se zpřístupňují pouze na půdě dotyčného ústavu. KNAV ČR má velký zájem na propojování bibliografických záznamů a digitálního obsahu, záleží ale na spolupráci a aktivitě ústavů.

Následoval v bloku přehled aktivit v oblasti digitalizace v krajských knihovnách doplněný informací o záměrech v oblasti vývoje digitální knihovny Kramerius na rok 2007.

Základní informace o grantu HISPRA – Záchrana pragensijních a dalších historických dokumentů z fondu MKP – PhDr. Zuzana Kopencová (MKP)

Na začátku bylo odhodlání digitalizovat, podařilo se realizovat z finančních mechanismů EHP/Norska. Schvalovací proces trval více než rok a půl. V listopadu 2006 byl poskytnout grant cca 400 tis. EUR na vybudování digitalizačního pracoviště. Cílem pořídit digitální kopie vzácných pragensií a zpřístupnit je. Projekt je čtyřletý, jednotlivé etapy jsou následující: v roce 2007 vznikne digitalizační pracoviště; v letech 2008-10 je plánován jeho ostrý provoz. Následně je cílem vytvořit digitální knihovnu a zpřístupnit čtenářům/uživatelům a v posledním roce pak propagace projektu vůči veřejnosti.

Aktuální stav digitalizace v MSVK Ostrava – Aleš Drahotušský

V roce 2005 proběhlo vybavení pracoviště firmou Elsyst Engineering (planetární skener Atlas, SW Atlantis a Sirius). Digitalizace obsahu vychází z fondu MSVK, dále z fondu Archivu města Ostravy a plánuje se spolupráce se Slezským muzeem. Archivace na DVD nosičích, zpřístupnění pomocí digitální knihovny Kramerius (cca 13000 stran – 2 tituly periodik, 18 titulů monografií) ve formátu DJVu. Cílem vybudovat digitální knihovnu Moravskoslezského kraje, do které budou vybírány dokumenty ve vazbě na Retrospektivní regionální bibliografii.

Kramerius – aktuální možnosti a předpokládaný vývoj v roce 2007 – Ing. Martin Lhoták (KNAV ČR)

Kromě NK a KNAV je tato digitální knihovna instalována v KKV Havlíčkův Brod, SVK Hradec Králové, MSVK Ostrava, KFB Zlín a muzejních knihovnách (UPM Praha, Židovské muzeum, Muzeum východních Čech). Je v integrována podpora grafických formátů DJVu, JPEG, PNG, PDF a připravuje se podpora dvouvrstvého PDF. Vyhledávání plného textu probíhá prostřednictvím komerčního Convera RetrievalWare (od r. 2007 implementace Lucene). V roce 2006 byla doplněna možnost generování vícestránkových pdf.

Plánovaný vývoj v roce 2007 zahrnuje:

  • perzistentní identifikátory
  • rozšíření metadat o technická a administrativní (prostřednictvím METS)
  • zaměření se na popis jednotlivých článků
  • příjem digitálních dokumentů – zde v AV spolupráce s redakcemi časopisů AV ČR
  • podpora pro řízení práv a zpřístupňování jednotlivých dokumentů
  • podpora OpenURL (podle možností)

Představení SW bylo doplněno statistikou výkonů digitalizačního centra KNAV v roce 2006: digitalizováno 800 tis. stran, zpracováno 360 tis. stran. Kapacita skenerů je k dispozici i pro širokou veřejnost (2 Kč/str. A4 400 dpi, 2,90 Kč/str. A4 600 dpi).

Stav digitalizace v KKV v Havlíčkově Brodě – Marta Balounová (KKV HB)

Digitalizace zahájena v roce 2006, kdy byla zahájena spolupráce s muzejními a zámeckými knihovny (Havlíčkův Brod, Telč). Zájem ze strany muzeí směřuje i na digitalizaci méně tradičních dokumentů (dopisy, historické hudebniny). Skenovací linku tvoří HW Atlas + SW Sirius, pro zpřístupnění se plánují nasazení Krameriua. Uvítali by vytvoření DTD pro hudebniny.

Druhý den jednání pokračoval prezentací

Portál STM – Ing. Martin Svoboda (STK)

Příspěvek byl věnován aktuálnímu stavu a perspektivám portálu STK. STM je ukázka využití prostředků grantového programu LI nejenom na nákup informačních zdrojů. Obecně je snahou STK zahrnout do katalogu STM všechny elektronické zdroje pořízené v rámci v LI a jejich zpřístupnění až na úroveň primárního zdroje s cílem maximálně využít veškeré nákupy elektronických zdrojů v rámci ČR (v tom spočívá hlavní rozdíl mezi portálem STM a rozcestníkem Infozdroje, který nabízí pouze přehled licencí) – týká se všech, kdo vlastní licence (cca 100 odkazů vede rovnou na fulltexty). Volné zdroje zahrnují cca 1000 pravidelně udržovaných výskytů; dále existuje adresář výzkumných ústavů atp.. U katalogu STM je proveden popis na bázi DC + PSH; aktualizace probíhá 2x ročně. Databáze dostupných zdrojů obsahuje popis na bázi PSH + min. záznam ze Souborného katalogu. Portál celkem využívá cca 80.000 návštěvníků ročně. Plány do budoucna zahrnují sjednocení obou bází (licencovaných a volných zdrojů, které jsou nyní v oddělených databázích pod Oraclem) a doplnění anglického rozhraní (vychází z průzkumu chování zájemců z domén mimo .cz, kteří sice přicházejí, ale pokud narazí na české rozhraní, tak vzápětí odcházejí). V rámci debaty padl obecný námět na nějakou formu integrace vybraných volně dostupných webových zdrojů do uceleného řešení. Nyní paralelně existují tři samostatná řešení – STM pro oblast techniky a medicíny, WebArchiv pro zdroje s uzavřenou smlouvou na zpřístupnění, v brzké budoucnosti SKAT pro elektronické zdroje.

Možné způsoby měření využití databází a elektronických informačních zdrojů – PhDr. Vít Richter (NK ČR)

Prezentace pojednávala o problematice a možných způsobech evidence statistických údajů této čím dál využívanější části služeb knihoven. V její rámci byl prezentován přehled shromažďovatelů statistiky veřejných knihoven – NIPOS (knihovny krajů, měst a obcí; knihovny muzeí a galerií; registrované veřejné knihovny ostatních zřizovatelů) a další shromažďovatelé (NLK, AV ČR, ÚIV). Byla shrnuta stávající statistika v oblasti využívání el. služeb (sedm parametrů – připojení k Internetu, počet počítačů na připojení, počet návštěvníků používajících Internet, existence on-line katalogu, poskytování vzděláváni v oblasti IT, virtuální návštěvy webových stránek – od roku 2007). S jejich měřením souvisí některé problémy typu jasné vymezení elektronických dokumentů a služeb, definice uživatele, ošetření možnosti toho, že knihovna je součástí nějaké instituce (potřeba rozlišení požadavků směřujících přímo na ni) apod. V důsledku toho jsou data zatím neporovnatelná, v nevhodných formátech nebo se vůbec nezjišťují. Lze formulovat obecné požadavky typu – používat stejné a srozumitelné definice, používat stejné metody zjišťování, potřebu snadného zjišťování údajů, aplikovatelnost statistiky ve všech typech knihoven (jednoduchý webový formulář). Celá problematika měření elektronických služeb je poznamenaná nejasným vymezením toho, co do pojmu elektronické služby a dokumenty patří.

Problematika sledování statistik v jednotlivých oblastech obnáší oblast návštěv webových stránek, oblast využívání OPACu či dalších bází knihovny a využívání licencovaných zdrojů. Pro evidenci návštěvy webových stránek existuje metodický pokyn (je určen typ počitadla a po roce by mělo následovat jeho vyhodnocení). Je zde odchylka od mezinárodní normy (neodlišuje se zatím, zda jde o přístupy zevnitř nebo zvenčí). U statistik využívání OPACů či dalších bází knihovny je třeba určit, jakým způsobem ji realizovat. U měření využívání licencovaných zdrojů prosazuje se iniciativa COUNTER. Zde je zapojen široký záběr firem a zdrojů a iniciativa získává respekt. COUNTER vymezuje více typů reportů – pro časopisy (2 typy), knihy (6 typů) a databáze (3 typy); dále pak definici datových položek a statistické reporty. S tím souvisí i otázka – jaké údaje u využívání OPACu a dalších bází sledovat (možná východiska představují norma ČSN 2789 pro knihovnickou statistiku či COUNTER – nezbytná je zde domluva na seznam indikátorů ke sledování). Po prezentaci se rozběhla rozsáhlá debata, která se věnovala především statistice návštěv webových stránek a využívání OPACu. K řešení této problematiky byla ustavena pracovní skupina pod vedením dr. Víta Richtera.

Oborová informační brána Knihovnictví a informační věda (KIV) a Musica – společná prezentace zástupců Národní knihovny (E. Bartůňková, V. Kapsa, J. Pilař) a Ústavu výpočetní techniky Univerzity Karlovy (M. Ledinský, J. Pokorný, J. Pavlík)

Na úvod byla stručně představena JIB a její provazba na odkazové zdroje – již realizované oborové brány a a portály (portál EDU.CZ, portál STM, Virtuální umělecká knihovna, Fyzikální portál, Portál životního prostředí, České zoologické bibliotéky, Slovenská knižnica, EconLib, Medvik, Agronavigátor, Česká literatura).

Následně zástupci NK E. Bartůňková a V. Kapsa představili parametry aktuálně spuštěných oborových bran KIV a Musica. Strategie (metodika) oborových bran sestává z kritérií výběru zdrojů, zpracování a zpřístupnění zdrojů, a správy elektronické sbírky.

U brány KIV je zaměření dáno charakterem oboru – jde o kvalitativní a formální kritéria. Cílovou skupinu představují knihovníci a informační pracovníci, studenti oborových SŚ a VŠ škol a pedagogové SŚ a VŠ. Tomu odpovídá stanovení záběru brány – vše co by mohlo knihovníky při jejich práci mohlo zajímat. Jádro zdrojů je z oboru; zdroje z příbuzných oborů jsou zařazeny jenom pokud zde je průnik s KIV. KIV zatím zahrnuje 2 typy zdrojů – databáze licencované i volné. Volné primární dokumenty jsou odkazovány z bibliografické báze KKL – zde nastává problém nestálost zdrojů a jejich URL. U brány MUS jsou cílovou skupinou hudební vědci, pedagogové a studenti VŠ a SŠ hudebního zaměření, hudebníci, pedagogové ZUŠ, publicisté apod. Mezi specifika zdrojů patří výskyt zvláštních druhů dokumentů (hudebniny, nahrávky a hudební dokumenty v obecně zaměřených zdrojích. Na druhé straně pak bohužel omezení nabídky s ohledem na nezpracovanost hudebních fondů. Nabídka je strukturována podle druhů dokumentu (literatura, www zdroje, hudebniny, zvukové dokumenty), v portálu doplňuje hledání záchranná síť (nabídka Nenašli jste?, kde jsou odkazy na další zdroje). Na webu je vystavena metodika výběru zdrojů, kterou je možno připomínkovat (např. o začlenění dalších zdrojů doplnění katalogů krajských knihoven, knihovnických časopisů online apod.)

Technické řešení oborových informačních zdrojů představili zástupci ÚVT UK. Na začátku byly představeny dva základní kameny – Plone a Metalib. Uživatelské rozhraní je v portálovém systému Plone (na bázi open source), aplikačním jádrem portálu je vyhledávací stroj Metalib, který je do prostředí Plone zasazen jako jeden z portletů. Pokud pracuji s Plonem, výsledek vyhledávání se objevuje v okně pro Metalib, který volám přes API rozhraní. Následovalo představení Metalibu, což je paralelní prohledávač doplněný SFX serverem, který obsahuje čtyři základní moduly (snadné hledání, nalézt zdroje, profesionální vyhledávání a můj prostor). Zabudované zdroje dokáže obhospodařovat ve třech režimech – plně integrovaném, částečně integrovaném a odkazovaném (u částečně integrovaných zdrojů se dotaz zadaný v oborové bráně zobrazí v nativním rozhraní prohledávaného zdroje – např. z Google Scholaru; u odkazových zdrojů je možné hledat pouze v jejich rozhraních). SFX server je link server s rozsáhlou znalostní bází, kde autentifikace pobíhá přes IP adresu či middleware Shibboleth. Služby nabízené v rámci SFX u oborových bran představují plné texty EBSCO a volně přístupných archivů, ověření dostupnosti v katalozích NKP a oborových archivů, ukázky/recenze na i-legalne, allmusic.com, vyhledání autora v Groove ad.

Nyní se připravuje nasazení Metalibu verze 4, který klade důraz na standardy – W3C, Blind Friendly Web a optimalizace na všechny prohlížeče – mj. IE7). Rozhraní usnadňuje kustomizaci. Zobrazování nově obsahuje podporu clusterů a faset (podpora postkoordinovaného zobrazení výsledků; u clusteru je použita technologie Vivisimo – vpravo se zobrazují tematické skupiny vyčleněné z popisu dokumentů analýzou textu, vlevo se podle nich seskupují výsledky. U faset jde o nabídku skupin z určité třídy – např. o seskupení podle Data, Autora… Metalib dokáže komunikovat i přes jiné protokoly než přes Z39.50. Jiná rozhraní pro komunikaci představují OAI-PMH, částečně je možné zpřístupnění zdroje přes webové rozhraní – zde je nutná podpora open-URL. Je možné použít i proprietární rozhraní, avšak s ohledem na množství potřebné práce na jeho integraci pouze ve výjimečných případech.

Souborný katalog SKAT a elektronické zdroje – Ing. Jiří Šilha (SKAT)

Příspěvek se týkal novinek a plánovaného rozšíření záběru souborného katalogu SKAT (dále jen SK) o elektronické zdroje (webové i další). V rámci prezentace proběhlo představení plánovaných změn 2 hlavních bází stávající verze SKATu. U SK knih jde o přechod ze systému Lanius na Clavius, změnu databáze z FoxPro na MySQL5 a především změnu frekvence aktualizace www rozhraní katalogu SKAT ze čtvrtletní na průběžnou. Již dříve proběhla optimalizace rychlosti vyhledávání v souvislosti se zapojením zdroje do JIB. Nyní je v plánu stahování záznamů z účastnických knihoven pomocí protokolu OAI-PMH on-line (zůstane ovšem jakási předběžná kontrola, záznamy nebudou ihned umístěny v ostré bázi). Statistika počtu vyhledávání vypovídá o rostoucí využívanosti – nárůst z 21116 přístupů v roce 2000 na 165 378 přístupů v roce 2006. U SK článků (ANSKAT) bude nově zahájeno stahování všech záznamů excerpcí periodik z členských knihoven (zatím probíhalo jen u článků periodik s regionální působností) a bude spuštěno automatické odstraňování duplicit.

U SK elektronických zdrojů budou stejně jako u článků stahovány všechny zdroje pomocí technologie anish.

V plánu je koordinace metodiky tvorby záznamů, automatické odstraňování duplicit a www přístup v rámci databáze anish. Záběr SK elektronických zdrojů směřuje jenom na seriózní zdroje. Pro procházení obsahu báze se počítá s využitím konspektu; v případě zájmů o vytvoření stromu hesel inspirací bude spíše způsob použitý při tvorbě cizích řešení (viz http://lii.org/). Cílem budování SK je databáze zajímavých zdrojů, které knihovny používají, a možnost využití těchto zdrojů v lokálních zdrojích zapojených knihoven. Součástí řešení je automatická kontrola existence zdroje.

Možnosti využití programového vybavení WebArchivu dalšími subjekty – Ing. Petr Žabička (MZK Brno)

V rámci prezentace byly představeny nástroje, na kterých je postaven Webarchiv, a současně způsob jeho práce

WebArchivu nyní obsahuje 134,5 mil. sklizených souborů a 5,465 GB dat. První dokument byl archivován 3.9. 2001. Nástroje pocházejí převážně z dílny konsorcia pro archivaci webu IIPC. Na sklízení se používá Heritrix (open source na platformě javy, nyní s vylepšenou ochranou před pádem do pastí; ale i tak nelze dlouhodobě sklízet bez odborných zásahů). Heritrix doplňuje nástroj Deduplikator pro detekci duplikátů (mj. zda se nestahuji 2 obrázky ze dvou míst – používá se s ohledem na velký objem stahovaných dat). Dalším nástrojem pro správu sklízení je Webcurator Tool. Ten usnadňuje práci se sklízením po prvotním nastavení i laickým uživatelům (nyní se v ČR testuje). Na indexaci slouží indexovací nástroj Nutch (open source odpověď na Google), který vrací na dotaz i XML strukturu. Nástavba vyhledávacího rozhraní pro WebArchiv je NutchWAX. Pro zpřístupnění se používá WERA – předností je velmi snadná navigace umožnující práci s časovou osou. Ale pravděpodobně bude zastaven její vývoj – jsou zde problémy s java skripty a odkazy. Nástupcem je Wayback, který podporuje rovněž hvězdičkovou konvenci a má tři režimy zpřístupnění – Archival URL, proxy a timeline. Sestavu pro zpřístupnění doplňuje WAXToolbar – plug-in doplnitelný do Firefoxu (upřesňuje období, které chce uživatel i po Waybacku). Dále zazněla doplňující informace, že NK již je členem mezinárodního konsorcia pro archivaci webu IIPC. Jeho vývoj řídí výbor. V jeho rámci je možná finanční podpora individuálního vývoje, avšak po jeho ukončení již pokračování vývoje garantuje daná organizace, která ho občas i uzavře.

Na závěr proběhla všeobecná debata typu “Různé”

V jejím rámci padl námět ohledně možného využití celostátních akcí typu Březen měsíc Internetu či Týden knihoven na propagaci vybraných služeb knihoven na národní úrovni typu Ask your Library v médiích, a ty vhodně umístit na snadno zapamatovatelnou centrální webovou adresu typu www.knihovny.cz. Ing. Martin Svoboda navrhl vytvořit na webu jakýsi přehled nevyužitých nápadů; PhDr. Vít Richter toto doplnil návrhem na možné vystavení zajímavých přednášek, které jejich autor nabízí k prezentaci (pozn. autora – burza nápadů již vznikla a je umístěna na adrese http://napady.sdruk.cz/). Petr Novák uvedl užitečný odkaz k problematice hledání plagiátů – http://www.docoloc.de/.

Všechny prezentace a podrobné znění proběhlých debat je k dispozici v úplném zápisu setkání na adrese http://www.sdruk.cz/it/.

Zdieľať:
Obsah čísla