MARC 21 ako nový medzinárodný formát na tvorbu a výmenu informačných údajov v knižniciach

From Slovakia


Súčasná situácia

Na Slovensku sa v súčasnosti pri počítačovom spracovaní dokumentov používa niekoľko formátov. Najrozšírenejšie je používanie formátov na tvorbu bibliografických záznamov a začínajú sa používať formáty pre autority. Prakticky sa zatiaľ u nás nepoužívajú formáty pre holdingy, klasifikačné údaje a komunitné informácie.

Vzhľadom na určité štandardizačné úsilie v rámci úlohy Integrovaný knižnično-informačný systém (IKIS, 1985 – 1990) doznieva používanie Výmenného formátu IKIS. Roku 1993 sme iniciatívne preložili do slovenčiny bibliografický formát UNIMARC, ktorý sa v tom čase presadzoval ako nový medzinárodný formát v rámci krajín EÚ a súčasne bol podporovaný Medzinárodnou federáciou knihovníckych asociácií (IFLA) prostredníctvom Stáleho výboru UNIMARC (PUC) so sídlom vo Frankfurte.

Prekladom formátu Unimarc do slovenčiny sme vytvorili základné predpoklady na jeho šírenie na Slovensku a v Čechách. Unimarc sa stal oficiálnym formátom spoločenstva CASLIN. Po roku 1994 začal na Slovensku postupný prechod na UNIMARC. Významnou zmenou sa stalo uplatňovania formátu UNIMARC pre Autority. Výmenný formát IKIS a UNIMARC si na Slovensku osvojili najrozšírenejšie softvéry LIBRIS, Rapid Library, ALEPH a CDS/ISIS.

V súčasnosti sa teda na Slovensku používa niekoľko, predovšetkým bibliografických formátov MARC: Výmenný formát IKIS, Unimarc, Usmarc, ale aj nemarcovské formáty využívajúce iné štruktúry (napr. FoxPro).

Za ostatných 10 – 15 rokov prebehla u nás fáza úspešného osvojovania si niektorých štandardov týkajúcich sa bibliografickej, knižničnej a informačnej práce. Mnohí odborníci v knižniciach zvládli základy používania bibliografického formátu MARC, Výmenného formátu, a najmä formátu UNIMARC. Pozitívnym znakom je, že množstvo lokálnych databáz sa nachádza vo forme, ktorá uľahčuje výmenu informácií a kooperáciu. Rozsiahle uplatňovanie formátu Unimarc na Slovensku umožnilo dostať na jednu formátovú platformu rozhodujúcu časť záznamov o dokumentoch v elektronickej forme. Problémom je, že lokálne bázy zostali lokálnymi a nič podstatné sa v nich kvalitatívne nezmenilo napriek používaniu pomerne drahých knižničných softvérov.

Napriek všetkým pozitívam spojeným s prienikom tradičných štandardov treba konštatovať, že ich uplatňovanie je spojené s množstvom problémov, ktoré čakajú na riešenie. Štandardy a integrované systémy sa len minimálne odrážajú v zmenách tradičného spôsobu odborného myslenia a majú zanedbateľný vplyv na tradičnú a neefektívnu organizáciu práce. Pretrváva nezmyselné odlišovanie katalogizačného a bibliografického spracovania. Absencia katalogizačných pravidiel veľmi komplikuje napredovanie aj v tých najelementárnejších úkonoch pri spracovaní dokumentov.

Moderné technológie sa prispôsobujú starým organizačným modelom a pracovným postupom a konzervatívne myslenie knihovníkov sa mení len veľmi pomaly alebo vôbec nie. Zdá sa, že formáty MARC patria k takpovediac ”dobrým mravom” a uplatňujú sa prevažne na lokálnej úrovni. Používanie formátov dovoľuje zjednocovanie spracovania dokumentov. Neprinieslo však hlavný efekt, ktorým je zníženie nákladov na katalogizáciu. Nezriedka sa na jednom pracovisku, dokonca často vo vedľajších miestnostiach, udržiavajú zastarané rutiny vychádzajúce z agendového prístupu k veci. Stále nejestvuje online súborný katalóg a náklady na multikatalogizáciu s najväčšou pravdepodobnosťou neklesajú, ale práve naopak – naďalej stúpajú. Nezaznamenali sme v rámci kooperácie medzi knižnicami žiadnu online výmenu bibliografických a holdingových informácií. Na úrovni knižničného systému republiky nie sú dostatočne vyjasnené princípy a účelnosť budovania súborného katalógu. Najväčšia pozornosť sa venuje elementárnym otázkam zvládnutia bibliografického formátu MARC. Málo známe sú princípy fungovania a využívania súborov autorít a holdingov v integrovaných systémoch. Tzv. národný program štandardizácie v knihovníctve sa redukuje na formát Unimarc a na nedostatočne systematické interpretácie katalogizačných pravidiel, a to bez výraznejšieho inovačného efektu. Celé veľké oblasti štandardizácie zostávajú nedotknuté a starostlivosť o najdôležitejšie štandardy z oblasti dokumentácie je nerozvinutá. Na riešenie čakajú veľmi dôležité praktické problémy, medzi ktoré patrí napríklad zjednotenie kódovníkov a problémy číslovania v spracovateľskej praxi (kódy pracovísk, kódy krajín, jazykov, evidenčné čísla, systémové čísla, prírastkové čísla, holdingové čísla a pod.), ktoré sa často riešia agendovo a lokálne bez ohľadu na kooperačné perspektívy.


MARC 21

Formáty MARC 21 sú široko používané štandardy na reprezentáciu a výmenu bibliografických údajov, údajov o autoritách, klasifikačných údajov, záznamov o komunitných informáciách a holdingoch v strojom čitateľnej forme. Akronym MARC (Machine-Readable Catalogue alebo Cataloguing) znamená ”strojom čitateľný katalóg alebo katalogizácia”. V praxi sa skratka MARC spravidla nedešifruje a používa sa v rozličných súvislostiach. Existuje okolo dvadsať formátov typu MARC. Všeobecne sa pojmom MARC pomenúva skupina formátov, ktoré slúžia na identifikáciu a spracovanie bibliografických a iných údajov a na ich výmenu medzi knižnicami, bibliografickými a informačnými agentúrami v rámci kooperácie na národnej alebo medzinárodnej úrovni.

MARC 21 sa skladá z rodiny piatich koordinovaných formátov: MARC 21 Formát pre autority; MARC 21 Formát pre bibliografické údaje; MARC 21 Formát pre klasifikačné dáta; MARC 21 Formát pre komunitné informácie a MARC 21 Formát pre holdingy.

Každý z týchto formátov MARC je publikovaný samostatne a poskytuje podrobný popis polí, pravidlá použitia definovaných údajov s príkladmi, ako aj identifikáciu konvencií, ktoré zabezpečujú konzistenciu vstupných dát.


Časti záznamu MARC 21

Všeobecná charakteristika formátu MARC 21 sa nachádza v spoločnom úvode ku všetkým formátom. Informácie o špecifikách jednotlivých formátov MARC 21 sú v úvodoch k jednotlivým špeciálnym formátom vzťahujúcim sa na určité typy záznamov. Všetky záznamy MARC 21 sa skladajú z troch hlavných elementov:

  • štruktúra (record structure);
  • kódy údajov; identifikátory údajov (content designators);
  • definície údajov; špecifikácie údajov (data content of the record, data element definitions).

Štruktúra záznamu je pôvodne doplnením normy American National Standard for Information Interchange (ANSI/NISO Z39. 2) a jej medzinárodného ekvivalentu ISO 2709. Na Slovensku je táto norma dostupná ako STN ISO 2709: 1996 : Informácie a dokumentácia. Formát na výmenu informácií. 1999. Na tejto norme je založený aj rad ďalších formátov, ktoré primárne nesúvisia s oblasťou bibliografie a sférou knižnično-in formačných služieb (formát na výmenu lexikálnych jednotiek, formát EDIFACT používaný v elektornickej výmene dát v administrácii, obchode a doprave a pod.).

Kódy údajov, čiže tagy, indikátory, kódy podpolí a ďalšie explicitne určené konvencie, charakterizujú údaje v zázname a slúžia na podporu manipulácie s údajmi, ktoré sú definované v každom formáte MARC 21.

Definície údajov, ktoré sa nachádzajú vo formátoch MARC 21, sú spravidla definované nejakými špeciálnymi pravidlami mimo formátu, napríklad pravidlami pre Medzinárodný štandardný bibliografický popis (International Standard Bibliographic Description (ISBD)) alebo Anglo-americkými katalogizačnými pravidlami (Anglo-American Cataloguing Rules, 2nd edition (AACR 2)), či v ďalších štandardoch, ktoré sú u nás odbornej verejnosti známe, ako napr. Library of Congress Subject Headings (LCSH), Holdings Statements´ Summary Level (ISO 10324), American National Standard for Serial Holdings Statements (ANSI/NISO Z39. 44), Library of Congress Classification (LCC) alebo podobné konvencie používané organizáciami, ktoré vytvárajú záznamy. Obsah niektorých kódov, napr. v návestí alebo v tagoch 006, 007, 008, je definovaný v samotnom formáte MARC 21.

Štruktúra záznamu MARC sa skladá z troch hlavných komponentov: 1. návestie záznamu, 2. adresár, 3. premenlivé polia (polia premenlivej dĺžky). Podrobnejšie informácie sa nachádzajú v manuáli MARC 21 Specifications for Record Structure, Character Sets, and Exchange Media, ktorý je dostupný na stránke Kongresovej knižnice v USA.


MARC 21 a Unimarc

MARC 21 má rovnakú štruktúru záznamu ako Unimarc. Tieto formáty sa však odlišujú v samotných hodnotách kódov údajov a v definíciách údajov. Prakticky to znamená, že obidva formáty majú v štruktúre definované trojznakové kódy polí (tagov), dva indikátory, dva znaky pre kódy podpolí, majú rovnako definované kódy konca polí a kódy konca záznamov. Čísla tagov sú však v týchto formátoch odlišné, indikátory sú definované rozdielne, polia a podpolia sú definované taktiež odlišne.

Konverzia záznamov z formátu MARC 21 do formátu Unimarc a naopak je možná, ale vonkoncom nie jednoduchá. Pokiaľ ide o konverzie z formátu Unimarc do formátu MARC 21, situácia je sťažená tým, že Unimarc bol niekoľko rokov k dispozícii len ako bibliografický formát. Neexistoval formát pre autority, a najmä formát pre holdingy, čo nútilo používateľov formátu UNIMARC v neúnosnej miere používať tzv. národné polia 9XX, pričom v jednotlivých aplikáciách a softvéroch sa rovnaké problémy riešili neštandardnými spôsobmi. Problém eventuálnej konverzie dát z formátu UNIMARC do formátu MARC 21 však predstavuje jeden z ľahších problémov v procese prechodu na MARC 21. Máme k dispozícii vlastné konverzné programy umožňujúce konverziu zo všetkých u nás známych zdrojových formátov do všetkých u nás známych cieľových formátov. Usilujeme sa problém konverzie riešiť čo najštandardnejšie, pričom sa orientujeme na konvertor EU Usemarcon.

Problémom UNIMARC-u a tým aj dodávateľov softvérov je odborné nedoriešenie formátu pre holdingy, absencia tagov pre spracovanie holdingov seriálov, absencia tagov pre údaje o exemplároch, absencia údajov pre akvizičné údaje, výpožičky a pod. Je to preto, lebo UNIMARC je používaný prevažne ako bibliografický formát.

Pri implementácii systému VTLS/Virtua na UK v Bratislave a na UMB v Banskej Bystrici sme konvertovali vyše dvestotisíc záznamov z rôznych zdrojových formátov do USMARC-u. Pri tej príležitosti sme analyzovali zdrojové formáty. Uskutočnili sme konverzie z rôznych zdrojových formátov (Výmenný formát IKIS, Unimarc, formát DBF z FoxPro), pričom všetky zdrojové formáty zo systémov LIBRIS, Rapid Library, ALEPH a CDS/ISIS, Evipub, j v používaní znakových sád. Vyskytuje sa stále kódovanie Kamenických, CP 852, kódovanie Windows 1250 a iné.

Použitie 8-bitového kódu (štandard IBM EBCDIC – Extended Binary Coded Data for Interchange) umožňuje 256 kombinácií. Ďalší pokrok predstavuje štandard ISO 10646 (1993), tzv. UNICODE 1. Norma ISO 10646 špecifikuje 16a 32-bitové znakové sady. Aplikuje sa pri reprezentácii, prenose, výmene, spracovaní, uchovávaní, vstupe a prezentácii písomnej formy jazykov (písma) používaných na celom svete a dotýka sa aj dodatočných symbolov. Štandard UNICODE si vyžaduje operačný systém Windows 2000 a je v úplnosti zatiaľ implementovaný, pokiaľ nám je známe, len v jedinom knižnično-informačnom systéme, a tým je systém VTLS Virtua. Používanie štandardu UNICODE umožňuje pracovať na úrovni klienta i v databáze vo všetkých častiach systému s viacerými kódovými stránkami súčasne, mnohými jazykmi a písmami a používať pri zápise a hľadaní okolo 40 000 znakov.

Iniciatívy SGML, XML, metadata a Dublin Core nie sú v rozpore s tradičnými formátmi MARC. Podľa nášho názoru nepredstavujú alternatívu tradičných formátov MARC. Medzi formátmi MARC a aplikáciami SGML je komplementárny vzťah, pričom každý typ formátu má svoje špecifické funkcie. V podstate je vyriešená otázka exportu záznamov z formátov MARC do formátu XML. Umožňuje to u nás popri systéme VTLS/Virtua aj systém CDS/WinISIS.


Návrh na prechod Knižničného systému Slovenskej republiky na MARC 21

V októbri 2001 sme na zasadnutí Ústrednej knižničnej rady predniesli návrh na prechod knižníc Knižničného systému SR z UNIMARC-u a ďalších formátov na formát MARC 21, a to v približnom časovom horizonte r. 2003. Tento odborný názor u mňa dozrieval niekoľko rokov. V súčasnosti vznikli na jeho prednesenie vhodné okolnosti, ktoré uvediem ďalej. Rada starostlivo posúdila tento návrh, avšak popri prevažne podporných stanoviskách odzneli aj názory, ktoré poukazovali na finančné a psychologické aspekty navrhovanej zmeny. Podľa rady je postupne potrebné na úrovni expertných skupín posúdiť odborné a finančné hľadiská prechodu na nový formát. Treba pritom zvážiť všeobecné odborné trendy, a, samozrejme, finančné náklady spojené s prechodom, ale rovnako aj finančné náklady a straty, ktoré vzniknú tým, že sa eventuálny prechod neuskutoční. Návrh nebol zamietnutý a rada odporučila konkrétne kroky, ako ďalej postupovať. Možno konštatovať, že zatiaľ neexistuje v tejto otázke jednoznačné odborné stanovisko útvarov a knižníc, ktorých sa takáto zmena môže najviac dotknúť. Vzhľadom na závažnosť problému považujem za potrebné zoznámiť s mojím návrhom širokú odbornú verejnosť.

Ciele návrhu:

  • poskytnúť základné informácie pre strategické rozhodnutie,
  • začať širšiu odbornú diskusiu o prechode na MARC 21 v slovenskej knihovníckej komunite.

Kde sa môžeme dozvedieť viac o formáte MARC 21?

Bibliografia k formátu MARC je dostupná na adrese: http://lcweb.loc.gov/marc/readings.html. Základná užitočná publikácia k MARCU 21 má názov Understanding MARC Bibliographic a je na adrese: http://lcweb.loc.gov/marc/umb/.

Kto udržiava a rozvíja formáty MARC 21?

Je to Network Development and MARC Standards Office v Kongresovej knižnici a Standards and Support Office v Kanadskej národnej knižnici. Ďalšie informácie sú na adrese: www.loc.gov/marc/overview.html; ndmso@loc.gov; marc@nlcbnc.ca.

Ako si možno objednať dokumentáciu MARC 21?

Na adrese Cataloging Distribution Service v Kongresovej knižnici a v Kanade na adrese Canadian Government Publishing. Kompletný MARC 21 concise formats vrátane kódovníkov je dostupný na adrese: www.loc.gov/marc/.

Ako sa MARC 21 odlišuje od formátu USMARC a formátu CANMARC?

MARC 21 nie je nový formát. Vznikol ako výsledok ”harmonizácie” formátu USMARC a CANMARC v roku 1997. V porovnaní s týmito formátmi sú v MARC 21 malé zmeny, na ktorých sa dohodli obe strany. Viac informácií o harmonizácii možno nájsť na adrese: http://lcweb.loc.gov/marc/annmarc21.html.

Je dostupná verzia MARC 21 vo verzii SGML alebo XML?

Áno. Obidve implementácie SGML a XML DTD vyvinuté v Kongresovej knižnici v Network Development and MARC Standards Office. Viac informácií je na adrese: http://lcweb.loc.gov/marc/marcsgml.html.

Je k dispozícii mapovanie MARC 21 do iných metadátových štandardov, ako je napríklad Dublin Core?

Áno. MARC 21 je mapovaný do nasledujúcich metadátových štandardov: Dublin Core Digital Geospatial Metadata – GILS – ONIX. Okrem toho sú k dispozícii rozšírené 8-bitové a 24-bitové znakové sady pre MARC 21 mapované do Unicodu: UCS/Unicode.

Existujú preklady formátov MARC 21?

Zoznam prekladov (MARC 21 Translations) sa nachádza na adrese: www.loc.gov/marc/translations.html.

Existujú preklady formátov MARC 21 do slovenčiny?

Do slovenčiny preložil formát USMARC a MARC 21 iniciatívne D. Katuščák pre potreby používateľov systému VTLS a VIRTUA (Bibliografický formát, Formát pre holdingy a Formát pre autority). Tieto formáty sa používajú na Univerzite Komenského v Bratislave (12 fakultných knižníc a pre EPC), na Univerzite Mateja Bela v Banskej Bystrici (8 fakultných knižníc a pre EPC), Štátna vedecká knižnica v Banskej Bystrici. Celkove je v bibliografickom formáte asi 250 000 záznamov, približne 650 000 dočasných alebo stálych záznamov autorít a holdingové informácie vzťahujúce sa na monografické publikácie.

Kedy budú dostupné slovenské formáty MARC 21 pre používateľov v SR?

V apríli 2002, ak sa bude realizovať navrhovaný harmonogram. Po harmonizácii s prekladom AACR2. Do apríla 2002 formát MARC 21 nebudeme šíriť.


Hlavné dôvody a výhody prechodu na MARC 21

1. IFLA prestane oficiálne podporovať formát UNIMARC v rámci programu IFLA UBCIM. Skončí sa finančná podpora formátu UNIMARC zo zdrojov IFLA. Z formátu UNIMARC sa nestane svetový formát na výmenu bibliografických informácií. (Konferencia IFLA, Boston, 2001). Ďalšiu podporu formátu Unimarc na seba preberá Portugalsko, ktoré bude rozvoj formátu realizovať prostredníctvom osobitného konzorcia. Prakticky to znamená, že knižnice, ktoré sa rozhodnú zostať pri formáte Unimarc, by mali vstúpiť do konzorcia a finančne podporovať príslušné rozvojové a metodické programy.

2. Formát USMARC, ktorý bol do roku 1997 národným formátom USA, sa v roku 1997 stal medzinárodným formátom po integrácii s kanadským formátom CANMARC. Na MARC 21 prechádzajú ako na medzinárodný formát ďalšie krajiny (Anglicko, diskusie v Nemecku, USMARC používajú v Poľsku, Belgicku, Španielsku, Švédsku, Fínsku atď.).

3. Vo formáte MARC 21, resp. vo formáte USMARC, je najväčší počet informačných zdrojov (záznamov) v knižniciach a bibliografických agentúrach.

4. MARC 21 je vhodnejší na praktickú prácu v knižniciach a bibliografických agentúrach a umožňuje spracúvať aj také druhy dokumentov, ktoré sa v UNIMARC-u nedajú spracúvať vôbec (archiválie, muzeálne predmety a pod.).

5. MARC 21 je konzistentný systém formátov MARC 21 pre bibliografiu, autority, klasifikačné systémy, holdingy a komunity, ktorý sa v praxi skutočne používa.

6. MARC 21 umožňuje bez konverzií downloadovať a derivovať bibliografické záznamy z najväčšieho počtu zdrojov (knižníc, bibliografických agentúr, informačných služieb) (Z39.50).

7. MARC 21 predstavuje najefektívnejšiu cestu k eventuálnemu budúcemu používaniu štandardov ne-MARC-ovských metadát.

8. MARC 21 je výborne dokumentovaný, sústavne udržiavaný, rozvíjaný a podporovaný lepšie ako iné formáty.

9. MARC 21 používajú ako hlavný formát všetci najvýznamnejší dodávatelia knižnično-informačného softvéru (o. i. ALEPH 500, VTLS, Virtua a iné).

10. MARC 21 používa a aktualizuje celý rad pomôcok, kódovníkov a iných utilít, ktoré uľahčujú prácu v knižniciach a bibliografických agentúrach.


Postup prechodu: kroky

1. Dotazníkový prieskum (december 2001 – január 2002) – SNK. (Na s. 14 uvádzame podobu dotazníka len ako ilustráciu k článku autora. – Pozn. red.)

2. Odborný seminár s tvorcami a používateľmi najrozšírenejších knižničných softvérov (december 2001 – január 2002) – SNK a zainteresované subjekty.

3. Konverzie z lokálnych formátov do formátu MARC 21 s použitím štandardného konvertora USEMARCON (marec 2002 – marec 2003). Konverzia všetkých dát SNK z UNIMARC-u do MARC 21 – SNK, M. Rakús, J. Sivák, D. Katuščák, knižnice.

4. Revízia a sprístupnenie slovenského prekladu katalogizačných pravidiel AACR2 v slovenčine (december 2001 – apríl 2002) – SNK, J. Majerová.

5. Revízia a sprístupnenie slovenského prekladu formátu MARC 21 (bibliografický formát, autority, holdingy) v slovenčine (december 2001 – apríl 2002) – SNK, D. Katuščák.

6. Implementácia formátu MARC 21 a AACR2 v SNK a v knižniciach zapojených do prvej etapy tvorby súborných katalógov (marec 2002 – december 2002).

7. Príprava materiálov potrebných na implementáciu MARC 21 a AACR2 (formáty, kódovníky, príručky, prezentácie, metodiky atď.) pre používateľov a na školenia (marec 2002 – december 2003) – SNK a knižnice.

8. Školenia školiteľov k MARC 21 (marec 2002 – jún 2002) – SNK.

9. Školenia používateľov MARC 21 (jún 2002 – december 2002).

 

Dotazníkový prieskum názorov na zámer prejsť na MARC 21

Dotazník dáva používateľom tri možnosti týkajúce sa formátu UNIMARC.

A. Pokračovať v používaní formátu UNIMARC a prebrať niektoré špeciálne chýbajúce polia z formátu MARC 21, čím sa rozšíri formát UNIMARC SK tak, aby nedochádzalo ku konfliktom s doterajšou praxou. Táto možnosť znamená pokračovať v doterajšej politike.

B. Zobrať za základ formát MARC 21, čiastočne harmonizovať UNIMARC SK s formátom MARC 21 a ponechať niektoré špecifické riešenia z aplikácie formátu UNIMARC SK (ktoré zmeny urobiť, ako ich včleniť, šíriť a udržiavať, kto to zaplatí).

C. Prijať úplne formát MARC 21 a úplne skončiť používanie formátu UNIMARC.

Navrhujem variant ”C”, teda úplný a rýchly prechod na MARC 21.

doc. PhDr. Dušan Katuščák, PhD.

it4b.jpg (504741 bytes)

Upozornenie: Tento dotazník slúži čisto na ilustráciu článku doc. PhDr. D. Katuščáka, PhD.

Share:
Issue content