Terminologický slovník – tezaurus – pre vedné oblasti zamerané na celulózo-papierenskú a drevospracujúcu problematiku

Bibliographybibliographythesaurus

Podstatou projektu riešeného v rámci všeobecnej výzvy VV APVV 2012 je vytvoriť riadený súbor odbor- ných termínov – tezaurus – pre oblasť spracovania drevnej hmoty na základné a vedľajšie produkty celu- lózo-papierenského a drevárskeho priemyslu. Terminologický slovník je postavený na existencii troch základných pilierov. Prvým je dlhodobo budovaný fond odbornej literatúry, ktorý je archivovaný v knižnici VÚPC, druhý pilier tvorí vlastná báza dát, ktorej jeden z výstupov – frekvenčný slovník kľúčových slov – je podstatný materiál pri zostavovaní tezauru a tretí pi- lier tvorí odborné zázemie pracovníkov Výskumného ústavu papiera a celulózy, odborníkov a špecialistov pre jednotlivé špecifické oblasti. Tematika technických informácií celulózo-papierenskej problematiky je rôznorodá a svojím zameraním zasahuje do rôznych ved- ných disciplín. Navyše terminológia je skomplikovaná heslami, ktoré priebežne vstupovali do terminológie v priebehu vývoja celulózo-papierenského a drevo- spracujúceho priemyslu tohto regiónu. Na základe platnej normy pre tvorbu tezaurov bola vytvorená zo- stava tematických oblastí so širokým záberom, aby po- kryli celý rozsah danej problematiky. Tematické oblasti rozdelené na 16 zoskupení obsahujú tematicky hlavné technologické postupy výroby hlavných a vedľajších produktov a procesov. Pomáhajú limitovať rozsah spracovávaných informácií a zjednodušiť prácu s veľ kým súborom dát. Pravidelné práce s informáciami a distribúcia najnovších informácií používateľom vyža- dujú od tezauru otvorenosť a flexibilitu súboru pre priebežné úpravy a vstupy aktuálnych termínov. Pre- pojenie základných pilierov informačného zabezpečenia,  t.  j.  informačného  fondu,  vlastnej  bázy  dát a znalostí technologických súvislostí v rámci hierarchic- kého zatriedenia termínov, vytvára podklady na vzájomné prepojenie komplexného informačného systému so zostavovaným tezaurom a naopak využívať tezaurus ako podporu komplexného informačného systému.

K základným kritériám hodnotenia úrovne informačného zabezpečenia rôznych skupín používateľov informácií, pracovníkov výskumu, hospodárskeho sektora a univerzít, patrí kvalita získanej informácie a jej časová dostupnosť. Správne zvolený spôsob formulácie technického problému pri zostavovaní re- šeršných podkladov zvyšuje efektívnosť výberu relevantných informácií a súčasne ich umožňuje získať v požadovaných časových termínoch. Posudzovanie úrovne a porovnanie riešenia projektov a výskumných úloh s najnovšími poznatkami vedy a techniky a navrhovaných postupov s medzinárodnými skú- senosťami je povinnou súčasťou prípravy takmer každej plánovanej úlohy. Z uvedených dôvodov je využitie riadeného slovníka termínov – tezauru – na takýto účel potrebné, pre- tože sa tezaurus stáva základnou pomôckou a súčasne návo- dom, ako optimálne formulovať dotaz a tak dosiahnuť čo najvyššiu relevanciu získaných informácií. V prípade žiadateľa informácií, ktorý svojou profesiou je vzdialený danému odboru, prípadne mladého pracovníka, ktorý sa s terminológiou len oboznamuje, sa tezaurus stáva vhodnou pomôckou pri formulovaní informačného dotazu. Tezaurus odborných termínov pre potreby celulózo-papierenského priemyslu v slovenskej verzii neexistuje, preto je aktuálnosť riešenia daného projektu vysoká. V krajinách s rozvinutým celulózo-papierenským prie- myslom, ako napr. Švédsko, Fínsko, Kanada, je tezaurus bež- ným pracovným materiálom pre používateľov informácií.

Obr. 1

Výskumný ústav papiera a celulózy, a. s., je od svojho zalo- ženia orientovaný na aplikovaný výskum a po celý čas svojej existencie vytvára priestor na zhromažďovanie a archiváciu odborných materiálov v knižnici VÚPC. Informačný fond knižnice obsahuje okrem najnovších odborných informačných materiálov aj archivované historické materiály zdedené po predchádzajúcich organizačných štruktúrach. Od založenia v roku 1949 do roku 1993 bol Výskumný ústav papiera a celulózy (VÚPC) inštitúciou s celočeskoslovenskou pôsobnosťou. V roku 2003 bol do VÚPC organizačne začlenený Štátny dre- vársky výskumný ústav, a tak sa knižnica VÚPC obohatila o in- formačné materiály z tejto inštitúcie. Spojením týchto dvoch fondov a predchádzajúcej archivácie množstva odborných publikácií zo začiatku 20., ale aj z konca 19. storočia, technická knižnica sa stala vlastníkom viacerých originálnych materiálov a písomností, ktoré zachytávajú históriu vednej oblasti spojenej s vývojom celulózo-papierenského a drevospracujúceho priemyslu v tomto regióne. Po viacerých inventúrach sa knižničný fond  ustálil na počte asi 20 000 knižných jednotiek a viazaných časopisov a asi 200 jednotiek konferenčných materiálov, zborníkov, firemných materiálov a pod. Hlavným zámerom Výskumného ústavu papiera a celulózy, a. s., je výskum a vývoj technológií pre výrobu vláknin a papierov na báze dreva a nedrevných surovín. Prevažne aplikovaný výskum sa orientuje na inováciu existujúcich technológií, na realizáciu inovačných zámerov slovenského aj zahraničného celulózo-papierenského priemyslu. Následná dokumentácia, digitalizácia a archivácia odborných materiálov knižnice pomáhajú ich sprístupneniu odbornej verejnosti. Pravidelné spracovanie prírastkov odborných materiálov z fondu formou anotácií odborných článkov, prípadne kapitol kníh, a následným zabezpečením selekčnými prvkami, podľa požiadaviek knižničného softvéru WINISIS a následným vložením do vlastnej bázy dát ADIS CELPA, umožňujú spätne získavať požadované informácie. Pri prehľadávaní bázy dát sa najčastejšie používajú kľúčové slová, prípadne iné špecifikácie, ako sú autori, názov odborného materiálu, čas spracovania a pod. Báza dát, budovaná od roku 1989 s celkovým počtom záznamov viac ako 55 000 anotácií, poskytuje profesionálne infomácie pre rešeršné podklady pripravovaných a riešených úloh. Navrhovaná metodika na zostavenie jednojazyčného te- zauru sa odvíja od podkladových noriem pre tvorbu tezaurov, konkrétne normy obnovenej v roku 2011, STN ISO 2788 Dokumentácia. Pokyny pre tvorbu a vývoj jednojazyčného tezauru (1). Norma stanovuje pravidlá pre štruktúru a formálnu úpravu tezauru a potvrdila sa jej vhodnosť pre spracovanie tezauru vedeckých, technických a ekonomických informácií. Metodika tvorby tezauru je podľa normy prepojená s nasledujúcimi postupmi:

•  vymedzenie limitov sledovaných a spracovávaných oblastí,

•  zber lexikálnych jednotiek (termínov) daných oblastí,

•  spracovanie lexikálnych jednotiek do základných tematických oblastí a výber selekčných prvkov,

•  vyhotovenie abecedného zoznamu lexikálnych jednotiek,

•  vyhodnotenie  systematického  registra  selekčných prvkov a zoznamu identifikátorov,

•  vytvorenie registra vzťahov hierarchickej závislosti medzi selekčnými prvkami,

•  formálna a jazyková úprava tezauru.

Tezaurus orientovaný na určitú vednú oblasť poznania patrí podľa normy k špecializovaným druhom tezaurov a následným preskupením termínov do určených tematických oblastí sa tezaurus zaraďuje medzi tematické tezaury. Čerpali sa aj poznatky z normy ISO 2788 pre podmienky EÚ na vytvorenie viacjazyčného tezauru EuroVoc (2), ktorá pokrýva terminoló- giu aktivít v jazyku všetkých členských krajín zaradených do 44 tematických oblastí. Špecializovaná celulózo-papierenská tematika je najbližšia metodike tvorby tezauru technických vied Štátnou technickou knižnicou Praha (3). Podľa normy pri tvorbe tezauru je možné využívať prirodzený odborný jazyk, čo sa aplikovalo v prípade tezauru pre celulózo-papierenskú problematiku, v ktorom je väčšina odborných výrazov v slo- venskom jazyku. Vyskytujú sa však viaceré pôvodné termíny prevzaté z anglického jazyka, prípadne termíny s anglickým základom, ktoré vyjadrujú napríklad procesy a postupy nazvané podľa názvu firmy, ktorá uviedla postup, prípadne produkt  na  trh.  Takého  termíny  sa  v  tezaure  ponechajú s prípadnou poznámkou a odborným vysvetlením. Ako podklady pre zostavu tezauru slúžili aj ďalšie materiály (kanad- ský    a    nemecký    tezaurus)    zamerané    na    oblasť celulózo-papierenského priemyslu a využila sa kombinácia viacerých tezaurov s orientáciou na jednojazyčný riadený tezaurus, špecializovaný na určitú vednú oblasť, prípadne s využitím niektorých ekvivalentov v anglickom a latinskom jazyku (názvy stromov a rastlín). Tvorba tezauru na základe dohodnutej jednotnej klasifikácie termínov vyžaduje súčinnú spoluprácu odborníkov s dlhodobou praxou v problematike, ktorí majú skúsenosti s odbornou terminológiou, štúdiom od- bornej literatúry, vstupmi do našich a zahraničných báz dát as ďalšími spôsobmi využívania informácií.

Hierarchická zostava technických termínov formou nadrade- nosti − širší termín (ŠT), podradenosti − užší termín (UT), resp. rovnocennosti (RT) termínu, zjednodušuje zadávateľom informačnej požiadavky formuláciu daného technického prob- lému. Metodický materiál využívania tezauru je tiež cieľom riešeného projektu. Usmernenie pomocou metodických po- kynov a uvedením rôznych príkladov postupu umožní lepšiu orientáciu zadávateľom informačnej požiadavky, hlavne tých, ktorých pracovné aktivity sú vzdialené od ústrednej proble- matiky. Tematicky riadený slovník je možné považovať aj za vhodný podkladový materiál pri rozširovaní vedomostí mla- dých pracovníkov, ktorí sa s danou terminológiou len oboznamujú. Znalosť vzájomného prepojenia termínov na základe ich hierarchického postavenia v tezaure zjednoduší výber re- levantných termínov a správnu formuláciu sledovanej pro- blematiky aj pre informačných pracovníkov. Podobný súborný materiál terminológie celulózo-papierenskej a drevospracu- júcej problematiky na Slovensku zatiaľ nebol spracovaný.

Tematika spracovávaných informácií z oblasti celulózo-papierenského priemyslu je rozsiahla, pretože sa dotýka viacerých vedných disciplín, od botanických vied až po technické strojárske vedy. Zložitosť spracovania súboru termínov z celu- lózo-papierenskej oblasti je v značnej miere ovplyvnená jej historickým vývojom v tomto regióne. Do terminológie sa priebežne vnášali výrazy, ktoré sa v súčasnosti síce rutinne ešte používajú, ale z hľadiska súčasnej úrovne vývoja vedy a techniky už nie sú aktuálne. Komplikácie tvorby terminoló- gie vyplývajú aj zo správneho určenia termínu, ktorý bol ako prvý uvedený v anglickom jazyku. Napríklad termín „PULP“ v angličtine je súborným názvom pre slovenské ekvivalenty BUNIČINY, resp. VLÁKNINY, ktoré v slovenčine je nutné rozlišovať z hľadiska technológie výroby. BUNIČINY sa vyrábajú prevažne chemickými postupmi a VLÁKNINY mechanickými postupmi (DREVOVINY), prípadne pôsobením tepla a tlaku (VLÁKNINY TERMOMECHANICKÉ), alebo spolupôsobením chemikálií (VLÁKNINY CHEMICKO-TERMOMECHANICKÉ). Po viacnásobnej revízii frekvenčného slovníka spracovanej vlast- nej bázy dát ADIS CELPA a vyradení neaktuálnych termínov sa rozsah termínov ustálil na počte asi 15 000 jednoslovných a viacslovných hesiel. Na zjednodušenie práce s veľkým sú- borom dát bola vytvorená zostava tematických oblastí (TO) tak, aby ako celok šestnástich tematických oblastí, obsiahla celú škálu informácií celulózo-papierenskej a drevospracujú- cej problematiky. Každá tematická oblasť má širší záber in- formácií, ktoré sú tematicky zhodne zamerané. Napríklad jedna z najzložitejších oblastí tematická oblasť 3 „Výroba ne- bielených vláknin a špeciálnych druhov vláknin, vrátane pra- nia a triedenia vláknin, rôzne chemické procesy, chemikálie a vedľajšie produkty pri výrobe vláknin“ bude mať hlavné ter- míny (HT) z danej tematickej oblasti napríklad: „VLÁKNINY“, „BUNIČINY“, „PRANIE VLÁKNIN“ , „TRIEDENIE VLÁKNIN“. Širší, nadriadený, termín druhový (ŠTD) bude napríklad „BU- NIČINY“, ktorý patrí pod HT „VLÁKNINY“. Pod ŠTD „BUNI- ČINY“ sú zaradené užšie, podriadené, termíny druhové (UTD), ako sú „BUNIČINA BEZCHLÓROVÁ“, prípadne rôzne druhy „BUNIČINY SULFÁTOVEJ“ a „BUNIČINY SULFITOVEJ“. Zostava šestnástich tematických oblastí bola vytvorená na zá- klade dlhodobých praktických skúseností s poskytovaním a sledovaním využívania profesionálnych informácií v rámci vytvoreného komplexného informačného systému, ale sú- časne aj využitím skúseností so zahraničnými bázami dát s rovnakým, prípadne podobným tematickým zameraním. Te- matické oblasti slúžia na selekciu a limitovanie rozsahu spra- covávaných informácií. Práca s informáciami a pravidelná distribúcia v dohodnutých časových intervaloch vyžaduje od systému flexibilitu a možnosť priebežne aktualizovať termíny.

obr. 2

Podklady spojené so zostavením súborného materiálu termí- nov – tezauru – sú postavené na výsledkoch dlhodobých ak- tivít informačného strediska VTEI pri VÚPC v oblasti zabezpečovania informácií v danej problematike. Základným pilierom zostáva informačný fond, ktorý sa buduje a archi- vuje od založenia VÚPC, a. s. Pravidelné spracovanie prírast- kov informačného fondu poskytuje materiál pre signálne profesionálne informácie používateľom podľa ich odborného zamerania. Súčasne s anotačným spracovaním vybraných článkov a zostavou selekčných prvkov pre každú anotáciu sa pripravujú vstupy do vlastnej bázy dát ADIS CELPA. Každá anotácia v rozsahu asi 10 − 12 viet vystihuje podstatu od- borného článku, je spracovaná podľa pravidiel štruktúrova- ného formátu MARC 21, ktorý je špecializovaný pre veľké textové súbory. Každá anotácia sa opatrí selekčnými ná- strojmi, z ktorých najvýznamnejšie sú kľúčové slová. Ďalšími, často využívanými selekčnými nástrojmi sú mená autorov článku, zdroje informácií, tematická oblasť, dátum spracova- nia a prípadne aj ďalšie nástroje podľa vlastných požiadaviek. Všetky selekčné nástroje sa využívajú ako spätné vyhľadá- vače požadovaných informácií danej problematiky. Znalosť viacerých selekčných nástrojov a ich správna kombinácia zvy- šuje úspešnosť rešeršovania. Na základe dôsledného „kľúčo- vania“ všetkých anotačných záznamov vznikol frekvenčný slovník, ktorý je základným pracovným materiálom pri zo- stavovaní tezauru. Abecedne zoradený frekvenčný slovník, z ktorého sa kvôli prehľadnosti vyradili chybné a neaktuálne termíny, je rozdelený na podsúbory, písmená A až Zak jed- notlivým termínom sa postupne prideľujú označenia hierar- chického zaradenia a zaradenie do tematických oblastí (ukážky sú uvedené na obr. 2 a 3).

Hlavným cieľom projektu je zjednotiť terminológiu odborných termínov a vytvoriť riadený súbor technických termínov vy- užiteľný pre rôzne skupiny používateľov. V priebehu riešenia sa realizujú konzultácie s odborníkmi v rámci VÚPC, exter- nistami as odborníkmi z výrobných podnikov.

Posledná verzia tematických oblastí (TO) pre celulózo-papie- renskú a drevospracujúcu problematiku.

TO 1: Drevná hmota, zložky dreva, celulóza, lignín, hemice- lulóza, suroviny na výrobu vláknin, papierenských vláknin, papierov, kartónov, lepeniek a papierenských výrobkov;

TO 2: Recyklácia a spracovanie druhotných surovín a ich vy- užitie v papierenskom priemysle av ďalších odboroch (biopalivá, bioetanol, biorafinácia, nanotechnológie, biomasa a spracovanie celulózy a jej zložiek;

TO 3: Výroba nebielených a špeciálnych druhov vláknin, vrá- tane prania a triedenia vláknin, rôzne chemické pro- cesy, chemikálie a vedľajšie produkty pri výrobe vláknin;

TO 4: Procesy prípravy papierenských vláknin a prídavné pro- striedky pri bielení, mletí, triedení, zušľachťovaní na zlepšenie odvodňovania, retencie atď., vrátane pre- biehajúcich chemických procesov;

TO 5: Technológie výroby papierov, kartónov a lepeniek (vrá- tane nasávaných výrobkov a netkaných textílií);

TO 6: Sortimenty papierov, kartónov a lepeniek a inovované papierenské produkty;

TO 7: Úpravy, zušľachťovanie a spracovanie papierov, kartó- nov a lepeniek;

TO 8 : Polygrafia − suroviny, farby, technológie tlače;

TO 9: Výstavba závodov celpap priemyslu (projekty, obnovy, rekonštrukcie, investície, inovácie strojných a techno- logických zariadení);

TO 10: Prevádzka závodov celpap priemyslu (meranie a re- gulácia, automatizácia, údržba, logistika, prevádzkové procesy);

TO 11: Úspora materiálov, vody a energií, obnoviteľná ener- gia;

TO 12: Ochrana životného prostredia, odpady tuhé, kvapalné a plynné, ekológia;

TO13: Skúšobníctvo,   vlastnosti   fyzikálne,   mechanické, optické, riadenie kvality, analýza;

TO 14: Meracie a regulačné systémy, simulácia procesov, che- mické a systémové inžinierstvo;

TO 15: Manažment, firemné informácie, informácie o firmách; TO 16: Ekonomika a výskum v celpap priemysle, bioekonomika, štatistika, bázy dát, informatika.

Hlavná hierarchická zostava je zložená zo 16 tematických ob- lastí, ktoré zohľadňujú hlavné technologické procesy v celu- lózo-papierenskom  priemysle  a  súčasne  aj  informácie z podporných odborov a postupov výroby rôznych neštan- dardných produktov spracovávania drevnej suroviny. Práve táto oblasť je v poslednom období predmetom záujmu rôz- nych projektov a výskumných úloh. Tento druh informácií sa zhromažďuje v TO 2: Recyklácia a spracovanie druhotných surovín a ich využitie v papierenskom priemysle a ďalších od- boroch (biopalivá, bioetanol, biorafinácia, nanotechnológie, spracovanie biomasy a celulóza a jej zložky). Pri zostavovaní TO boli využité aj podklady zahraničných báz dát, prípadne tezaurov. Vyskytujú sa prípady možnosti zaradenia hlavných,resp. širokých termínov do viacerých TO. V tejto etape rieše- nia sa zatiaľ pracuje s dvomi možnými zaradeniami do TO, ktoré sa budú počítačovo spracovať a triediť. Číselná indexá- cia, ktorá je predmetom ďalšej etapy riešenia, bude pripra- vená pre vstupy nových termínov, aktualizáciu, prípadne pri zaraďovaní termínov do viacerých TO. Súbor TO je otvorený pre aktualizáciu termínov aj pre zmeny TO.

Najvhodnejším praktickým príkladom tvorby tezauru a jeho využívania je súčasný hlavný záujem VÚPC zameraný na rie- šenie problémov z oblasti ochrany životného prostredia, zni- žovania  tekutých  odpadov,  plynných  a  tuhých  odpadov z výroby (TO 12). Znižovanie surovinových, prevádzkových nákladov a minimalizácia spotreby energie (TO 11) patria tiež k problematike, ktoré sú pre výrobné podniky čoraz viac stre- dobodom záujmu, čo sa odráža aj v zvýšenej frekvencii kľú- čových slov, napríklad v oblasti spotreby energie, sledovanie prevádzkových a investičných nákladov. Firmy majú záujem o riešenie problematiky spojenej s minimalizáciou spotreby energie, využívania trvalo obnoviteľných lignocelulózových zdrojov, využívania odpadov na výrobu vedľajších produktov. Tento trend sa v technickej terminológie prejaví vznikom no- vých termínov, ich zvýšenej frekvencie výskytu v porovnaní s predchádzajúcim obdobím, ako napríklad u termínov bioe- tanol, biopalivá, nanotechnológie (TO 2). Uvedené skutoč- nosti podporujú nutnosť vytvoriť otvorený a flexibilný systému tezauru, hlavne pre jeho priebežnú aktualizáciu. Praktické využívanie riadeného slovníka technických termí- nov je prevažne u pracovníkov z oblasti výskumu a informá- cií. Potvrdzuje sa však záujem o prácu s terminológiou, o vznik nových, prípadne aktualizovaných termínov u pra- covníkov vo výrobných firmách, ktorí majú v svojej pracovnej náplni inovácie a technický rozvoj vo firmách.

Hlavným charakteristickým znakom uvedeného komplexného informačného systému je orientácia na koncového používa- teľa na všetkých úrovniach poskytovania informácií; od sig- nálnych informácií získaných z orientačných prieskumov odbornej literatúry cez rešeršné podklady pre výskumné, štu- dijné a rozhodovacie práce, projekty až po zabezpečenie ori- ginálov,   prípadne   skenovaných  požadovaných  článkov z odborných publikácií. Komplex informácií získavaný z rôz- nych zdrojov následne slúži na porovnanie úrovne výskumu a vývoja riešených, pripravovaných a plánovaných úloh a pro- jektov. Potvrdzuje sa vzájomná prepojenosť dosiaľ budova- ného komplexného informačného systému a samotnej tvorby tezauru, keďže pri ich tvorbe sa využívajú poznatky a vý- sledky jednotlivých informačných aktivít.


Literatúra

(1) STN ISO 2788 „Dokumentácia Pokyny pre tvorbu a vývoj jednojazyčného tezauru, SÚTN 2011

(2) EuroVoc, Multilingual thesaurus, http“eurovoc, europa.eu

(3) Polytematický strukturovaný heslář. Státní technická kni- hovna: Praha, 1996.

(4) Thesaurus of pulp and paper. Institue of Paper Science and Technology: Kanada, ISBN 0-810-000-9..

Projekt riešený s podporou APVV SR.

Share: