DIGITAL HUMANITIES A AUTOMATICKÁ TRANSKRIPCIA RUKOPISNÝCH TEXTOV/DIGITAL HUMANITIES AND AUTOMATIC TRANSCRIPTION OF HANDWRITTEN TEXTS
Hlavné článkyautomatická transkripciadigital humanitiesrukopisy
Autor uvažuje o koncepte digital humanities. Poukazuje na naplnenie tohto konceptu na Slovensku od 70. rokov 20. st. Autor považuje pojem digital humanities za spoločné pomenovanie a prierezovú metodológiu pre všetky aplikácie informačných a komunikačných technológií (IKT) v spoločenských a humanitných vedách, odboroch a disciplínach a im zodpovedajúcej praxi. Jadro štúdie je zamerané na stručnú charakteristiku európskeho výskumného projektu READ = Recognition and Enrichment of Archival Documents1,2, ktorého riešenie prebiehalo v rokoch 2016 – 2019 v rámci programu Horizon 2020. Výskumný projekt podliehal priamo Európskej komisii a bol ročne hodnotený nezávislými hodnotiteľmi3. Hlavným výstupom projektu je platforma a nástroj Transkribus, ktorý predstavuje zásadnú svetovú inováciu zameranú na transkripciu historických rukopisov a dokumentov.
Autor, ako jeden z hodnotiteľov projektu READ, popisuje svoje skúsenosti a poznatky získané pri experimentálnej transkripcii rukopisných listov Andreja Kmeťa. Vysvetľuje svoj pohľad na Digital humanities, ako na metodologický kontext projektu a stručnú charakteristiku procesu skenovania, nahrávania obrazov, segmentácie a automatickej transkripcie, ako aj konkrétne príklady automatickej transkripcie rukopisných listov Andrej Kmeťa a výsledky experimentu.
DIGITAL HUMANITIES AND AUTOMATIC TRANSCRIPTION OF HANDWRITTEN TEXTS
The author examines the concept of digital humanities and its content in Slovakia since the 1970s. The author considers the term digital humanities to be a common name and cross-cutting methodology for all applications of information and communication technologies (ICT) in the social sciences, humanities and the disciplines and their corresponding practice. The core of the study is focused on a brief description of the READ European research project (Recognition and Enrichment of Archival Documents), implemented in 2016 – 2019 under the Horizon 2020 programme.
The research project was directly submitted to the European Commission and evaluated annually by independent evaluators. The main output of the project is the Transkribus platform and tool, which represents a major worldwide innovation focused on transcription of historical manuscripts and documents. The author, as one of the evaluators of the READ project, describes his experience and knowledge gained during the experimental transcription of Andrej Kmeť‘s manuscripts, explains his view of Digital Humanities as a methodological context of the project and brief characteristics of the process of scanning, recording images, segmentation and automatic transcription, as well as examples of automatic transcription of handwritten texts by Andrej Kmeť and the results of the experiment.
DIGITAL HUMANITIES A AUTOMATICKÁ TRANSKRIPCIA RUKOPISNÝCH TEXTOV