FineReader – konverzia papierových dokumentov do elektronickej podoby
Predstavujeme
FineReader 5.0 je softvér pre OCR (optické rozpoznávanie znakov), ktorým sa text z papierového dokumentu prepíše do
textového editora vášho počítača. Jednoducho ”prenesiete” pomocou skenera text do PC a FineReader ”prečíta” a uloží text bez
prepisovania.
FineReader robí tú istú prácu ako pisárka na stroji, avšak desaťkrát rýchlejšie a urobí dvaaž trikrát menej
chýb.
Ako pracuje softvér FineReader 5.0?
Pre slovenských používateľov je dôležitá informácia, že celé prostredie pri práci na obrazovke je lokalizované a
komunikuje po slovensky.
Používateľské rozhranie má jednoduchý spôsob obsluhy. Na obrazovke je vidieť v štyroch pracovných oknách zoskenované
dokumenty, strany, ktoré sa spracovávajú, výsledok rozpoznávania a v samostatnom okne sa zobrazujú detaily.
Spracovávať možno naraz aj viacstranové dokumenty. Program automaticky urobí analýzu strany a vykoná rozpoznanie.
Používateľ má, samozrejme, možnosť samostatne nastaviť niektoré parametre (jazyk rozpoznávaného textu, druh rozpoznávaných
objektov – tabuľka, obrázok, text alebo čiarový kód) pomocou počítačovej myši.
Na kontrolu rozpoznaného textu slúžia zabudované nástroje pre úpravu textu a slovníky na kontrolu pravopisu
rozpoznaného textu. FineReader rozpoznáva 176 jazykov vrátane slovenčiny, češtiny a ”učí sa” aj nové znaky.
Okrem presnosti rozpoznávania je najsilnejšou prednosťou FineReadera oproti iným OCR programom presné zachovanie
usporiadania dokumentu:
- úplné zachovanie farby a fontov rozpoznaného textu,
-
rozpoznávanie indexových znakov (superscript a subscript) a jednoduchých chemických vzorcov (záznamy ako napr. Se2+,
H2O a C2H5OH sú teraz v poriadku), -
tabuľky sú prenesené ako tabuľky a je možné ich takto upravovať (zlučovať, rozdeľovať bunky, vkladať riadky,
…) - rozpoznávanie zvislého textu a obrázkov v bunkách tabuľky,
- zachovanie vzhľadu písma (napr. tučné, kurzíva, rozstup slov a riadkov atď.),
-
zachovanie usporiadania dokumentu (analyzuje sa, ktorá časť dokumentu obsahuje textové stĺpce, tabuľky, alebo
obrázky), - obrázky sú prenesené ako ”objekty” a je možné ich takto upravovať (zväčšovať, zmenšovať, presúvať, kopírovať).
Na využitie v knižniciach predurčuje FineReader schopnosť skenovať stránky z kníh. Táto voliteľná vlastnosť umožňuje
naskenovať naraz dvojitú stránku a potom spracovať na účely túto dvojitú stránku rozdeliť na dve samostatné stránky.
Zošikmenie je korigované pre každú stránku zvlášť a keď je spracovanie ukončené, každá stránka sa uloží samostatne.
Týmto postupom sa dosahujú oveľa lepšie výsledky rozpoznávania.
Výsledok rozpoznávania je možné uložiť do súboru vo viacerých formátoch:
- Mikrosoft Word 95, 97, 2000
- Rich Text Format, Text
- Unicode Text
- Mikrosoft Excel 95, 97, 2000
- HTML, DBF, CSV, PDF
Uložiť dokument do obľúbeného HTML a PDF je výhodné pre jeho umiestnenie na internetovú stránku.
Presnosť rozpoznávania znakov predstavuje vo FineReaderi svetovú špičku. Len v minulom roku získal FineReader takmer 20
svetových ocenení. K tohtoročným oceneniam patrí aj jedno slovenské – cena Počítadlo 2001 za najpokrokovejší softvér, udelená
na výstave COFAX v Bratislave.
Ktorý kúpiť?
Pre profesionálne využitie v knižniciach je možné odporučiť dve verzie FineReadera:
FineReader 5.0 Pro – je určený na inštaláciu pre samostatné pracovné stanice. Cena tejto verzie je 5 250,Sk (bez
DPH).
FineReader 5.0 Office – je možné inštalovať ho v sieti na server alebo jednotlivé pracovné stanice. Používatelia môžu
potom spracovávať pomocou OCR dokumenty z jedného skenera na viacerých PC. Navyše verzia Office obsahuje aplikáciu Formulator
pre vyplňovanie a tlač formulárov vytvorených používateľom alebo načítaných pomocou skenera, rozpoznáva aj čiarové kódy a
spolupracuje so systémami pre správu dokumentov. Cena verzie Office za 3 licencie je 21 150,Sk (bez DPH).
Nároky na inštaláciu
Minimálne nároky na inštaláciu oboch verzií programu FineReader 5.0 sú PC 133 MHz, MS Windows 95, RAM 32 MB, CD-ROM,
3,5”.
Podporované skenery
FineReader 5.0 spolupracuje so všetkými na trhu dostupnými skenermi značiek:
Acer, AGFA, Artec, Avigramm, Avision, Canon, E-Lux, Epson, Fujitsu, Genius, HP, IBM, Kodak, Logitech, Lumina, Microtek,
Minolta, Mitsubishi, Mustek, Nikon, Optrox, Packard, Bell, PIE, Plustek, Primax, Proton, Otronix, Relisys, Ricoh, Samsung,
Scanpaq, Syscan, Silitek, Storm, Tamarack, UMAX, Visioneer, Xerox…a s viac než 100 modelmi 100 % TWAIN – kompatibilných
skenerov od iných výrobcov.
Spracovanie kartoték a formulárov
Uložiť dáta z formulárov a kartoték bez prepisovania možno pomocou skenera a softvéru na ”čítanie dát” ABBYY FormReader
4.1.
Tento softvér vie ”prečítať” okrem tlačeného písma aj rukou písané paličkové písmo a uložiť tieto informácie do
databáz. Presnosť rozpoznávania sa dá zvýšiť nastavením rôznych verifikačných pravidiel, t. j. rozpoznané znaky sa môžu
automaticky kontrolovať podľa druhu (číslice, dátum, písmená…), alebo porovnávať s existujúcimi databázami (PSČ, mená…),
načítavať do databázy sa dajú aj rôzne objekty (obrázky, fotografie, podpisy a pod.).
Pre skutočne hromadné spracovanie formulárov (až niekoľko stotisíc za deň) slúži systém na strojové spracovanie
viacstranových formulárov ABBYY Enterprise Forms.
Podrobnejšie informácie o digitalizácii, skenovacích službách a OCR/ICR softvér získate na adresách:
NUPSESO, a. s., Piaristická 2, 949 01 Nitra, tel./fax: ++421 (0)37 6542 381, Drieňová 24, 826 03 Bratislava,
tel./fax:++421 (0)2 4342 7223,
http://www.nupseso.sk ,
nupsexo@nupseso.sk
NUPSESO, a. s., je výhradný distribútor produktov ABBYY FineReader pre Slovenskú a Českú republiku.