ABBYY FineReader 9.0: nová verze OCR balíku s podporou češtiny - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



VSE

ABBYY FineReader 9.0: nová verze OCR balíku s podporou češtiny

sw software

23. října 2007, 00.00 | OCR balík na převod skenovaných grafických dokumentů do podoby editovatelných textů dospěl již do deváté, stěžejní verze. Vzhledem k nativní podpoře
češtiny i slovenštiny pro OCR proces je FineReader zajímavý i pro české uživatele a povíme si tedy o něm něco více.

ABBYY FineReader je OCR aplikace na rozpoznávání a převod skenovaných či importovaných textových dokumentů v grafické podobě do podoby čistého (tzn. editovatelného) textu. Program navíc umí vytvářet PDF dokumenty a ukládat DOC, RTF a další formáty dokumentů s původním layoutem skenované předlohy. Dále dokáže rozpoznávat a do textové podoby převádět skenované dokumenty s umělými jazyky (Esperanto, Interlingua, Ido aj.), jednoduché chemické vzorce a také různé zápisy v programovacích jazycích typu Basic, C/C++, COBOL, Fortran, Java, Pascal aj.

ABBYY FineReader existuje pouze ve verzi pro Windows, konkrétně pro Windows 2000/XP/2003/Vista. Evropská cena programu ve verzi Professional (určené koncovým uživatelům) je 159 EUR, upgrade z předchozích verzí stojí 99 EUR. K dispozici je dále verze FineReader 9 Corporate Edition s cenou 999 EUR, jejíž součástí je neomezený počet instalací v rámci sítě a tři současně aktivní licence (= počet uživatelů pracujících v daný čas) programu.

Podpora mnoha jazyků

O FineReaderu 9.0 lze bez sebemenšího zaváhání prohlásit, že se jedná o vícejazyčný systém, neboť podporuje 179 jazyků, jejichž texty tudíž umí rozpoznat a převést do editovatelné podoby. Pouze necelé čtyři desítky jazyků ale obsahují i slovník pro kontrolu pravopisu, čeština i slovenština ale do této skupiny patří.


ABBYY FineReader 9.0 - podrobné nastavení posloupnosti jazyků používaných v rámci OCR procesu


ABBYY FineReader 9.0 - výběr slovníku pro nastavení kontroly pravopisu

Prostředí aplikace a možnosti práce s dokumenty

Upravené grafické rozhraní dnes nabízí prakticky každá z nových stěžejních verzí aplikací, a FineReader 9.0 proto není výjimkou. Systém oken s náhledy layoutu předlohy, výstupním oknem s převedeným textem a případným náhledem originálního grafického dokumentu je velmi přehledný a nelze mu prakticky nic vytknout.

Všechny důležité operace jsou většinou dostupné na jedno kliknutí myší, případně v rámci různých průvodců. Jedním z nich je i integrovaný editor grafických objektů a předloh, ve kterém si můžete naskenovanou předlohu například oříznout, změnit její rozlišení či natočení a také jednoduše vyretušovat nepotřebné plochy. Samozřejmostí je rovněž vestavěný Automation Manager pro hromadné zpracování dokumentů, prostřednictvím kterého lze například konvertovat předlohy do formátu PDF či DOC, tabulky do XLS apod.


ABBYY FineReader 9.0 - prostředí OCR aplikace s okny pro analýzu layoutu naskenované předlohy, okna s převedeným textem a oknem pro kontrolu grafické předlohy


ABBYY FineReader 9.0 - součástí programu jsou též různé imageprocessingové funkce pro natočení, ořez a další úpravy naskenované či importované předlohy

Analýza předloh a OCR proces

Převedení naskenované předlohy ve FineReaderu se skládá z několika kroků, přičemž část z nich program automatizuje v rámci technologie adaptivní analýzy vzhledu a struktury předlohy. Součástí zmíněné softwarové technologie ADRT (Adaptive Document Recognition Technology) je stejně jako u dalších profesionálních OCR aplikací automatické rozpoznání sloupců textu, grafických objektů, tabulek a dalších speciálních objektů, které pak dostane na starost samotný OCR proces. Každá strana skenované či importované grafické předlohy je pochopitelně analyzována zvlášť, dalším kladem je pak možnost převádět a de facto rovnou archivovat prakticky libovolné původní papírové předlohy v elektronické podobě.

Vše je opět automatizované, na uživatele pak zpravidla zbývá jen finální uložení převedeného dokumentu ve zvoleném formátu. I když většinou funguje rozpoznání layoutu předlohy poměrně dobře, je občas zapotřebí nadefinovat si některé prvky zpracovávaného dokumentu ručně. K těmto účelům má FineReader 9.0 celou řadu nástrojů pro vyznačení plochy textů, tabulek, obrázků a dalších grafických objektů, na které se pak vztahují odlišné vlastnosti pro OCR proces.

Novinky

Nejprve rychlá zmínka o vývojářských (a možná tak trochu i marketingových) sděleních. Podle „firemních“ testů společnosti ABBYY je na tom FineReader 9.0 z hlediska analýzy a celkové přesnosti rozpoznávání dokumentů o více než třetinu lépe než verze 8.0, konkrétně především u grafických předloh s tabulkami a vícejazyčnými texty. Lepší a výkonnější by měl být program i u dokumentů nafocených digitálním fotoaparátem.

Mnohem zajímavější je možnost relativně přesné rekonstrukce layoutu skenované předlohy, včetně již zmíněných tabulek a rozvržení grafických objektů na stránce. Součástí analýzy předloh je i automatická konverze stylů písma a formátování odstavců, které můžete částečně ovlivnit v předvolbách programu. Načíst lze do FineReaderu 9.0 také formát XPS (XML Paper Specification) navržený a vyvíjený Microsoftem jako alternativa k formátu PDF.

Vylepšeno bylo i rozpoznávání čárových kódů a konverze do PDF dokumentů, zahrnující podporu vyhledávání v PDF dokumentech (tzn. text je v jiné vrstvě než grafika) a možnosti ukládání PDF souborů se zabezpečením či souborů optimalizovaných pro Web. Vylepšena byla i utilita Screenshot Reader pro zachytávání obrazovek a jejich odeslání ke zpracování ve FineReaderu. Rozšířený je u FineReaderu 9.0 také přímý export zpracovaných výsledků do vybraných aplikací typu MS Word, MS PowerPoint, Adobe Reader, případně do různých HTML editorů apod. Výsledky z FineReaderu 9.0 lze nově exportovat i ve formátech PDF/A (jedná se o formát primárně doporučený pro archivaci dokumentů) a také ve formátech DOCX a XLSX pro Microsoft Office 2007.


ABBYY FineReader 9.0 - Automation Manager slouží k hromadnému zpracování dokumentů


ABBYY FineReader 9.0 - předvolby pro export formátů DOC, RTF aj.

Závěr

FineReader 9.0 je klasickou ukázkou toho, jak prospěšná a přitom jednoduše ovladatelná může být dobře navržená OCR aplikace, kterou lze využít nejen na převod textů do editovatelné podoby, ale také třeba na běžnou archivaci skenovaných dokumentů. Škoda jen, že program není k dispozici i v nějaké Lite, SE atp. verzi s nižší cenou při třeba menších jazykových možnostech pro konkrétní jazyk (či skupiny jazyků). Částečnou nevýhodou oproti OCR konkurenci je možná i nedostupnost české lokalizace menu pro verzi 9.0, i když to pro cílovou skupinu uživatelů FineReaderu zřejmě nebude nijak podstatné. Zkušební verzi FineReaderu si můžete stáhnout zdarma na webových stránkách produktu.


ABBYY FineReader 9.0 - kontrola pravopisu funguje samozřejmě i pro češtinu


ABBYY FineReader 9.0 - nastavení vlastností náhledů grafiky ve zpracovávaných předlohách


ABBYY FineReader 9.0 - předvolby aplikace pro import a skenování dokumentů


ABBYY FineReader 9.0 - program umí vytvářet a ukládat také PDF dokumenty

Tématické zařazení:

 » Rubriky  » VSE  

 » Rubriky  » Go verze  

 » Rubriky  » Download  

 » Rubriky  » Skenery  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: