ABBYY FineReader 10: rychlý OCR převod skenovaných a nafocených dokumentů - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

ABBYY FineReader 10: rychlý OCR převod skenovaných a nafocených dokumentů

sw software

13. října 2009, 00.00 | Převod textů ze skenovaných či nafocených podkladů do editovatelné podoby umožňuje OCR aplikace FineReader, jejíž jubilejní desátá verze přináší několik zajímavých novinek. Analýza předloh i samotný OCR proces jsou FineReaderu 10 velmi rychlé, přičemž využívat můžete hromadné zpracování více stran i vestavěný editor bitmapových či textových dokumentů. Podrobnější popis aplikace vám nyní nabízíme.

ABBYY FineReader je OCR aplikace, s pomocí které lze velmi snadno převádět skenované dokumenty do klasických editovatelných textů, tabulek a případně i čárových kódů. FineReader 10 existuje zatím jen ve verzi pro Windows, pro Mac OS X je zatím nabízena pouze starší „retardovaná“ verze Express za 89 EUR.

V prodeji je mimo běžné varianty Professional (139 EUR) ještě editace Corporate a pro větší firmy ještě edice Site Licence – obě poslední jmenované edice obsahují podporu síťových funkcí a Windows Server 2003/2008 a umí též sledovat obsah zvolených adresářů a e-mailových schránek.


ABBYY FineReader Professional 10 - úvodní obrazovka s nabídkou hlavních funkcí programu

Novinky

OCR proces ve FineReaderu si poradí s celkem 186 jazyky, z nichž lze pro 39 jazyků používat vestavěný speller s podporou uživatelských slovníků Microsoft Wordu. Pominu-li běžné marketingové výrazy ve stylu OCR proces je opět rychlejší a přesnější, zbývá v novinkách desáté stěžejní verze FineReaderu ještě několik jiných užitečných novinek. Jednou z nich je patentovaná ADRT analýza vícestránkových dokumentů do podoby jednoho spojitého dokumentu a vylepšený OCR proces pro nafocené předlohy dokumentů, které je možné do programu importovat například přímo z paměťové karty digitálního fotoaparátu.

Vylepšení doznala také analýza jazyků použitých v jednotlivých dokumentech, přičemž pro OCR proces je podporováno i více jazyků v jednom dokumentu. Další inovace se týkají pohodlnější tvorby poznámek pod čarou, přizpůsobení tzv. font matchingu písem nainstalovaných ve Windows a generování rejstříků. Pro nás asi bezvýznamnou novinkou je podpora korejštiny, kterou doplňuje ještě rozšířená podpora hebrejštiny.


ABBYY FineReader Professional 10 - převedený text s aktivním editorem

Ovládání aplikace usnadňuje startovací obrazovka, upravené grafické rozhraní (včetně integrovaného textového editoru) a přehled rychlých úloh, které současně defacto fungují jako velmi jednoduchý průvodce celým OCR procesem a jsou nabízeny GUI aplikace v různých pracovních situacích. Novinkou u exportu „OCRkovaných“ dokumentů je možnost ukládání ebooků ve formátu HTML, který může obsahovat i nadefinované kapitoly a různé styly. Trochu lepší je komprese u exportovaných PDF dokumentů, které lze také archivovat v optimalizovaném formátu PDF/A.


ABBYY FineReader Professional 10 - layout naskenovaného/importovaného dokumentu umí FineReader automaticky analyzovat, sekce s textem, grafikou či případně čárovými kódy pro následný OCR proces můžete vyznačit také ručně

Skenování, import a úpravy předloh

FineReader 10 umí skenovat předlohy z celé řady TWAIN a WIA kompatibilních lokálních i síťových skenerů, a to dvěma způsoby. Prvním z nich je vlastní skenovací modul FineReaderu s poměrně jednoduchým ovládáním a možností skenovat více dokumentů či jejich částí. Druhá možnost je pak použití skenovacího modulu z Windows či dodávaného přímo ke skeneru. Naskenované nebo vyfocené dokumenty lze do programu pochopitelně též importovat v různých formátech, pro zpracování nafocených dokumentů je doporučen fotoaparát s rozlišením od 5 Mpix výš.


ABBYY FineReader Professional 10 - modul pro skenování dokumentů


ABBYY FineReader Professional 10 - naskenované či importované předlohy si můžete jednoduše natočit a barevně či jinak obrazově je upravit přímo ve FineReaderu

Všechny bitmapové předlohy můžete rovnou ve FineReaderu upravit. Úpravy zahrnují především různé korekce zkreslení naskenovaných/vyfocených dokumentů včetně opravy trapézového zkreslení, narovnání řádků s textem, rozdělení stránky na více částí a samozřejmě i manuální natočení stránky, její oříznutí a jednoduché mazání nevhodných objektů. Součástí korekčních funkcí je dále i potlačení šumu u importovaných digitálních fotografií a jejich zaostření.

Analýza layoutu a čárové kódy

Sekce s čárovými kódy umí ve skenovaných či importovaných dokumentech FineReader 10 rozpoznat sám. Stejně tak se před OCR procesem analyzuje celá plocha předlohy a vyznačí se bloky textu, bloky s grafikou, tabulkami a jinými speciálními objekty. Rozmístění a layout jednotlivých bloků můžete upravit či nadefinovat ručně, slouží k tomu několik nástrojů na tvorbu rámečků. Čárových kódů rozpozná FineReader zhruba dvacet typů, patří mezi ně i novinky verze 10 v podobě typů Aztec Code a Data Matrix.


ABBYY FineReader Professional 10 - výběr jazyků pro OCR proces


ABBYY FineReader Professional 10 - preference programu pro skenování a import dokumentů

Rychlost OCR procesu

Největší spotřebu času si většinou nárokuje analýza layoutu naskenovaného či importovaného dokumentu, které může zabrat až desítky sekund u stran formátu A4. Samotný převod textů a celého layoutu předlohy je už pak poměrně rychlý, jedná se zpravidla o jednotky sekund. Na každou stranu A4 počítejte tedy v průměru s minimálně půlminutou času (bez skenování) pro kompletní analýzu a převod dané strany, kterou pak FineReader zobrazí ve svém vestavěném editoru.

Pro zpracování předloh s vysokým rozlišením a jednoduchým layoutem je k dispozici mód Fast Reading, který pracuje více než 2x rychleji než při analýze komplexních layoutů dokumentů.


ABBYY FineReader Professional 10 - výběr "typů" písem pro OCR proces

Úpravy a export dokumentů

Ještě před uložením dokumentů lze v integrovaném editoru FineReaderu převedené texty vhodně zkorigovat s pomocí spelleru (kontrolu gramatiky FineReader 10 nenabízí) – upravit styly textů a další běžné vlastnosti dostupné u editovatelných dokumentů včetně případné tvorby hyperlinků.
Hotové dokumenty zpracované OCR procesem můžete ukládat v celé řadě formátů, ve kterých může být obsažen i layout původních předloh. Pro export nabízí FineReader 10 například formáty DOC, DOCX, XLS, XLSX, PPTX, RTF, PDF (včetně zabezpečení), PDF/A, HTML, CSV a TXT, vloženou grafiku lze samostatně ukládat v různých bitmapových formátech.


ABBYY FineReader Professional 10 - volby pro ukládání RTF/DOC/DOCX dokumentů


ABBYY FineReader Professional 10 - nastavení bezpečnostních prvků pro exportované PDF dokumenty


ABBYY FineReader Professional 10 - integrovaný speller umožňuje zkontrolovat text ještě před jeho uložením


ABBYY FineReader Professional 10 - u výběru slovníku pro speller najdeme i podporu uživatelských slovníků MS Wordu

Závěr

FineReader 10 je program na úrovni. Jednoduché ovládání i používání aplikace doplňuje další klad, kterým je sofistikovaný OCR engine, jehož rychlost vynikne především na vícejádrových procesorech. Česká lokalizace grafického rozhraní FineReaderu 10 není k dispozici, s češtinou jako takovou ale program nemá žádné problémy. Převedené dokumenty je občas zapotřebí prohnat ještě spellerem (zejména nadpisy s exotičtějšími fonty), svůj smysl má pak i export dokumentu do MS Wordu a zběžná kontrola gramatiky.

15 denní zkušební verzi FineReaderu si můžete stáhnout zdarma z webových stránek společnosti ABBYY Software. Trial verze je omezena maximem 50 stránek a exportem převedených dokumentů.


ABBYY FineReader Professional 10 - úprava klávesových zkratek pro ovládání aplikace


ABBYY FineReader Professional 10 - doplňková utilita Screenshot Reader k pořizování screenshotů


ABBYY FineReader Professional 10 - Automation Manager slouží k automatizaci prováděných akcí


ABBYY FineReader Professional 10 - součástí vestavěného textového editoru je i funkce na tvorbu hyperlinků


ABBYY FineReader Professional 10 - nastavení stylů textu pro editor a HTML výstup

Tématické zařazení:

 » Rubriky  » VSE  

 » Rubriky  » Go verze  

 » Rubriky  » PDF - Adobe Acrobat  

 » Rubriky  » Skenery  

 » Rubriky  » Software  

Diskuse k článku

 

Vložit nový příspěvek   Sbalit příspěvky

 

Zatím nebyl uložen žádný příspěvek, buďte první.

 

 

Vložit nový příspěvek

Jméno:

Pohlaví:

,

E-mail:

Předmět:

Příspěvek:

 

Kontrola:

Do spodního pole opište z obrázku 5 znaků:

Kód pro ověření

 

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: