LuraDocument.jpm: perspektivní kompresní formát pro skenované dokumenty - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

LuraDocument.jpm: perspektivní kompresní formát pro skenované dokumenty

komprese

19. listopadu 2003, 00.00 | Až pětisetnásobnou redukci objemu při zachování čitelnosti textu a kvalitního zobrazení
grafiky slibuje formát, postavený na standardu JPEG2000. Přichází revoluce v ukládání a
přenosu elektronických dokumentů?

Publikační formáty, umožňující výrazně vyšší kompresi skenovaných dokumentů, než ty doposud zavedené, se stávají stále více žádoucí v nejrůznějších oblastech. Příkladem nám může být především elektronické publikování, které potřebuje přenášet informace i nepříliš prostupnými linkami (bezdrátová spojení, telefonní připojení aj.) a na paměťově omezená zařízení (PDA, mobilní telefony). Své si nárokuje také ukládání dokumentů: vedle tradičního archivování se stále více hlásí o slovo tzv. document imaging, disciplina, kladoucí si za cíl převést postupně veškerou práci s dokumenty v daném provozu na elektronickou bázi. Ve výčtu zajímavých a potřebných aplikací bychom pak mohli ještě dále pokračovat.

Není tedy divu, že se objevují snahy nahradit objemově neúnosný TIFF, pro text nepříliš vhodný JFIF (nepřesně JPEG), ale dokonce i přece jen výrazně optimálnější PDF novým formátem, který by pro skenované dokumenty poskytl ještě vyšší kompresní poměr a spolu s tím i další potřebné vlastnosti. Před časem jsme takto psali o příslušných řešeních společnosti LizardTech, opírajících se o formáty DjVu a MrSID. Dnes bychom se rádi věnovali nedávno uvedenému formátu LuraDocument.jpm společnosti Algo Vision LuraTech.

Základní přiblížení

Ti, kdo sledují situaci na poli kompresních formátů, asi ví, že LuraTech není v dané oblasti žádným nováčkem. Již před několika lety se poměrně úspěšně prosadila se svými kompresními formáty LuraWave (grafika) a LuraDocument (dokumenty). Dnes tyto formáty přebudovává tak, aby byly postaveny na algoritmech standardu JPEG2000. Cílem takovéhoto převodu je především učinit ze stávajícího proprietárního řešení všeobecně akceptovanou technologii. Již po nějaký čas takto LuraTech poskytuje pro kompresi grafiky LuraWave.jp2. V letošním roce, a to zvláště v posledních měsících, pak přichází s formátem LuraDocument.jpm, určeným pro skenované barevné dokumenty.

jpm1f.gif

Porovnání vlastností LuraDocument.jpm s jinými formáty. (Převzato z materiálů výrobce.)

LuraDocument.jpm se opírá o specifikaci JPEG2000/Part 6 (ke stažení zde), která definuje souborový formát (označovaný zkratkou JPM) pro vícestránkové dokumenty, obsahující text a grafiku. Při kompresi je využito rozčlenění každé stránky dokumentu do tří vrstev. První obsahuje textovou informaci, zachycenou v podobě bitonální (bilevel) grafiky. Druhá vrstva obsahuje informace, týkající se obarvení textových částí. Konečně třetí vrstva pak popisuje veškerou ostatní grafiku. První vrstva je komprimována užitím bezztrátového algoritmu pro Fax G4 formát, druhá a třetí pomocí základního algoritmu JPEG2000/Part 1 pro počítačovou grafiku (založen na vlnkových/waveletových transformacích). Do komprimovaného souboru lze dále vložit miniatury jednotlivých stránek, jejichž využití je závislé na aplikaci, zobrazující dokument v uvedeném formátu.

Uvedené oddělení textové a obrazové vrstvy zaručuje vysoký kompresní poměr - podle údajů LuraTechu je to od 1:150 až po těžko uvěřitelných 1:500 (záleží na obsahu dokumentu) - přičemž i při velmi vysoké kompresi zůstává text stále čitelný (připomínáme, že je komprimován bezztrátově) a grafika výrazně kvalitnější, než u zavedených kompresních formátů. Uvedené charakteristiky přitom platí pro dokumenty, skenované v rozlišení 300 dpi a vyšším.

jpm2f.gif

Schema převodu do JPM. (Převzato z materiálů výrobce.)

Způsoby nasazení

Využití LuraDocumentu.jpm může být poměrně různorodé: nejlepším důkazem jsou příklady, které LuraTech prezentuje na svých stránkách. Ty naznačují, jak užitečný může být uvedený formát například při ukládání map na katastrálních úřadech (v Německu či Lucembursku se takto prosadil již původní LuraDocument) či archivaci vzácných tisků v knihovnách. Možné je ale i nasazení na pre-pressových pracovištích při zálohování vzhledu tištěné publikace či v kancelářích pro zmíněný document imaging (korespondence, oběžníky, cestovní doklady, účtenky aj.). Nasnadě je pak publikování elektronických dokumentů prostřednictvím intranetu či Internetu.

Nástroje

K tomu, aby byl LuraDocument.jpm skutečně takto všestranně použitelný, je samozřejmě zapotřebí odpovídajících nástrojů. Těch dnes LuraTech poskytuje celou řadu. Za základní z hlediska širšího rozšíření formátu lze přitom považovat odpovídající freewarovou Active X komponentu, dovolující prohlížení dokumentů v uvedeném formátu v Internet Exploreru (zatím ovšem pouze na platformě Windows). V kompetenci uvedeného produktu je progresivní zobrazení (náhled se zobrazuje již po přenesení části souboru), zvětšení pohledu a konverze do formátů TIFF či BMP. Zobrazení je pak s pomocí odpovídajícího pluginu možné i v prostředí Microsoft Office, tento produkt je ovšem nabízen za ne právě nízkých 142.80 USD. Stejně tak je překvapivě zpoplatněn (byť podstatně příznivějšími 31 USD) i plugin, umožňující prohlížet i vytvářet dokumenty ve zmíněném formátu v populárním freewarovém prohlížeči IrfanView.

K tvorbě dokumentů v uvedeném formátu pomocí skeneru (TWAIN rozhraní) či převodem z formátů BMP, TIFF či JPEG je určena samostatná aplikace Capture. Dávkové nasazení z příkazové řádky zajišťuje Command Line Tool (2160 USD), za ne právě lidovou cenu (3900 USD) poskytuje LuraTech vývojový prostředek C-SDK. Zvýšenou pozornost pak zaslouží vzhledem ke své koncepci produkt PdfCompressor. Ten totiž dokument, vytvořený převodem z formátů TIFF, JPEG, BMP a PNM "zabalí" do PDF dokumentu, který pak uživatelé mohou prohlížet pomocí Acrobatu či Readeru (pro podporu JPEG2000 je zapotřebí verze 6). Dobrou myšlenku ovšem opět kazí cenové podmínky: prajednoduchá verze Desktop je za 238.8 USD a to je k ní podle všeho zapotřebí koupit licenci na převody (tzv. Cartridge - od 1200 USD za převod 200000 stránek). O horké složky vylepšená verze Server s Cartridge na 250000 stránek pak přijde na víc jak 7000 USD.

Nastavení PdfCompressoru.

Závěrem

LuraTech deklaruje LuraDocument.jpm jako svého typu první řešení, implementující specifikaci JPEG2000/Part 6. Po stránce technologické je tento formát určitě zajímavý především vynikajícími kompresními poměry při zachování kvality zobrazení textu i grafiky. Stejně tak je třeba pochválit rozsáhlé produktové portfolio, které již dnes LuraTech pro svou verzi JPM poskytuje, i když cenové podmínky nejsou vždy právě optimální. Bude tedy zajímavé sledovat, jak se bude dál situace kolem zmíněného formátu a potažmo i specifikace JPEG2000/Part 6 vyvíjet.

Tématické zařazení:

 » Rubriky  » Go verze  

 » Rubriky  » Polygrafie  

 » Rubriky  » Download  

 » Rubriky  » PDF - Adobe Acrobat  

 » Rubriky  » Skenery  

 » Rubriky  » Software  

Poslat článek

Nyní máte možnost poslat odkaz článku svým přátelům:

Váš e-mail:

(Není povinný)

E-mail adresáta:

Odkaz článku:

Vzkaz:

Kontrola:

Do spodního pole opište z obrázku 5 znaků:

Kód pro ověření

 

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: