Encyklopedie publikačních formátů: DjVu - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

Encyklopedie publikačních formátů: DjVu

formaty

16. května 2005, 00.00 | Po několikaletém útlumu se znovu k životu probouzí formát pro elektronické, zejména
skenované dokumenty DjVu. Na jeho novém vzestupu se přitom nyní výrazněji podílí nejen
komerční výrobci, ale i open source komunita. Pro jaké vlastnosti lze DjVu označit za
vážného konkurenta zavedených formátů typu PDF? A díky jakým nástrojům či aplikacím se
dostává DjVu do popředí zájmu?

Mimo zavedených formátů dnes v publikačním průmyslu nalezneme řadu takových, které si teprve své místo hledají. Vlastnosti těchto nových formátů bývají inovativní a užitečné, prosadit se v nelehké konkurenci, tj. přitáhnout zájem výrobců příslušných řešení a především samotných uživatelů ovšem nebývá snadné. Jedním z formátů, na který se uvedená tvrzení vztahují takřka beze zbytku, je DjVu, technologie, určená ke kódování elektronických dokumentů vzniklých především skenováním. V čem je DjVu tak inovativní, že o něm lze hovořit jako o vážném konkurentovi PDF? Jaký je jeho dosavadní vývoj a jaké pro něj existují nástroje či reálné využití? Na tyto i další otázky bychom rádi odpověděli v našem článku.

Základní charakteristiky

DjVu je, jak již bylo řečeno, formátem pro elektronickou reprezentaci jedno- či vícestránkových dokumentů, a to zejména rastrových, tj. takových, jež byly získány typicky skenováním papírových předloh či převodem z jiných formátů (např. TIFF). Oproti konkurenci vyniká DjVu především vynikajícím kompresním poměrem: soubor barevného skenovaného dokumentu, uloženého v DjVu, je podle údajů ze serveru djvuzone.org 5-10krát menší než ekvivalent v JPEG, stránka o formátu A4 v rozlišení 300 dpi je přitom takto komprimovatelná na 30 až 100 kb z původních 25 MB. V případě černobílých dokumentů je DjVu soubor 3-8krát menší, než obdobný soubor ve formátu PDF, obdobně je tomu v případě TIFF dokumentů využívajících G4 kompresi. Mimo skenovaných dokumentů lze do DjVu převádět i dokumenty například z PostScriptu či PDF, stránka odpovídající rozlišení 300 dpi pak bude mít typicky 15-20 kb.

Klíčem k takto úspěšné kompresi jsou odpovídající použité kompresní algoritmy. DjVu takto staví jednak na vlnkových transformacích (IW44) pro fotografie či malby a dále JB2 kompresi pro bitonální dokumenty (tedy typicky textové či s čárovou grafikou). Kvalitu komprese dále zvyšuje schopnost formátu oddělit od sebe pozadí (textura, obrázky) a popředí (text, čáry) dokumentu. To také dovoluje podstatně kvalitnější vykreslení textu i v dokumentech s vysokým stupněm komprese narozdíl od třeba JPEG. Text lze podrobit OCR proceduře a jeho elektronickou podobu pak dále schraňovat s dokumentem ve zvláštní vrstvě. To znamená, že DjVu dokument může být prohledávatelný a indexovatelný.

encdjvu1f.gif

Skenovaný dokument v DjVu

DjVu je uzpůsoben pro elektronické přenosy (Internet) a to i na pomalých linkách (mobily apod.). Klíčovou vlastností zde je, že se jedná o formát progresivní. To tedy znamená, že se již po přenesení části souboru zobrazí uživateli v prohlížeči náhled dokumentu, který se dalším načítáním zpřesňuje. Nejprve se přitom takto načítá text a čárová grafika, až poté pozadí stránky: to obvykle odpovídá pořadí, v jakém jsou uživateli preferovány informace v dokumentech. Soubor v DjVu zůstává navíc po načtení v paměti v komprimované podobě a dekomprimují se z něj vždy pouze požadované části (zvětšení, skrolování): to dovoluje zpracování i na málo výkonných počítačích. K dalším důležitým vlastnostem DjVu pak patří podpora hypertextových odkazů, anotací a zvýraznění.

Využití

Ponechme zatím stranou, jakým způsobem je dnes DjVu reálně využíván, a podívejme se nejprve na teoretický potenciál tohoto formátu. Ten se odvíjí od skutečnosti, že mnoho dokumentů existuje primárně v papírové podobě - příkladem nám může být stejně dobře kulturní dědictví v podobě starých tisků jako třeba podnikové dokumenty, jejichž elektronická podoba se nezachovala, v polygrafii lze takto uvažovat například o finálním výtisku publikace atp. Ve všech těchto i dalších případech je žádoucí převést dokument do elektronické formy, která bude dobře přenositelná pomocí Internetu či intranetu, archivovatelná apod. DjVu zde může být tím pravým formátem díky vlastnostem, které jsme naznačili výše. Typickými oblastmi nasazení formátu tak mohou být internetové depozitáře historických dokumentů, virtuální knihovny, prezentace vydavatelství, úložiště manuálů a mnoho dalšího. Další využití se pak nabízí i pro ukládání fotografií ve vysokém rozlišení a případně lze také uvažovat i o nasazení DjVu coby interního formátu produktů určených ke zpracování obrazu (ve stylu GenuineFractals).

K dosavadnímu vývoji

DjVu je výtvorem AT&T Labs, které na vývoji formátu začaly pracovat v roce 1996. Patentová práva na formát přitom vedle AT & T získala i společnost LizardTech. Ta měla napomoci komerčnímu šíření formátu. Skutečně takto nabídla celou řadu řešení Document Express, postavených na DjVu, které doplňovaly její stávající produktové portfolio, opírající se o kompresní formáty MisterSID a GenuineFractals, licenční modely a snaha udržet DjVu coby víceméně proprietární technologii se ovšem ukázaly jako nepříliš vhodné pro další šíření formátu. Situace se ale obrátila k lepšímu v roce 2003, kdy LizardTech zakoupila společnost Celartem (známá svou kompresní technologií VFZ). Celartem zaujala mnohem vstřícnější postoj ke snahám učinit z DjVu otevřený formát, což vedlo k zvýšení zájmu o vývoj odpovídajících řešení u open source komunity, snížily se i ceny komerčních řešení LizardTechu, zejména v případě neziskových a edukačních aplikací.

Nástroje a aplikace

Naznačená liberalizace přístupu k formátu i celkové snahy o jeho rozšíření vedly v posledních letech k řadě zajímavých aplikací třídy open source či freeware. Ke stávajícímu Any2DjVu (internetová konverzní služba pro DjVu), DjVuLibre (prohlížeč, kodér/dekodér, utility) či podpoře DjVu v prohlížeči IrfanView takto přibyly JavaDjVu (zpracování DjVu na platformě Java), WinDjView a MacDjView (prohlížeče pro Windows a Macy) či Google DjVu Search a Indexer pluginy, sloužící k prohlížení a indexování DjVu dokumentů v prostředí aplikace Google Desktop Search. Vedle produktů LizardTechu pak mezi komerční řešení pro DjVu nyní patří i známý ACDSee či prohlížeč DjVu pro PalmOS, dodávaný v rámci řešení GrxView Pro společnosti InDev Software.

encdjvu3f.gif

K prohlížení DjVu dokumentů lze nyní využít i WinDjView

DjVu si pak našel dobrou pozici v řadě projektů, určených především k elektronickému zužitkování skenovaných dokumentů. Konkrétně lze na prvním místě zmínit Internet Archive, ambiciózní projekt pro schraňování nejrůznějšího elektronického obsahu (tiskoviny, audio, video, webové stránky), který využívá DjVu (vedle TIFF a PDF) v rámci internetového archivu knižních publikací Million Book Project. Dále se pak DjVu podle všeho stává oblíbeným prostředkem pro dokumentové archívy vzdělávacích institucí (univerzity v Mexiku, USA, Izraeli, na Islandu atp.) stejně dobře, jako platformou pro elektronické zpřístupnění depozitářů muzeí, galerií a knihoven (mj. i Národní knihovna České republiky) nebo aukce historických předmětů. Možnost vystavení novin v DjVu nabízí například produkty společnosti Realview Technologies.

Závěrem

I přes technologickou vyspělost a poměrně dlouhou řadu reálných aplikací zůstává DjVu stále ve stínu sice méně dokonalých, ale zato rozšířených a příslušně podporovaných konkurenčních formátů. V potaz je pak třeba brát to, že i zavedené standardy procházejí vývojem (například podpora JPEG2000 a JBIG2 v PDF) a prosadit se snaží i konkurence (JPEG2000, řešení společností jako je LuraTech či CVISION Technologies). DjVu nicméně i tak zůstává formátem, o kterém zřejmě ještě hodně uslyšíme.

Tématické zařazení:

 » Rubriky  » VSE  

 » Rubriky  » Go verze  

 » Rubriky  » Polygrafie  

 » Rubriky  » PDF - Adobe Acrobat  

 » Rubriky  » Software  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: