Tagované PDF: Praxe - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Go verze

Tagované PDF: Praxe

10. února 2003, 00.00 | Jakými nástroji a postupy lze v současnosti vytvářet, upravovat a
kontrolovat tagované PDF soubory?

Tagované (nebo dříve též strukturované) PDF patří k významným nedávným rozšířením možností formátu PDF. V předchozí části tohoto článku jsme se věnovali zejména důvodům, vedoucím k zavedení uvedené technologie a jejímu teoretickému pozadí. Dnes se podíváme na její praktickou stránku, tedy na nástroje a způsoby, jak tagované PDF soubory vytvářet, upravovat či kontrolovat.

Tvorba

Připomeňme nejprve, že v současnosti jsou při tvorbě PDF z dokumentů nativních aplikací používány dva způsoby: převod postscriptového souboru (který byl z původní aplikace vygenerován pomocí tiskového postscriptového driveru) do PDF a přímý výstup z prostředí dané aplikace pomocí exportní funkce. V obou případech je žádoucí, aby informace určující strukturu souboru (obvykle odstavcové či znakové styly, včetně popisu vzájemných vazeb - například hierarchie nadpisů) byly převzaty do strukturovaného PDF už z původního nativního dokumentu. To tedy znamená, že odpovídající funkce by měla být zabudovaná přímo do dané aplikace. Takovýchto produktů je dnes jako šafránu, nicméně zde jsou. Neudiví přitom, že všechny pocházejí od Adobe. Konkrétně tvorbu tagovaného PDF podporují následující produkty:

Adobe InDesign 2: Zde je odpovídající volba ("Včetně tagů eKnihy") k dispozici při výstupu do PDF pomocí exportní funkce. (Export je realizován pomocí Adobe PDF Library, tedy nikoli Distillerem.)

Adobe PageMaker 7: Výstupní funkce zde při tvorbě postscriptového výstupu vkládá na příslušná místa odpovídající pdfmarks, které jsou potom využity při tvorbě PDF dokumentu Distillerem. Vložení uvedeného typu značek se zapíná v dialogu PDF Options.

PDFMaker 5.0 v Microsoft Wordu 2000: Tento převodník vytvoří z dokumentu textového procesoru Microsoft Word postcriptový soubor s odpovídajícími pdfmarks, který poté odešle Distilleru. Převod do strukturovaného PDF se určuje na kartě Office.

Adobe Acrobat 5: Tagované PDF je zde vytvářeno z HTML stránek stažených funkcí WebCapture - Převod z Webu. Po zapnutí odpovídající volby převodu vznikají tagované záložky, které jsou vytvářeny na základě vazeb mezi jednotlivými stránkami (a tedy nikoli jejich fyzického pořadí). Podrobněji se uvedenou funkcí budeme zabývat v některém z našich příštích článků.

Mimo přímé podpory tagovaného PDF lze ještě v řadě aplikací využít vkládání odpovídajících pdfmarks pomocí příslušných funkcí daného produktu. Nejsnáze to lze v prostředí sázecího programu TeX, obdobné možnosti pak poskytují prakticky všechny aplikace, dovolující do svých dokumentů vkládat úseky postscriptového kódu (např. v podobě EPS souborů). Tvorba strukturovaného PDF touto cestou je ovšem, snad pouze s výjimkou TeXu, značně pracná, a navíc nepřináší příliš dobré výsledky.

Zajímavý způsob, jak vytvořit tagované PDF přímo z nestrukturovaného PDF dokumentu, nabízí plug-in Acrobatu MakeAccessible. (Jak naznačuje název, jedná se o produkt, vytvořený Adobe v rámci její iniciativy pro uživatele s zrakovým postižením http://access.adobe.com , nasazení tohoto plug-inu je nicméně stejně dobře možné i v rámci všech ostatních úloh, využívajících tagované PDF.) Ten na základě analýzy daného dokumentu provádí odpovídající vložení strukturních tagů a informací Unicode. Úspěšnost takto realizovaného převodu nicméně klesá s rozsahem a složitostí převáděného dokumentu. Plug-in je v současnosti dostupný pouze ve verzi pro Microsoft Windows a lze jej stáhnout zde. (V některých starších instalacích Acrobatu se nenachází.)

Zpracování

K dalším úpravám a kontrolám tagovaného PDF lze využít Adobe Acrobat. Většina jeho odpovídajících funkcí je nabízena na panelu Tagy. Ten zobrazuje aktuální hierarchickou strukturu tagů v daném dokumentu. Při zapnutí volby "Zapnout zvýraznění odpovídajícího obsahu" (v kontextové nabídce na zmíněném panelu) lze při výběru daného elementu v paletě zobrazit zároveň jemu odpovídající část dokumentu. S pomocí příkazu "Najít element z výběru" je naopak možno identifikovat tag prvku, který je v dokumentu aktivován pomocí nástroje pro retušování textu nebo objektů. S pomocí příkazu "Vytvořit z výběru dceřinný element" pak lze vybraný prvek začlenit do logické struktury.

U každého elementu z tagovaného PDF dokumentu lze měnit řadu jeho charakteristik.

S pomocí odpovídajících funkcí je dále možno v dokumentu vytvářet nové elementy nebo je naopak odstraňovat, u každého elementu je možno podrobně upravit jeho vlastnosti, včetně jazyka a alternativního textu (vhodné zejména pro popisky obrázků, určené pro čtecí zařízení zrakově postižených osob), možný je i převod zvoleného elementu na artefakt (tedy součást dokumentu, nesouvisející přímo s jeho obsahem, jako jsou například čísla stránek). K dispozici je dále vyhledání artefaktů, neoznačených poznámek či neoznačených částí s možností jejich následného otagování. Konečně lze využít i nástroje pro práci s elementy (jejich atributy a převody) prostřednictvím manipulace s tzv. mapami tříd a využití - takovéto úpravy jsou už pouze pro experty.

Kontrola

Přeformátování a tedy vizuální kontrolu tagovaného dokumentu umožňuje v Acrobatu (i Readeru) volba "Zobrazení-Změnit natékání". Po její aktivaci se zobrazovaný obsah přeformátuje podle aktuálního rozměru okna. Uvedeným způsobem lze kontrolovat především korektnost pořadí přeformátovaných prvků (umístění tabulek, odrážek apod.). Vyskytnou-li se problémy, nebo chce-li mít tvůrce dokumentu v uvedeném směru jistotu (nastavené pořadí se dodržuje například i při exportu do formátů jako je RTF), lze v Acrobatu provést změnu pořadí jednotlivých objektů pomocí nástroje pro retušování pořadí. Obdobně umožňuje nástroj pro retušování textu kontrolovat a případně upravovat způsob rozdělení textu. Ještě jinou formu kontroly tagovaného dokumentu, tentokrát z hlediska jeho využití ve čtecích zařízeních pro zrakově postižené, nabízí příkaz "Nástroje-Kontrola usnadnění přístupu". Ten pro celý dokument nebo stránky ve zvoleném rozsahu zjišťuje, zda je veškerý obsah otagován, jsou provedena přiřazení jazyka textu, veškerý text je v Unicode a obrázky i formuláře mají přičleněny odpovídající alternativní popisky.

Dialog funkce "Kontrola usnadnění přístupu".

Závěrem

Technologie tagovaného PDF je zatím teprve v počátcích. Přesto dnes pro ní existuje relativně dost nástrojů, umožňujících její reálné nasazení. Vzhledem k obecným trendům (elektronické publikování, zpřístupňování obsahu zrakově postiženým, cross-media publishing) lze přitom do budoucna očekávat, že se tagované PDF (nebo nějaká jeho vylepšená podoba) určitě rozšíří v masovém měřítku. Otázkou je, nakolik má v uvedeném směru smysl vyčkávat a nakolik je vhodné již teď začít s využíváním uvedené technologie - odpověď zde zcela závisí na podmínkách a požadavcích toho či onoho publikačního pracoviště.

Tématické zařazení:

 » Rubriky  » Go verze  

 » Rubriky  » Polygrafie  

 » Rubriky  » PDF - Adobe Acrobat  

Diskuse k článku

 

Vložit nový příspěvek   Sbalit příspěvky

 

Zatím nebyl uložen žádný příspěvek, buďte první.

 

 

Vložit nový příspěvek

Jméno:

Pohlaví:

,

E-mail:

Předmět:

Příspěvek:

 

Kontrola:

Do spodního pole opište z obrázku 5 znaků:

Kód pro ověření

 

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: