WebCapture aneb převod webovských stránek v Adobe Acrobatu - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Příslušenství

WebCapture aneb převod webovských stránek v Adobe Acrobatu

17. února 2003, 00.00 | Funkce Adobe Acrobatu WebCapture má mnoho užitečných aplikací.
Jejich nastínění se, spolu s přiblížením možností a omezení
uvedené funkce, věnujeme v tomto článku.

Jednou z pozoruhodných funkcí Adobe Acrobatu je od jeho čtvrté verze funkce převodu webovských stránek (WebCapture). Ta umožňuje obsah stránek z World Wide Webu převádět do PDF dokumentů. Lze ji využít mnoha užitečnými způsoby, z nichž alespoň některé z nich si, spolu s přiblížením možností a omezení WebCapture, přiblížíme podrobněji v tomto článku.

Fungování

Podívejme se nejprve podrobněji na způsob, jakým vlastně uvedená funkce funguje. Základním příkazem zde je Nástroje-Převod z Webu-Otevřít webovskou stránku. Po jeho zadání a určení příslušných voleb se provede stažení zadaného obsahu z Internetu. Následně je tento obsah převeden do PDF dokumentu. Platí přitom následující pravidla (jejichž fungování je odladitelné pomocí odpovídajících dialogových boxů):

Základní dialog pro stahování stránek ve WebCapture.

- Stahují se obsahy stránek vytvořených v HTML a k nim přidružený obsah ve formátu TXT, GIF, JPEG a PDF. Převedený obsah je v rámci možnosti převeden na odpovídající vyjádření v PDF, přičemž je rozdělen do tiskových stránek nastaveného formátu. Velikost stahovaného obsahu se nastaveným stránkám přizpůsobuje, rovněž lze určit překlopení stránky na šířku, pokud se by se obsah musel zmenšit pod zadanou mez. Do záhlaví a zápatí vytvořených stránek jsou vloženy důležité informace, spojené s daným dokumentem (název HTML-stránky, URL, datum a čas stažení).

- Odkazy z webovských stránek jsou převedeny na odpovídající odkazy v PDF dokumentu.

- HTML-formuláře jsou v rámci možností zkonvertovány na odpovídající formuláře v PDF.

- Název stahované stránky, určený HTML-tagem Title, se převezme do odpovídajícího pole Titul (Title) ve vlastnostech vzniklého PDF dokumentu.

- Každé WWW-stránce, vložené do vytvářeného PDF dokumentu uvedeným způsobem, může být automaticky přiřazena odpovídající záložka, pojmenovaná podle názvu (již zmíněný tag Title) nebo URL dané stránky. Na přání lze ze stahovaného obsahu vytvořit tzv. tagované pdf . Díky tomu je pak možné zpracovávat součástí vytvořeného dokumentu na základě jejich tagovaných záložek. Ty zachycují strukturu obsahu podle vzájemných vazeb stažených stránek (určených odkazy), a nikoli fyzického umístění v dokumentu. Výhodami uvedeného způsobu je například možnost odstranění, přesunu či tisku všech stránek, patřících k dané záložce (a tedy určitému způsobu průchodu Webem).

Nastavení převodu lze odladit pomocí mnoha dialogových boxů.

Typický scénář využití WebCapture je následující: uživatel stáhne počáteční stránku přímým zadáním jejího URL, další obsah pak stahuje klikáním na požadované odkazy, obsažené ve staženém dokumentu. Jinou variantou je automatické stahování veškerého či určitým způsobem omezeného (například jen do určité úrovně, jen na daném serveru atd.) obsahu, na který vedou z dané stránky odkazy. Ještě jinou možnost pak představuje stažení obsahu celého serveru. Obsah vytvořeného dokumentu je rovněž kdykoli později možno aktualizovat novým stažením.

Omezení

Technologií používaných na Internetu je nepřeberné množství a s jejich adekvátním zpracováním a využitím mají problémy i ty nejkvalitnější specializované internetové prohlížeče. Neudiví tedy, že i v případě WebCapture narazíme na poměrně dlouhou řadu prvků internetových prezentací, s kterými si tato funkce nedokáže dost dobře poradit. Uveďme nyní alespoň ty nejdůležitější z nich.

Především je dobré vědět, že WebCapture je plně kompatibilní pouze s HTML 3.2 a tudíž nedokáže adekvátně zpracovat některé speciální funkce, použité v HTML 4.0 a DHTML. Dále nepodporuje přenosové protokoly ftp, news, mailto, gopher a telnet a neposkytuje možnost přihlášení k zaheslovanému proxy serveru. Nedokáže zpracovat žádný jiný formát, než jaký jsme uvedli výše, což je nejpalčivější zejména u grafiky ve formátu PNG a také animovaných GIFů (načte se pouze první rámec). Rovněž nejsou, až na JavaScript (i ten pouze omezeně) podporovány skriptovací jazyky typu ActiveX či VBScript.

Výše zmíněné technologie jsou povětšinou dynamického charakteru. Vzhledem k účelu WebCapture, kterou je především převod statického zobrazitelného obsahu do PDF dokumentu, se tedy takováto omezení nejeví jako příliš zásadní. Základní otázkou českého uživatele nicméně je, jak je ve WebCapture vyřešena podpora češtiny. A zde lze konstatovat, že zatímco v Acrobatu 4 i anglické verzi Acrobatu 5 byly značné komplikace, je v českém Acrobatu 5 uvedený problém vyřešen takřka na jedničku. Toto tvrzení přitom platí nejen pro češtinu resp. středoevropské jazyky, ale rovněž pro dlouhou řadu dalších jazyků, z nichž můžeme uvést alespoň ruštinu, řečtinu či arabštinu. Klíčem k úspěšnému využití národní podpory přitom je dialog nastavení převodu HTML stránek. V něm lze pro danou stránku implicitně určit (vynutit) její kódování. Vzhledem k rozmanitosti technologií použitých na webu (resp. nedisciplinovanosti mnoha webmasterů) i omezení, vyskytujících se v základech funkce WebCapture jako takové, je přitom jasné, že se mohou vyskytnout stránky, u kterých zůstává i přesto korektní převod národních znaků problémem. Jejich počet je ovšem oproti zmíněným dřívějším verzím Acrobatu skutečně značně redukován.

WebCapture si v českém Acrobatu dokáže poradit s mnoha jazyky.

Využití

Pokusme se nyní naznačit základní způsoby využití funkce WebCapture, a to zejména vzhledem k podmínkám a nárokům publikačních provozů, které obvykle Acrobatem disponují jakožto nástrojem pro vytváření a zpracování PDF dokumentů.

Rychlé shromažďování podkladů z webu
Nejčastěji lze asi uvedenou funkci, bez ohledu na typ pracoviště, využít při stahování informací z Webu pro pozdější off-line prohlížení. Připomenout zde můžeme, že prohlížeče PDF dokumentů jsou dnes dostupné nejen pro stolní a přenosné počítače, ale rovněž nejrůznější typy PDA (personálních digitálních asistentů), takže uvedeným způsobem shromážděné informace lze mít po převodu opravdu stále po ruce.

Sdílení webovských stránek mezi uživateli
Jinou užitečnou funkcí je výměna uvedeným způsobem staženého obsahu mezi uživateli. Anotační aparát Acrobatu zde nabízí bohaté možnosti skupinové spolupráce (komentáře, korektury, zvýraznění) například nad vytvářenými webovskými prezentacemi. (Ne nadarmo zabudovala nedávno Adobe funkci obdobnou WebCapture do své aplikace pro tvorbu webovských stránek GoLive.)

Tisk webovské prezentace
Každý, kdo někdy potřebuje tisknout obsah složitější (co do použitých technologií) webovské stránky, jistě ocení "normalizaci" staženého obsahu pro tiskový výstup, které se dosáhne uvedeným převodem do PDF. I když není uvedený převod vždy zcela ideální, lze přesto při následném tisku z Acrobatu či Readeru dosáhnout v mnoha případech podstatně uspokojivějších výsledků, než by tomu bylo v případě využití standardní tiskové funkce specializovaného webovského prohlížeče.

Archivace obsahu webovského serveru
Po převodu do PDF lze stažený obsah v uvedené formě archivovat podstatně "stabilnějším" způsobem, než je tomu při stažení samotných webovských stránek. Jejich zobrazení je totiž do značné míře závislé na dané platformě a aktuální konfiguraci systému, zatímco v PDF je tento obsah (zejména při vložení použitých písem) prakticky zcela "soběstačný".

Tvorba pokladu pro sazbu
Specifické využití může WebCapture nalézt při přípravě podkladů k sazbě. Je-li totiž do sazby třeba vložit například ukázku z webovské prezentace, získáme v případě převodu do PDF podstatně snáze zpracovatelnější a kvalitnější podklad, než by tomu bylo při jiných zde používaných postupech (screenshoty).

Závěrem

Jak jsme se pokusili naznačit, představuje zdánlivě triviální funkce stahování WWW stránek v Adobe Acrobatu překvapivě mocný nástroj, použitelný i v profesionálních publikačních provozech. Vzhledem k nepřebernému množství technologií a postupů, vyskytujících se dnes na Webu, resp. ve stahovaných stránkách, má tato funkce pochopitelně i svá omezení. Většinou ale dokáže posloužit jako skutečně užitečný pomocník. V našem výkladu jsme se příliš nezabývali konkrétní realizací úkonů prováděných s pomocí WebCapture - uživatel zde může pochopitelně sáhnout po dokumentaci Acrobatu.

Tématické zařazení:

 » Rubriky  » Go verze  

 » Rubriky  » Sazba  

 » Rubriky  » Webdesign  

 » Rubriky  » Polygrafie  

 » Rubriky  » PDF - Adobe Acrobat  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: