Profesionální grafické karty FirePro řady W, W7000, Pitcairn v plné síle - Grafika.cz - vše o počítačové grafice

Odběr fotomagazínu

Fotografický magazín "iZIN IDIF" každý týden ve Vašem e-mailu.
Co nového ve světě fotografie!

 

Zadejte Vaši e-mailovou adresu:

Kamarád fotí rád?

Přihlas ho k odběru fotomagazínu!

 

Zadejte e-mailovou adresu kamaráda:



Software

Profesionální grafické karty FirePro řady W, W7000, Pitcairn v plné síle

21. října 2013, 18.56 | Minule jsme si představili pilotní a tedy nejslabší profesionální grafickou kartu od AMD FirePro W5000. Karta vynikala výborným provozem a velmi slušnou výbavou. Pokud jsme se ale podívali na její rodokmen, nemohlo nám ujít, že by jistě mohla být i silnější, protože nebyl využit celý potenciál čipu.

 

Ten využívá dnes recenzovanný model, W7000. Karta s dobrým provozem, 4GB pamětí, čtyřmi výstupy DisplayPort a slušným OpenCL výkonem. Skoro by se dalo říci, že se jedná o ideální kartu. A pořád s příjemnou cenou (na profesionální grafické karty). A mimochodem, je nový Cinebench R15 a mám i nové informace, tedy změníme některé části metodiky testu (i zpětně).

 

Minule recenzovaná karta mne velmi mile překvapila. Výborně se chovala v editoru (OpenGL) a i rendereru, při dobrém provozu a slušném potenciálu RAM. A ani cena není špatná. Možná bychom mohli připomenout specifikace této karty.

 

Specifikace W5000

 

AMD FirePro W5000, 2GB GDDR5, PCIe ×16, 768 stream jader, jádro Pitcairn, 1× DVI, 2× DisplayPort, cena okolo 11 000 Kč s DPH.

 

Dnešní karta je W5000 velmi blízce příbuzná, ale přeci jen se v něčem liší. W5000 zcela nevyužívá potenciálu čipu Pitcairn, který může obsahovat (mít aktivních) až 1280 stream jader. To W7000 je využívá zcela, a tak tím v některých úlohách logicky roste výkon. A to dramaticky. Jindy je zase otázkou, zda dokáže aplikace kartou poskytovaný potenciál využít. To nechme ale na článku.

 

Mimochodem. Nikdo učený z nebe nespadl. Nebyl jsem si jistý výsledky, respektive vhodností scén v Indigu, a tak jsem pátral a pátral (a také se ptal). Změnil jsem systém testu, a to proto, že Indigo zatím neumí využívat kartu vždy. Našel jsem situaci, kdy ji využít umí, a to zásadně, a na této situaci je výkon v Indigu podstatně směrodatnější, než kde jinde. Máte se na co těšit!

 

Ještě než začneme, zopakujme si základní specifikace.

 

Specifikace W7000

 

AMD FirePro W7000, 4GB GDDR5, PCIe ×16 3.0, 1280 stream jader, jádro Pitcairn, 4× Display port, cena okolo 14 600 Kč s DPH.

 

W7000

 

Jak jsme řekli, cena není ještě nějak závratná a za své peníze uživatel získá 4× výstup DisplayPort, což může být pro profesionální řešení opravdovou výhodou a zásadním klíčem pro případné užití této karty. Ono ty tři, čtyři panely nemusí být až takové sci-fi. Řekněme dva profi desetibitové panely + jeden desetibitový Cintiq od Wacomu, vše na DisplayPortu a ejhle, máme tři v provozu a opravdu se nejedná o nereálně navrženou situaci. Navíc má karta 4 GB GDDR5, což umožňuje využití vysokého rozlišení. Ve výsledku, osobně z mého pohledu, za dané peníze vlastně není karta drahá (z pohledu výstupů + potenciálu GDDR5) ani v porovnání s kartami herního segmentu. Ukažte mi kartu z herního segmentu, která umí totéž (když pominu 10bit a některé další technologie). Jistě bude karta běžet na vyšších frekvencích a podobně, vlastní přínos ale bude, podle mého, v pracovní oblasti proti této kartě dost malý. A opakuji, možnosti výstupu jsou z mého pohledu skoro jedinečné (za danou cenu).

 

W7000

 

Je pravda, a řeknu to rovnou, že mi přijde poměrem cena/výkon toto řešení jako asi momentálně nejvýhodnější na trhu. Jistě platí všechno to, co jsme již napsali minule. AMD FirePro má smysl tehdy, když chybí ve vašem portfoliu CUDA a vystačíte si s OpenCL. Pokud tomu tak je, asi není momentálně výhodnější profi karty než této. Zní to jako reklama, ale podívejte se po ostatních a asi vám vyjde totéž.

 

Mimochodem, opět, jaká karta stojí proti této W7000 v zeleném táboře? Je to, ve shodě s minulým článkem, Quadro K4000. Její specifikace jsou zde:

 

NVIDIA Quadro K4000, 3GB GDDR5, PCIe ×16, 768 CUDA jader, jádro GK 106, 1× DVI, 2× DisplayPort, cena okolo 19 300 Kč s DPH.

 

Jedná se tedy o cenově dražší řešení mající o 1 GB RAM méně a kontrující jen dvěma DisplayPorty a jedním DVI. Výhodou, zakrýt to nelze, je CUDA, ale na druhou stranu jsou všechny Keplery vyjma jádra GK110 v CUDA dost pomalé a OpenCL jim nesvědčí. Většinou má konkurence lepší provoz (K4000 má de facto poloviční příkon) a obecně vyšší úroveň ovladačů. Více v odkazu uvedeném níže.

 

Poznámka:

Tohle je pod čarou, ale mám z toho trochu pocit, že NVidia usnula na vavřínech. A to ze dvou důvodů (jakkoli i AMD má také své problémy, a tím netvrdím, že je lepší). Vydáním Keplera s jeho nízkým výpočetním výkonem myslím dost nazlobila nezávislé vývojáře i uživatele. Hodně lidí investovalo do vývoje aplikací podporujících CUDA a dost lidí by rádo tyto aplikace využívalo, protože zásadně zrychlují některé procesy (rendering, simulace). Jenže dlouho nebyla k dispozici dostupná karta (Kepler), kterou by bylo možné na výpočty použít a do příchodu Titana a GF 780 zůstávali na starých (a žravých) Fermi, většinou násobených GF580.

 

Druhým problémem podle mého byla oblast MacOS. Ono právě v grafické oblasti je Mac prostě často užívanou platformou a také platformou, která je primárně obsazená AMD. Z toho plynul tlak (například na Adobe) na podporu OpenCL (vedle CUDA pro Win). A když už bylo OpenCL pro Mac, asi byla jen otázka času, kdy bude i pro Win.

 

Výsledkem zatím je, že vnímám mírný posun ve prospěch OpenCL proti CUDA (hlavně z pohledu Adobe CC pro Win), jakkoli je pozice CUDA zatím dost neotřesitelná a míra i množství implementace CUDA je podstatně vyšší než OpenCL. Kam to půjde dál, je podle mého na společnosti NVidia. Pokud bude pokračovat i Maxwell ve stávajících šlépějích je otázkou, zda se i vývojáři časem neohlédnou po OpenCL jako více univerzální platformě (jakkoli je prý implementace OpenCL náročnější).

 

Výhody pro rozvoj OpenCL implementace by byly jasné. Mac komunita (což je v naší branží dost podstatná část) obvykle stojí mimo možnost využití CUDA (mimo některých výjimek jako Quadra pro Mac – ale v současné době nikoli na jádře GK110), a za druhé v této chvíli velmi vysoký výkon karet AMD v oblasti OpenCL a možnost užití i NVidia karet – tedy univerzálnost. Uvidíme... Jsem na to velmi zvědav. Osobně, jako uživateli CUDA aplikací, bych si přál, aby byla nová generace čipů Nvidia stejně univerzální (jako celek, nejenom nejvyšší čip), jako bylo Fermi. Anebo, a to je kacířská myšlenka, aby se OpenCL masivně prosadilo a dokázalo upoutat vývojáře všech možných rendererů a spol.

 

FirePro W7000

 

Předchůdce této karty byla karta označená jako V7900, což byla podobně velká karta osazená 2 GB GDDR5, čtyřmi DisplayPorty (max. rozlišení 2560 × 1600 px). Karta byla vyrobena starším 40nm procesem a patřila svou architekturou mezi čipy Cayman Pro GL, tedy odvozena byla od řady 6900. Nabízela shodně 1280 stream procesorů a poskytovala na svou dobu velmi dobrý výkon i provoz. Více o této kartě najdete v odkazu HotHardware.com

 

Jednalo se tedy, na rozdíl od zde recenzované V5900, o vyvážený kus hardware širokého spektra použití a dobré výbavy (na svou dobu, tedy rok 2011).

 

FirePro W7000 ale přeci jen nabízí o dost více než předchůdce. Dvojnásobná kapacita RAM je první bonus. Dalším je cena, která je nižší o cca 1 a následovat vyšší výkon a hlavně podstatně vyšší maximální rozlišení (DisplayPort 2). Ostatní pozitiva zůstala, a tak se máme určitě na co těšit.

 

Balení

 

Balení karty je již klasické ve smyslu AMD (ale ono to není úplně pravidlem, což ostatně uvidíme příště). Bílý o něco větší box s označením karty AMD FirePro workstation graphics W7000). Na obalu je vyvedené auto se stojícím designerem sledujícím tři panely. Myslím, že je návrh potisku o něco lepší než v případě W5000, přesto mi přijde trochu alibistický. Ono to ale asi je normální, a když si vzpomenu na obal Quadra 4000, tak to vlastně nevybočuje z designu celého segmentu trhu :)).

 

W7000 box

 

Zpět k balení. Zadní strana boxu je opět potištěna informacemi o kartě a také jejím vyobrazením. A zase lze říci, obsah je důležitější než obal. Box je o něco větší než v případě W5000, rozměry se pohybují 38,5 × 24,5 × 7,5, ale ani tak není krabice nějak zbytečně veliká. Je přesně taková, aby ochránila to dobré uvnitř (nepřipomíná vám to tetrapak)?

 

Bílý karton je jen obalem vlastního balení, které je kartonové. Uvnitř jsou polyuretanové výplně a v nich v antistatickém pytlíku karta. Její rozměry jako by z oka vypadly starému Quadru 4000, dal jsem je na sebe a skoro přesně se shodují. Zajímavé. Délka karty je tedy okolo 24,5 cm a jak je asi zřejmé z obrázku, je pouze jednoslotová. To je skvělé...

 

Karta je shodně doplněna Crossfire můstkem, dvěma redukčními kabely DisplayPort – DVI, což je podle mého stav, jaký má být. Mimochodem, karta má standardní DisplayPort (nikoli mini). Dalším shodným rysem je výstup na stereo umístěný do separátního panýlku montovaného samostatně.

 

Dále je vše doplněno univerzálním quick startem a to je opravdu všechno.

 

Skoro doslova se mohu v některých větách opakovat, vím:)).

 

Základní specifikace

 

Z minulého článku již víme, že je karta vyráběna v současné době standardním 28nm procesem a patří do stejné rodiny jako Radeon HD 7850 a HD 7870 GHz Edition. Proti dříve uvedené W5000 disponuje plným potenciálem 1280 stream jader. Tedy stejně, jako Radeon HD 7870. Karta bez zátěže běží na 450 MHz (proti 300 W5000), v případě maximální zátěže na 950 MHz. Paměti běží na 1200 MHz. Karta je osazena 4GB paměťmi GDDR5, šířka sběrnice je 256 bitů a propustnost 153,6 GB/s (podstatně vyšší než v případě W5000). Často by nás mohl u těchto karet zajímat výkon v OpenCL (již víme, že Adobe rendering videa, Luxrender/resp. Luxmark, částečně Indigo – to si ještě více rozebereme – tedy ještě více než minule) a další.

 

Tedy k výkonu ve výpočtech. Hodnota Single Precission výkonu je a Double Precision (podstatné zejména pro oblast výpočtů, jakkoli se podle informací vývojářů – Indigo – většinou stejně využívá zejména Single precision). Hodnota SP je – 2.4 TFLOP (proti 1,3 W5000) a 152 GFLOP (giga) proti 79.2 GFLOPs W5000 výkonu na plovoucí čárce. Stejná je hodnota nejvyššího rozlišení na DisplayPortu 1.2, která je 4096 × 2160, v případě DP 1 2560 × 1600. Více o standardech DisplayPort na en.wikipedia.org. http://en.wikipedia.org/wiki/Displayport

 

I když možná bude jedna nejmenovaná korejská automobilka popotahovaná za srovnávací reklamu, tak snad můžeme porovnat W7000 s K4000. Opět je to jen papírové srovnání, bohužel jsem neměl K4000 v ruce.

 

Quadro K4000 je primárně o zobrazení, nikoli výpočtu (není to GK110), srovnání tedy není zcela korektní, ale v oblasti výpočtů nabízí tento konkurent 1,246 GFLOP v Single precision. Tedy poloviční hodnotu. I maximální rozlišení je u K4000 nižší (3840 × 2160 při 60 Hz). Na stranu druhou je K4000 podstatně úspornější kartou (max. 80 W proti 150 W) a není úplně objektivní tvrdit, že slabší. To zejména díky velmi kvalitním ovladačům, které mohou být pro některé aplikace skutečně výborně odladěné a tím dosahovat vynikajících výsledků.

 

Koho by zajímaly komplexní informace o porovnání výkonů těchto karet v mnoha profi aplikacích, mohu jen doporučit tento článek, který vše co je napsané zde výborně doplňuje. Chci ale zdůraznit několik věcí:

● Výkon karet se může dramaticky měnit v závislosti na ovladačích, ty mohou být upraveny podle nové verze aplikací či obecně lépe odladěné a výsledek bude dramaticky jiný!

●  Výkon se také může měnit podle náročnosti scény (viz výsledky v Maya) a rozlišení.

● V případě absence PCIEx16 3.0 (například já mám jen 2.0) se může snížit rychlost zobrazení o pár procent.

 

Ještě k odkazu. Vynikající je pozorovat, jak se skutečně profi segment doplňuje a není snadné říci, kdo kde má navrch. Snad jen, že člověk neudělá až tak moc chybu u obou, což je příjemné zjištění.

 

Skutečně v závěru této poznámky, všimněte si doporučení. Doporučeny jsou v závěru karty Quadro K4000 (hlavně pro skvělé odladění v oblasti profi aplikací jako Solidworks a spol.) a W7000 pro vynikající poměr cena/výkon a OpenCL. Platí pořád to, co jsme již kdysi řekli. AMD mívá slabší ovladače a horší ladění a možná systémově o něco lepší podvozek (ve smyslu výkonnější za danou cenu), což ale krotí právě ovladače. Jakkoli je nyní lepší situace ovladačů v C4D, a to dramaticky, tak jinde se to může projevit obráceně. Je opravdu úžasné, jak lze dvě věci dělat jinak a výsledek může být v obou případech podobný při naprosto odlišné cestě, jak výsledku dosáhnout.

 

W7000 větřák

 

Odkaz: TomsHardware.com.

 

Další parametry:

 

Výstup

● DisplayPort: 4×

● Max. DisplayPort 1.2 rozlišení: 4096 × 2160

● Max. DisplayPort 1.1 rozlišení: 2560 × 1600

 

Systémová podpora technologií

● DirectX 11.1

● OpenGL 4.2

● OpenCL 1.2

● Shader Model: 5.0

● AMD Eyefinity Technology

● AMD CrossFire Pro

● AMD HD3D: (pomocí stereoscopického 3pin mini DIN)

● Systémová podpora: Microsoft Windows 8, Windows 7, Windows XP, Windows Vista a Linux (32/64bit)

 

Napájení, chlazení

● Max. příkon: <150 W

● Počet slotů: jeden

● Form Factor: plná výška/délka

● Rozhraní: PCIe x16, 3.0 pro optimální výkon

● Chlazení: aktivní

 

Systémové požadavky

● PCI Express x16 (jeden slot), pro optimální výkon je vhodné použití standardu 3.0

● Zdroj s jedním volným 6pinovým napájením

● 2GB paměti

● Microsoft Windows 8, Windows 7, Windows XP, Windows Vista či Linux (32/64bit)

● Internetové připojení pro instalaci driveru

 

W7000 GPU

 

K závěru technického popisu

 

S kartou jsem opět strávil asi jeden měsíc. Měsíc velmi příjemný, pro mne je to momentálně (mimo využití CUDA) asi nejlepší karta, se kterou jsem se potkal (cena/výkon). Slušný provoz, nízká hlučnost, větrák permanentně na cca 25–35 %, teplota jádra okolo 50 °C. O kartě skoro nevím a to je dobře. Tak to má být.

 

Kartu jsem velmi intenzivně používal v CINEMĚ 4D R15 a R14, pro testování nového systému Cinebench R15 a pro srovnávání s Cinebench R11,5. Dále klasicky s renderery, které budeme testovat. Tedy Luxmark/Luxrender (rozhraní Blender) a Indigo, jak standalone, tak Cindigo. Mimo to ještě Adobe Premiere.

 

Všechny testy probíhají na stále stejné stanici, tedy na procesoru AMD FX 8350 přetaktovaném na 4,4 GHz (deska je Asus Crossfire Formula V) a s 16 GB Ram. Jak jsme slíbili, stanici nebudeme během testů měnit, ale možná se podaří otestovat karty i na jiné stanici s i74930 na PCIEx16 3.0, čímž by nám vyšla komparace pro toto rozhraní (mezi kartami, nikoliv absolutní).

 

CINEBENCH R11,5

 

Cinebench je mrtev, ať žije Cinebench! Již dlouho jsem kritizoval to, že je daný systém zastaralý. A to jak verzí OpenGL, tak v oblasti optimalizace výpočtů. Nová verze je tedy podstatně směrodatnější než stará a také poskytuje odlišné výsledky! Všimněte si, W7000 se takřka kryje (o náhodnou odchylku) s W5000 i se silnější W9000. Stará CINEMA 4D R11,5 s OpenGL OpenGL 2.0 při využití jen 128 MB RAM prostě nebyla již moderním kritériem (nemluvě optimalizacích, které i u OpenGL v C4D proběhly). Cinebench 11,5 využíval OpenGL 2.0 a potřeboval jen 128 MB na RAM (grafické karty). Zejména ale jsou ale patrné značné nedostatky v kompilaci. Tedy, výsledky nejsou až tak směrodatné (pro stávající verzi CINEMY 4D R15).

 

Pro srovnání jako výchozí etalon uvádím i své staré dobré Quadro 4000. Výkon nelze s touto starou kartou srovnávat, jakkoliv je její výkon často stále velmi dobrý (viz praktické testy).

 

Cinebench R11,5 AMD FirePro W7000 + CPU FX 8350 4,4 GHz, 77,53 fps max.

 

Testy minulé

Cinebench R11,5 AMD FirePro W5000 + CPU FX 8350 4,4 GHz, 77,53 fps max.

Cinebench R11,5 Nvidia Quadro 4000 + FX 8350 4,4 GHz 61,52 fps max.

 

CB R11.5 a R15

 

CINEBENCH R15

 

Scény nejsou až tak odlišné, ale odlišná je míra kompilace OpenGL 2.1 a také míra využití pamětí. Přesto ani Cinebench R15 neumí využít kartu dosytosti (GPU-Z to umí hezky ukázat). Přesto jsou výsledky zcela odlišné. W7000 odskakuje W5000 o 20 fps! To je opravdu obrovský rozdíl!

 

Cinebench R15 AMD FirePro W7000 + CPU FX 8350 4,4 GHz, 111,11 fps max.

Cinebench R15 AMD FirePro W5000 + CPU FX 8350 4,4 GHz, 91,93 fps max.

 

CB R15

 

A to, opakuji, potenciál karty není stále využitý. Je otázkou, čím to je způsobeno. Naskýtají se mi (jako de facto laikovi v tomto směru) tři základní otázky. Jisté zrychlení (a vyšší využití?) by bylo možné s osazením karty do PCIEx16 3.0. Další možností je otázka kompilace samotného Cinebenche (je schopen podat ještě vyšší frekvenci, nezdržuje to procesor – protože ten je také v pernamenci) a nakonec i otázka ovladačů karty. Pokud by měl daný problém nějaké řešení, je otázkou, kam až by bylo možné výkon grafiky posunout. Protože průměrné využití karty je jen někde okolo 75 %.

 

Tak jako tak je výsledek řádově odlišný od staré verze Cinebenche. A to výrazně. Výrazně se posouvá k tomu, co Maxon tvrdil, že zásadně zrychlil editor. Však porovnejme původní hodnoty a dnešní, jakkoliv to není komparativní z pohledu testu. Z pohledu uživatele systému však ano. Na podobné scéně nám dala W7000 o skoro 35 fps vyšší rychlost! To je opravdu výborná hodnota.

 

Adobe Premiere Pro CC

 

Již víme, že Adobe Premiere Pro CC, na rozdíl od starších verzí, podporuje mimo technologie CUDA i OpenCL. Tato podpora se odehrává v případě přehrávače Mercury player, který je použit pro náhled videa, ale lze dané nastavení použít i pro výpočet. Pokud máte aktivní v Mercury playeru grafickou kartu, pak je tento stav znázorněn žlutou barvou nad časovou stopou, pokud jen procesor, je barva červená.

 

V úvodním testu jsem si vyexportoval zafiltrované rodinné video, které jsem zkrátil na 1500 snímků při framerate 25 fps. Rozlišení bylo 1920 × 1080 a export byl jako zdroj (bez půlsnímků). Časy jsou velmi zajímavé:

 

Původní test s jedním videem a množstvím filtrů

 

AMD FirePro W7000+ FX 8350 4,4 GHz 0:02:58

FX 8350 4,4 GHz 00:19:35

AMD FirePro W5000+ FX 8350 4,4 GHz 0:03:05

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:03:02

 

W7000 je o chloupek rychlejší (což o to, ona je rychlejší o hodně), ale využití karty je jen okolo 37 %. Výsledek tedy tomu odpovídá, jen decentní zrychlení. Situace by ale byla jiná, pokud...

 

Pokročilý test s množstvím filtrů

 

Při zpětném ohledání jak se karta chová jsem zjistil, že její výkon je jen dílčí. Respektive, její zatížení je poměrně malé (u W5000 max. 50%, většinou menší). Zkusil jsem tedy připravit ještě jeden test, který je poněkud odlišný.

 

Abych zatížil kartu podstatně více, zkusil jsem hned tři importovaná videa přes sebe, mající upravenou velikost a množství filtrů včetně dvou směrových rozostření přes sebe (každé video je filtrované zvlášť). Výsledky jsou ještě zajímavější než dříve, protože více využívají GPU a jejich výkon. V případě W7000 cca 80 % potenciálního využití grafické karty. A to už je podstatně více relevantní v praxi, než předchozí test. Video je kratší než dříve, délka sekvence je 600 snímků při 25 fps. Rozlišení FullHD.

 

Premiere

 

AMD FirePro 7000+ FX 8350 4,4 GHz 0:02:05

FX 8350 4,4 GHz 00:29:50

AMD FirePro 5000+ FX 8350 4,4 GHz 0:02:57

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:02:38

 

Výsledek je zajímavý a již ukazuje možnosti akcelerace v praxi. Pokud spojíme s potenciálem W7000 i 4 GB na RAM vychází pro tyto účely velmi relevantně. Karta je o více než 50 vteřin rychlejší než W5000 a o více než půlminutu před Q4000 s CUDA. Na druhou stranu mne mile těší, jak stále statečná je stará Fermi Quadro 4000. Premiere si s CUDOU prostě rozumí a starší věk CUDA poměrně smazává (ne zcela, ale přesto je výkon opravdu stále slušný). Jen ten provoz a hlavně teploty Q4000. Celkově je ale již tento test velmi průkazný. Je opravdu zásadní rozdíl, zda se video renderuje skoro tři minuty, či něco málo přes dvě... S délkou videa se samozřejmě dostáváme do oblasti výrazných časových úspor.

 

CINEMA 4D – Indigo renderer – Cindigo

 

V tomto oddíle jsem provedl změnu metodiky. Ostatně jsem to již zmínil v samotném úvodu. Podobné výsledky mi přišly velmi podezřelé vzhledem ke komparaci možností pomocí testu LuxMark (Luxrender), tedy hledal jsem důvody, proč tomu tak je. Indigo totiž není (jak prohlašují tvůrci) skutečný hybrid. Leckde se snaží výpočtu kartou pomoci, leckdy ale není karta využita vůbec naplno, protože jsou akcelerované pouze dílčí části výpočtů. Jindy zase karta převezme skoro celou úlohu a procesory jsou nechány ladem, výsledkem čehož může být (pokud je karta v dané úloze slabší), že je výpočet delší, než v případě, že by probíhal na samotném procesoru.

 

Jak z lesa ven? Zatím těžce. Snad se to změní, ale přesto lze nasimulovat opravdu plnohodnotný test. Test, ve kterém je procesor takřka nechán ladem a počítá jen a pouze karta. A výsledky jsou v takovém případě velmi průkazné, jakkoliv nejsou příliš potěšitelné pro stávající výpočetní algoritmus Indiga.

 

Pro komparaci s výsledky minulými ale uvedeme všechny testy, jakkoli mají velmi malou vypovídací hodnotu. V závěru je pak skutečný zátěžový test, který využívá kartu i na takřka 100 % (což potvrzuje i GPU-Z).

 

Scéna s teploměry

 

Tento test probíhal při využití renderovacího enginu Indigo přímo implementovaného jako plugin do CINEMY 4D. Jednalo se o verzi 3.4.19. Ve scéně jsou dva různě barevné high poly teploměry, scéna je bez textur (jen barvy), osvětlená dvěma plošnými světly. Pro možnost odečtu jsem nastavil koncovou hodnotu Halt samples per pixel na 300.

 

Cindigo

 

Délka výpočtu

AMD FirePro W7000 + FX 8350 4,4 GHz 00:03:29

FX 8350 4,4 GHz 00:04:48

AMD FirePro W5000 + FX 8350 4,4 GHz 00:03:27

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:03:34

Nvidia Quadro 4000 OpenCl + FX 8350 4,4 GHz 0:03:38

 

Potvrzuje se to, co jsme již předeslali. Není to vhodně postavený test a výsledek tomu odpovídá. Je na úrovni W5000 a před referenční Q4000. Jenže karta je využitá jen z 20 %. A to je velmi, velmi málo...

 

Indigo renderer (stand alone) – květina

 

I tento test je bez textur, jen s HDRi mapou a pak opět plošnými světly. Tématem je „sklo“, respektive kapalina. Pro odečet jsem nastavil koncovou hodnotu Halt samples per pixel na 300.

 

Indigo - květina

 

AMD FirePro W7000 + FX 8350 4,4 GHz 00:02:01

FX 8350 4,4 GHz 00:03:05

AMD FirePro W5000 + FX 8350 4,4 GHz 00:02:01

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:02:12

Nvidia Quadro 4000 OpenCl + FX 8350 4,4 GHz 0:02:08

 

Vypadá to jako omyl, ale dosáhl jsem stejného času (a to včetně další popisované karty, kterou si ukážeme příště!). Ono se nelze divit, karta je využita jen z 32, 33 %. Tedy opět, není to průkazný test.

 

„Interiér“

 

A ještě pro úplnost onen „interér, jakkoliv asi tušíte závěr. Jistě, jen ten nový test je relevantní...

 

Indigo - interiér

 

AMD FirePro W7000 + FX 8350 4,4 GHz 00:02:23

FX 8350 4,4 GHz 00:03:00+

AMD FirePro W5000 + FX 8350 4,4 GHz 00:02:31

Nvidia Quadro 4000 CUDA + FX 8350 4,4 GHz 0:02:26

Nvidia Quadro 4000 OpenCl + FX 8350 4,4 GHz 0:02:27

 

W7000 je sice o pár vteřin nejrychlejší, ale nic naplat. Všechny testy mi daly vlastně jedinou odpověď, nejsou vhodně nastavené. Představují sice reálné zrychlení, ale nikoli potenciál jednotlivých karet. Zkusme tedy něco jiného...

 

Indigo – instance komplexního objektu

 

Z knihovny produktu XFrog jsem si vypůjčil strom (jedli kavkazskou) a z ní pomocí Mgraphu CINEMY 4D vygeneroval les. Stromy jsou generované jako instance!!! To je velmi podstatné. A exportoval do Indiga. Výsledek je velmi zajímavý. Instance mají tu vlastnost, že šetří výpočetní výkon a to se projevuje ve výpočtu s procesorem (exkluzivně) na velmi dobrém výkonu v CPU. Ale stejně tak dobře testují GPU, kde je asi otázkou správná optimalizace algoritmu Indiga. Nám to ale nevadí, protože i když asi není optimální, jsou výsledky testů velmi průkazné (vyjma odskočivšího procesoru).

 

Indigo – instance komplexního objektu

 

Pojďme na to. Render probíhal v Indigu standalone v rozlišení 960 × 540 při hodnotě Halt samples per pixel na 100.

 

Časy testů byly následující:

AMD FirePro W7000 + FX 8350 4,4 GHz 00:11:02

FX 8350 4,4 GHz 00:09:16

AMD FirePro W5000 + FX 8350 4,4 GHz 00:20:32

Quadro 4000 CUDA + FX 8350 4,4 GHz 00:17:16

Quadro 4000 OpenCL + FX 8350 4,4 GHz 00:14:56

 

Rozdíl ve výkonu mezi W5000 a W7000 je obrovský. Navíc důkaz, že v případě tohoto typu výpočtu pracuje takřka výhradně grafická karta/a nebo CPU podle nastavení a druhé zařízení je takřka zcela ladem. Průkaznost v rámci posouzení GPU je tedy velmi vysoká.

 

Tento test je podle mého soudu vlastně jediný relevantní na posouzení výpočetního potenciálu grafické karty v Indigu. Její přínos evidentně závisí na typu scény, instance ale prověřily jen karty jako takové a to je velmi dobře. Výkon W7000 je velmi vysoký (i v porovnání s W5000). Co mne vlemi zarazilo je, jak dobře si vedla stará Q4000 v OpenCL. Zdá se, a to je závěr který se týká Indiga, že má lépe v tomto směru kompilované OpenCL pro Nvidii než pro AMD. Mimochodem, interní dotaz byl zodpovězen „je to možné“...

 

Luxmark

 

Možná nejlepším testem pro měření výkonu grafické karty v OpenCL je Luxmark, který stojí jen a pouze na tomto systému. Respektive Luxrender, samozřejmě. Mimochodem, mrzí mne absence pluginu pro nové verze CINEMY 4D, protože jinak se Luxrender dá například v Blenderu docela dobře používat (a dokonce jsem našel to správné tlačítko :)).

 

LuxMark I

 

Scéna Sala (střední)

AMD FirePro W7000: 1332

AMD FirePro W5000: 785

NVidia Quadro 4000: 293

 

Jen pro zajímavost, náročnější scéna Room výsledek:

 

LuxMark II

 

AMD FirePro W7000: 754

 

Pro Luxrender je AMD prostě stavěné a tady mu svědčí i tento plně vybavený Pitcairn. Pro výpočet je skoro i díky svým 4 GB na RAM předurčena při stále slušném provozu, prostorové nenáročnosti a jednoslotovému provedení. Jinými slovy, povedené...

 

Závěr

 

Nebudu obcházet okolo horké kaše. Nejsem určitě recenzent hardware v pravém smyslu slova, ale hardware jako mnozí z nás používám a testuji na věcech, které mi jsou blízké. To samozřejmě dělá výsledek subjektivní. Přesto, i přes tuto subjektivitu jsem došel ke stejnému závěru, k jakému došli na tomshardware.com. A to, že FirePro W7000 je výborná karta. Pro mne osobně skoro nejlepší, kterou můžete (momentálně) pro CINEMU 4D a rendering v OpenCL pořídit.

 

Vzpomeňte brutálního výkonu v OpenGL v CINEMA 4D R15 (Cinebench R15). 111 fps je úchvatná rychlost a karta je v editoru opravdu razantně znát. Stávající verze ovladačů v této verzi CINEMY 4D funguje perfektně. A budu se opakovat, ale i pro zpracování a rendering videa je karta výborná. Připočítáme-li 10bit například pro Photoshop a obecně zpracování obrazu, jedná se o ideální grafické železo. Pokud nepotřebujete CUDU, samozřejmě. Ale s tím nikdo asi nehne.

 

Slabinou (a to pěkně ukazuje zmíněný server) ve vaší aplikaci mohou být ovladače, ale to může být oboustranné, jakkoli mě se to (CINEMY 4D) momentálně netýká.

 

Pro mě osobně výborná karta. Vhodnější jsem pro editor C4D a OpenCL zatím v ruce neměl.

 

Za zapůjčení děkujeme společnosti Asbis.


Pavel Zoch, Ph.D.

 

 

 

Tématické zařazení:

 » Rubriky  » 3D grafika  

 » Rubriky  » Digitální video  

 » Rubriky  » Digitální fotografie  

 » Rubriky  » Software  

 » Rubriky  » 3dscena  

 

 

 

 

Přihlášení k mému účtu

Uživatelské jméno:

Heslo: