Zpět na článek

Diskuze: TMPGEnc s CUDA - první zkušenosti

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

Uživatel bez registrace
Uživatel bez registrace
Level 1 Level 1
7. 11. 2008 18:05

Komentáře tohoto uživatele máš zablokované.

Pro ověření implementace CUDA jsem použil ještě další PC, kdy byly výsledky obdobné.

Protože na webu Pegasysu je informace o optimalizaci pro MPEG 2, použil jsem MPEG2 jako vstupní a výstupní formát a aktivoval všechny možné filtry. V praxi spíše nemožný jev - pokud se na video chcete ještě někdy dívat.
Deinterlace je inaktivní, protože zdroj není prokládaný, ale aktivní byly:
zmenšení, oříznutí, barevná úprava, odstranění šumu, normalizace zvuku, zvýraznění obrysů a odšumení zvuku :-)

časy byly - 260 sek bez CUDA 358 sek s CUDA

Závěr: mám pocit, že firma Pegasys si chce na vlně CUDA přihřát svou polívčičku, vyrobí produkt, který CUDU rozpozná, možná i nějak využije, ale protože plná podpora CUDA by znamenala kompletní přepsání všech filtrů (kodeků) - mám na mysli kodeky, ne filtry upravující obraz, tak se proklamovaných slibů asi hned nedočkáme.

BTW: TMPGEnc používá Mainconcept H264 filtr, který dnes patří do stáje DIVx. Pokud nebude filtr přepsán výrobcem (Pegasys má těžko jeho zdrojový kód), pak bude podpora CUDA je realtime poměr CPU/GPU, který mate zákazníka, aby si koupil něco, co ve skutečnosti nefunguje.
- Pavel Vychodil

Uživatel bez registrace
Uživatel bez registrace
Level 1 Level 1
16. 11. 2008 21:38

Komentáře tohoto uživatele máš zablokované.

NA GPU encoding cakam od cias 6600Gt /mal byt pre MPEG2/

stale nic- vyvoj h.264 trval 10rocie je za tym narocna matematika a vieme ako dlho sa rodilo purevideo a UVD len na dekodovanie

a hlavne ISO 64 bit -vykon GTX280 - 100GFLOPS
a ATI 4870 je 220GFLOPS
a tento vykon je podstatny v operaciach kde nahradzuje GPU procesor
takze ak 96 GFLOPS ma Intel Core 2 Quad Q9650 3GHz 12MB L2
tz ze kodek roky optimalizovany na 96 GFLOPS cpu nemoze rychlejsi na ISO-100GFLOPS GPU
ale vzajomna spolupraca CPU a GPU - poskytne napr 4x vyssiu rychlost a podobne

zrychlenie oproti dual core - tj bezny pouzivatel bude vzdy vidiet zrychlenie aj na 9800GT iso-55GFLOPS oproti 20GFLOPS DUAL CORE CPU

chcem poprosit autora o doplnenie tychto udajov aby citatelia videli nielen herny ale aj vypoctovy-vedecky vykon kariet tak ako sa udava vo svete profesionalov

Napr ako tu
4850 - 200 GFLOPS Double Precision, 150 Watts 8GFLOPS/Watt
http://ati.amd.com/technology/streamcomputing/IUCAA_Pune_PEEP_2008.pdf

- Jan Mazuch

Uživatel bez registrace
Uživatel bez registrace
Level 1 Level 1
17. 11. 2008 16:25

Komentáře tohoto uživatele máš zablokované.

@Uživatel bez registrace V poslednom riadku hovoris o 8GFLOPS na watt a mas tam aj napisanych 150W. To by znamenalo ze karta musi mat 1200GFLOPS (1.2TFLOP) aby to bolo spravne.
- Dominik

Uživatel bez registrace
Uživatel bez registrace
Level 1 Level 1
18. 11. 2008 17:26

Komentáře tohoto uživatele máš zablokované.

@Uživatel bez registrace OK, doplnim - skopiroval som to s clanku o 4870
a 4850 tj- vykon
ATI HD4870
1200GFLOPs - single precision - dolezite pre hry
240 GFLOPS - DOUBLE PRECISION - pre vypocty
ATI HD4850
1000GFLOPs - single precision - dolezite pre hry
200 GFLOPS - DOUBLE PRECISION - pre vypocty
- Jan Mazuch

Reklama
Reklama