Zpět na článek

Diskuze: AMD Bulldozer – Nová architektura CPU od AMD

Nejsi přihlášený(á)

Pro psaní a hodnocení komentářů se prosím přihlas ke svému účtu nebo si jej vytvoř.

Rychlé přihlášení přes:

jutes

Level 1

6. 9. 2010 08:22

Komentáře tohoto uživatele máš zablokované.

AMD daj mi zamienku zahodit INTEL :wink:

Bohumil_Stej

Level 1

6. 9. 2010 08:47

Komentáře tohoto uživatele máš zablokované.

@jutes Za víc peněz jsi u Intelu a máš vyšší výkon, který v 99% případů stejně nepotřebuješ :P

Uživatel bez registrace

Level 1

6. 9. 2010 08:39

Komentáře tohoto uživatele máš zablokované.

Pekny clanek :!: :)
- Luke10

Reklama

zumik31

Level 1

6. 9. 2010 09:59

Komentáře tohoto uživatele máš zablokované.

Je vidět, že pan Obermaier se jako jeden z mála redaktorů na tomto webu opravdu vyzná. Moc se těším na pokračování s jádrem Bobcat.

Aros

Level 1

6. 9. 2010 12:39

Komentáře tohoto uživatele máš zablokované.

@zumik31 Tak přečetl jsem to celé a musíme toho OBRa pochválit. Předpokládám, že mu ten článek trval hodně dlouho, ale má tam všechno dobře a i překlady pojmů, které se nepřekládají v IT doslovně, má prostě všechny dobře... Takže fakt skvěle zvládnutý článek.

fotobaNEW

Level 1

6. 9. 2010 10:35

Komentáře tohoto uživatele máš zablokované.

@zumik31 Po prazdninach 2010 sa velmi zlepsil Clanok som cital len zbezne, ale opat strelil jednoho kapra, ktory nie je ale zavaznym

K9 bolo pracovne ozancenie dvojjadrovyvh K8 preto to oznacenie K10 pre stvorjadra.,.

DOC_ZENITH

Level 1

6. 9. 2010 10:42

Komentáře tohoto uživatele máš zablokované.

Jen jedna věc. Ze začátku zmiňujete že vše vychází z Pentia. No, ono z Pentia (5x86) ani tak moc ne, P54 ala Pentium ala socket 4 (první s vadnou FPU), později socket 5 a 7 + Pentia MMX jsou 5x86 a z těch to fakt nevychází. Vychází to z Pentia PRO, naprosto jiného (tehdy primárně serverového - jak jinak) CPU do socketu 8, to byl první CPU 6x86 generace a P6 architektury, ze který přímo vycházej i Core2 a Nehalem se tam taky v mnoha věcech inspiruje. Pentium PRO je rok 1996 ano tak dlouho jsme tu neměli revoluci, jen evoluci.

Jen ještě jdna věc, trochu se obávám o herní výkon Buldozerů. ano, správně dělaj když budou jednu FPU sdílet pro obě dvě logická jádra. Protože na serverech je poměr ALU/FPU zátěže asi 80/20, čili je tam solidní rezerva. Ale v hrách je to právě naopak kdy 80% leží právě na FPU jednotce. A to by mohl být problém.

fotobaNEW

Level 1

6. 9. 2010 11:03

Komentáře tohoto uživatele máš zablokované.

@DOC_ZENITH tam je to vyriesene
APU - teda GPGPU na chipe, ktora ma 10x taky FPU vykon ako CPU s mensou presnostou a asi 2x taky vykon s rovnakou presnostou ako CPU.

simiksimik

Level 24

6. 9. 2010 11:06

Komentáře tohoto uživatele máš zablokované.

"...bych vám neměl prozradit více než se obecně traduje – počet jader stoupl o 33 procent při navýšení výkonu o 50 procent. Já vám ale něco navíc řeknu, podle několika výsledků v prezentaci se dalo zřetelně vyčíst, že výkon na jádro by měl proti K8 (10h) narůst od 10-15 procent."--Takže 1,5 výkonu při 1,33 nárůstu jader a máme tu 1,5/1,33=1,1278 nárůst výkonu na jádro. Tj. 12,78%.-------------
Článek je plný kostrbatých vět, zřejmě jak je autor přepisoval do výsledné podoby (alespoň tak se mi to stává:-). Chtělo by to ho ještě přečíst a upravit.

DOC_ZENITH

Level 1

6. 9. 2010 11:28

Komentáře tohoto uživatele máš zablokované.

@simiksimik Nárůst, ale v čem? Pokud to bude 80% nárůst v ALUoperacích a 50% propad v FPU tak to furt odpovídá nárůstu výkonu na jádro.... o to jde.

simiksimik

Level 24

6. 9. 2010 11:55

Komentáře tohoto uživatele máš zablokované.

@DOC_ZENITH Šlo mi o to, že ta supertajná informace nepřináší oproti té co "se obecně traduje" nic nového. Že i ta 1. má vypovídající hodnotu mizivou je jiná věc.

Reklama

simiksimik

Level 24

6. 9. 2010 11:11

Komentáře tohoto uživatele máš zablokované.

Nemyslel jsem tím, že nárůst bude přesně 12,78%, ale to že tajná informace 10-15% nepřináší oproti té předchozí nic nového.

Lokavidu

Level 1

6. 9. 2010 14:13

Komentáře tohoto uživatele máš zablokované.

velmi prijemne cteni pro pondelni rano :)

Mesiah

Level 1

6. 9. 2010 15:09

Komentáře tohoto uživatele máš zablokované.

takže, pokud jsem to dobře pochopil, teoreticky zle vzít jeden "modul" a ten nahradit "grafickým modulem" ?
Pak by to bylo skvělé a teoreticky by šlo přidat funkci do proceseru, který při práci s plovoucí desetinnou čárkou(tečkou) přepne výpočet na grafiku.... otázka je, zda "přepnutí" nebude pomalé, ale to by vzhledem k tomu, že má sdílenou L3 paměti neměl být problém.... ne?

JoHnY2

Level 1

6. 9. 2010 15:57

Komentáře tohoto uživatele máš zablokované.

@Mesiah To bych rek ze nepujde. Logika, ktera visi nad vsema modulama CPU by musela rozumet i podivnejma instrukcim pro GPU modul a ten jen tezko muze pouzivat normalni x86 instrukce.

Urcite existuje nejaky reseni, ale ja se svejma znalostma radci nebudu ani moc spekulovat. :wink: Vazne by me zajimalo jak dohromady spojit CPU, ktery jede na x86 a vlastnich microOPs a GPU, ktery v pripade AMD ani z dalky nepripomina CPU. Pouziva VLIW a nejspis nemaj ani ustalenou instrukcni sadu mezi generacema (RV7xx bude mit trochu jinou sadu nez RV8xx ...). Reseni urcite nebude zadna sranda.
Bude zajimavy sledovat kdo bude mit lepsi pozici. AMD ma diky ATI mnohem vetsi know how v oblasti GPU. Intel n druhou stranu muze rozhazovat penize a Larrabee je vyrazne bliz CPU a nez rekneme RV870.

Kazdopadne preju AMD uspech aspon takovej jakej byl s K8kou.

Z. Obermaier

PCTuning

6. 9. 2010 20:03

Komentáře tohoto uživatele máš zablokované.

@JoHnY2 Právě, že to půjde a je to také cesta budoucnosti, kterou půjde AMD i Intel. Představte si to takto, podívejte se na Bulldozer modul a FPU cluster uprostřed se čtyřmi výpočetními jednotkami nahraďte třeba 80 Stream procesory .. SP procesory umí stejné microOPs jako výpočetní jednotky CPU, umí počítat nic víc umět nemusí ... takový FPU výkon bude vůči tomu dnešnímu gigantický ... aplikace vůbec nepozná, že část počítají SP procesory nebo FPU jádra CPU, jen se vše provede ultra rychle a procesor to bude řídit sám ... tohle není hudba daleké budoucnoszi, ale letošního roku ... AMD už první APU předvedlo a jistě i letos uvede ...

Chroustostroj

Level 1

6. 9. 2010 17:35

Komentáře tohoto uživatele máš zablokované.

@JoHnY2 Mne to naopak nerealne neprijde. Dnesni cpu prece taky nejsou nativni x86, ale x86 instrukce jsou prekladany do internich microOPs. Je jedno jakou instrukcni sadu aktualni generace GPU pouziva, decoder muze byt uzpusoben vzdy na tu, ktera je obsazena v chipu. Ohledne rozhodovani na co pouzit FPU a kde GPU je to jiste slozitejsi, ale kdyz muzou fungovat veci tak slozite jako predikce vysledku, jiste v AMD vymysli vnitrni logiku i pro toto. Jestli neco takoveho rozpracovano nemaji do detailu, pak vidim mnohaletou marketingovou strategii ve jmenu Fusion jako prinejmensim trapnou.

0xR

Level 1

6. 9. 2010 22:15

Komentáře tohoto uživatele máš zablokované.

@JoHnY2 @Z. Obermaier: Ne nepujde. Ja se optimalizovanim a programovanim GPU a CPU (SSE) zivim, takze vim, co pisu :). I kdyby tam nakrasne bylo milion stream procesoru, tak by je nebylo cim krmit, protoze nejde provadet vic instrukci paralelne v jednom threadu, nez rekneme 3 nebo 4. Je to stejny pripad jako INT jednotky. Vic nez 2 se vyuziva tezko, proto treti INT jednotku AMD vypustilo. Mluvime samozrejme o normalnim obecnem x86 kodu s SSE. Jak uz jsem psal, ty instrukce jsou na sobe navzajem zavisle, tak jak byste je chtel paralelizovat ? A co vetveni, adresovani atp. Kazda druha SSE instrukce pracuje primo s pameti a k tomu potrebuje GP registry, kterymi GPU nedisponuje. Navic, SP rozhodne neumi stejne micro-ops, jako CPU. SSE instrukci jsou stovky a vetsinou jsou to single micro-ops. GPU podporuje kolem 20-ti instrukci +-. Nejhorsi by ale bylo vetveni, ktere se navic dela v INT casti. FPU/SSE nejde od INT oddelit, natoz provadet v GPU casti. Vase reseni mi pripomina ten trojclenkovy vtip, kdy 1 Cinan vykope jamu za 5 hodin, za jak dlouho tu jamu vykope milion Cinanu ? GPU potrebuje tisice threadu. FPU v Bulldozeru bude pracovat se 2 a navic s promichanymi INT, FPU a SSE instrukcemi, vcetne tech, co patri do vice skupin soucasne... GPU v CPU musi byt specialne programovano. Nikdy nebude provadet zadny druh x86 kodu, ani micro-ops z neho pochazejici. Kdo pise, nebo videl, jak vypada typicky x86 SSE(2,3,4) kod, tak nema pochyb. Ano, AMD APU predvedlo, ale bude to jen hodne integrovane GPU/VPU, se spolecnou cache a mozna i load/store engine. Nic vic.

0xR

Level 1

6. 9. 2010 20:13

Komentáře tohoto uživatele máš zablokované.

@JoHnY2 @Chroustostroj: Lidi, neblaznete, vyuzivat GPU jadra pro x86 FPU instrukce je naprosty nesmysl.GPU ma pipeline dlouhou radove stovky stages, takze kazda takto zpracovavana instrukce by mela latenci stovky taktu. Coz je zhruba 50x vic, nez ma FPU v procesoru ;). GPU je optimalizovana pro obrovske mnozstvi nezavislych instrukci a threadu a ne pro jednotlive, navzajem zavisle FPU / SSE instrukce, ktere navic pro adresovani pameti pouzivaji standardni x86 registry a AGU. To je jako byste dali do A380 motor z F16 a mysleli si, ze bude letat nadzvukovou rychlosti :).

Kdyz to reknu jeste trochu jinak - FPU v CPU je dokonce rychlejsi, nez v GPU, ale GPU ma techto jednotek stovky. Ale pro CPU neni pocet jednotek dulezity, protoze vetsinou stejne nejde vykonavat soucasne vic nez 2 az 3 instrukce naraz, protoze v programu jsou skoky a instrukce jsou na sobe vzajemne zavisle.

Z. Obermaier

PCTuning

7. 9. 2010 07:51

Komentáře tohoto uživatele máš zablokované.

@JoHnY2 @0xR: bohuzel se mylis ty, presne jak to rikam to amd prezentovalo na hot chips 22 konferenci ... a intel ukazal u sve architektury haswell ... mozna si jen nerozumime ... sp procesory nebudou jen fpu jednotkou ale radou klasickych alu/fpu jednotek ... pokud prijde vysoce paralelni kod, pujde ke zpracovani tam, pokud pujde o beznou aplikaci pujde do cpu, tohle reseni nas ceka ve finalni podobe mozna za tri, ctyri roky ... to bude zrejme cely x86 model cpu kompletne prepracovan pro tuto moznost

0xR

Level 1

7. 9. 2010 10:44

Komentáře tohoto uživatele máš zablokované.

@JoHnY2 @Z. Obermaier: Ano, souhlasim, ze pro specialne napsany vysoce paralelni kod (nejspis s vlastni sadou instrukci) to bude mozne - neco ve stylu x87, kdyz byl jeste samostatny koprocesor. Ale urcite ne pro normalni x86 (SSE) kod, ten proste paralelizovat nejde a kdo to dokaze, ma Nobelovku jistou :).

Jinak, firemni prezentace je nutne brat s trochou te "grain of salt". Oni tam prezentuji vselico a realita je pak trosku jina. Pripadne, clovek si v nadseni rad domysli i to, co tam neni :). Ono je to videt i ve tvem clanku, ktery obsahuje dost technickych chyb a nepresnosti - treba o te delce pipeline. Ty cisla tusim 17 a 23 neznamenaji pocet stages, ale latenci jedne stage. A taky samozrejme - vic stages = vyssi frekvence a mensi vykon a ne naopak, jak je (nebo aspon vcera bylo) uvedeno. Ale nechci rypat, laickym ctenarum je to stejne fuk a ja uz musim jit zase makat :).

yuri.cs

Level 1

7. 9. 2010 16:30

Komentáře tohoto uživatele máš zablokované.

@JoHnY2 @0xR: Presne tak, musim dat palec nahoru :)

Delka instukcni pipeline je primo umerna dosahovane frekvenci a neprimo umerna dosahovanym realnym IPC.
-> zkontrolujte na jednotlivych NetBurstech :)

Jinak, do dnesnich SPs opravdu nenacpeme zadnou uOPS z CPU... Takovahle architekturalni unifikace je v nedohlednu.

Cpani GPU a CPU pod jeden IHS je jen k vykonavani OpenCL, ComputeShaderu nebo Stream kodu.
Vyhoda spociva v nizsich nakladech a zrejme hlavne i v rozsireni pomerne solidnich GPU i lowendu.

Hlavne ne Federmannuv pristup...

Reklama

randomofamber

Level 20

6. 9. 2010 17:16

Komentáře tohoto uživatele máš zablokované.

Nepochopil jsem, proč jsou ve článku zvýrazněna některá slova. Zvláště pak INTEL a AMD. Možná to někomu jinému nepřijde, ale na mě takové množství působí rušivě a čtení článku jsem skončil na první stránce... Dle mého osobního názoru má zvýrazňování sloužit ke zdůraznění nějaké skutečnosti v textu, ale to co je v tomto článku vypadá jako textový "Product placement" a navíc rušivý. Pro samé AMD, INTEL a zase INTEL a AMD mám dojem, že článek je o podílu počtu těchto názvů v textu a ne o nové architektuře...

Michal Šimonek

Level 1

7. 9. 2010 07:46

Komentáře tohoto uživatele máš zablokované.

@randomofamber [quote=Ranger666][quote]Nyní se mi zdá, že Bulldozer bude rovnoprávným soupeřem pro Sandy Bridge[/quote]

som zvedavy...dufam ze to skonči tak ako vzdy :roll:[/quote]

Jak jako vždycky? Podívej na Thuban, ve své kategorii vynikající CPU, nebýt existence Gulftownu s 12 vlákny, pak by spolu s i7 965 patřil k nejvýkonějším CPU v nabídce.

Ranger666

Level 1

6. 9. 2010 19:08

Komentáře tohoto uživatele máš zablokované.

[quote]Nyní se mi zdá, že Bulldozer bude rovnoprávným soupeřem pro Sandy Bridge[/quote]

som zvedavy...dufam ze to skonči tak ako vzdy :roll:

Z. Obermaier

PCTuning

6. 9. 2010 19:55

Komentáře tohoto uživatele máš zablokované.

[quote=fotobaNEW]Po prazdninach 2010 sa velmi zlepsil Clanok som cital len zbezne, ale opat strelil jednoho kapra, ktory nie je ale zavaznym

K9 bolo pracovne ozancenie dvojjadrovyvh K8 preto to oznacenie K10 pre stvorjadra.,.[/quote]

K9 byl zrušený projekt, K10 v podstatě neexistuje ... u K8 AMD opustilo označení Kxx a nahradilo jej slovními názvy - Bulldozer, Bobcat ... atd.

Reklama

Z. Obermaier

PCTuning

6. 9. 2010 19:58

Komentáře tohoto uživatele máš zablokované.

[quote=DOC_ZENITH]Jen jedna věc. Ze začátku zmiňujete že vše vychází z Pentia. No, ono z Pentia (5x86) ani tak moc ne, P54 ala Pentium ala socket 4 (první s vadnou FPU), později socket 5 a 7 + Pentia MMX jsou 5x86 a z těch to fakt nevychází. Vychází to z Pentia PRO, naprosto jiného (tehdy primárně serverového - jak jinak) CPU do socketu 8, to byl první CPU 6x86 generace a P6 architektury, ze který přímo vycházej i Core2 a Nehalem se tam taky v mnoha věcech inspiruje. Pentium PRO je rok 1996 ano tak dlouho jsme tu neměli revoluci, jen evoluci.

Jen ještě jdna věc, trochu se obávám o herní výkon Buldozerů. ano, správně dělaj když budou jednu FPU sdílet pro obě dvě logická jádra. Protože na serverech je poměr ALU/FPU zátěže asi 80/20, čili je tam solidní rezerva. Ale v hrách je to právě naopak kdy 80% leží právě na FPU jednotce. A to by mohl být problém.[/quote]

Já myslím, že asi ani ne. Žádná hra neumí využít osm jader CPU, tedy se bude Bulldozer chovat ve hrách jako pomyslné čtyřjádro + dedikovaná FPU jednotka ke každému z nich. To bude na hry bohatě stačit ...