Hirdetés

Végre szivárognak az adatok a Vega 10-ről

Egyre többet tudni a lapka belső felépítéséről, illetve a rá épülő termékekről is.

Az AMD még az év elején leplezte le a Vega architektúrát, majd később az is kiderült, hogy a konkrét termékek nevében is ott lesz a VEGA jelzés. Ha a rendszer technikai hátterét nézzük, akkor elég sokat lehet tudni az újításokról, no persze nem mindről, de az AMD nem nagyon titkolta el a fontosabb képességeket. A specifikációkat viszont eléggé rejtegették, noha pletykák már igen régóta vannak. A megjelenéshez közeledve azonban szivárognak az adatok, és ezek már igen közel állnak a valósághoz. Konkrétan annyira, hogy csak azért nem tekinthetők hivatalosnak, mert nem az AMD jelentette be őket.

A Vega 10 a specifikációkat tekintve 2048 bites memóriabuszt használ, amelyre két darab HBM2-es memóriaszett kapcsolódik. Ez mondhatni nyílt titok volt eddig is, elvégre az AMD megmutatta magát a lapkát, és a fizikai kialakítást könnyű leolvasni. A lapka belseje azonban így is rejtve volt. Az előző év nyarán is csak annyival tudtunk szolgálni, hogy 64 darab multiprocesszor található benne, amely információ helytállónak bizonyult a legfrissebb adatok alapján. A strukturális felépítést tekintve azonban mára kiderült, hogy az NCU-k négy csoportra lesznek osztva, ami négy darab setup motort jelent. Ezek persze nem ugyanazok, mint régen, mivel amíg a korábbi legerősebb, Fiji kódnevű grafikus vezérlő csak 4 háromszöget tudott feldolgozni órajelenként, addig a Vega 10 elméleti maximuma 11 lesz. Ezt az AMD rengeteg trükkel éri el, így az egységek száma ugyan nem nőtt, de a lapka teljesítménye így is megugrott.

A ROP blokkok tekintetében a 16 darab NCU-t tartalmazó feldolgozócsoportokhoz négy-négy darab blokk fog tartozni, de ezek már nem részei az úgynevezett shader motornak, csupán logikai szinten lesznek ilyen struktúrával bekötve. Összesen tehát 16 ROP blokk lesz a lapkában, arról viszont nincs megerősített adatunk, hogy ezek belülről hogyan néznek ki, tehát a blending egységek számával kapcsolatban sajnos várni kell a további szivárgásokra.

A termékek tekintetében elmondható, hogy a Vega 10 igen sok megoldás alapja lesz. A nagyobb megrendelők már elérhetik a Radeon Instinct MI25-öt, aminek később lesz egy kijelzőkimenettel is rendelkező Radeon Pro verziója is. A professzionális igények szempontjából értékes információ lehet, hogy a Vega 10 támogatja ugyan a dupla pontosságot, de csak a szimpla számítási teljesítmény tizenhatod részével. Mindezek mellett a Vega 10-re épül majd az első SSG, amelyet az AMD szintén idén fog bemutatni. Az év vége felé továbbá érkezik még egy olyan Radeon Pro kártya is, amelyen két darab Vega 10 GPU lesz, és ezt kifejezetten a VR tartalomkreáláshoz szánja majd a cég.

A sima Radeon RX VEGA sorozatba szánt csúcsmodell hasonló lesz a Radeon R9 Fury X-hez, vagyis vizes megoldás készül. Emellett lesznek hagyományosabb hűtéssel rendelkező Radeonok is, amelyek részben a gyártók egyedi dizájnjaira épülnek majd, ezek között kisebb teljesítményű és nyilván olcsóbb Vega 10-es modellek is szerepelnek.

A harmadik területe a Vega 10-nek meglepetésre a mobil piac lesz. Ez azért érdekes, mert a notebookokba az ilyen óriási GPU-k nem szoktak lejönni. Ugyanakkor ennek nem igazán a hőtermelés az oka, mert az egyszerűen korrigálható, hiszen paraméterezés kérdése az egész. Megfelelően alacsony órajellel, és pár letiltott egységgel egy NVIDIA GP102-t is be lehetne passzírozni 125 wattba, ami kezd az új normává válni a játékra szánt notebookok területén. Nem mellesleg az NVIDIA ide már egy 180 wattos GeForce GTX 1080-at is kínál MXM modul formájában, tehát a hőtermelés ma már, ha nem is lényegtelen, de bőven kezelhető. Sokkal nagyobb probléma a helyigény. Egy méretes, 500 mm² körüli lapka tokozása sajnos igen nagy, és mellé még ott van a jellemzően 384 vagy 512 bites memóriabusz is, amire rá kell kötni a GDDR5 szabványú memóriákat. Ez egyszerűen akár 70-90%-kal is nagyobb lesz a notebookba kínált GPU-kra megengedett maximális platformdizájn méreténél, ami kisebb akkumulátor beépítését igényelné, de erre érthető okokból a gyártók nem vevők.

A Vega 10 helyzete azonban speciális, ugyanis a lapka által igényelt platformdizájn mindössze a harmada a ma elfogadottnak tartott maximumnak, vagyis arányaiban olyan kis helyre építhető be, amilyenbe ma a gyártók csak egy 150 mm² körüli kiterjedésű, 128 bites memóriabusszal rendelkező GPU-t tudnak minden szükséges komponens mellett integrálni. Hely tehát lesz bőven a hűtésnek, illetve a nagyobb akkumulátornak is. A friss dokumentumok szerint egy Vega 10-zel kiváltható bármilyen, mai csúcskategóriás notebookokban használt, 300 mm² körüli GPU, méghozzá úgy, hogy a teljesítmény is növekedhet, és eközben az akkumulátor kapacitása, dizájntól függően 40-60%-kal nagyobb lehet a felszabadult helynek hála. Utóbbi azért lehet lényeges a gyártóknak, mert manapság a csúcskategóriás, játékosoknak szánt notebookokban rendre letiltják az integrált grafikus vezérlőt a szoftveres átkapcsolás jellemző problémái miatt, így nagyon fontos lenne, hogy növeljék az elérhető üzemidőt, mivel a legtöbb ilyen megoldás csak nagy jóindulattal nevezhető mobil masinának a relatíve gyorsan merülő akkumulátor miatt.

A gyártók mellett a fejlesztők is számos optimalizálási útmutatót kapnak az AMD-től, amelyek zöme jelenleg a GCN3 és GCN4 architektúrát célozza, de a GCN5-ös alapra épülő Vega 10 ezektől radikálisan begyorsul. A mai programok még nem tartalmaznak úgynevezett csomagolásra vonatkozó optimalizálást, így 32 bites nem csomagolt adatokkal dogoznak. A vektorregiszterekre vonatkozó terhelés így tulajdonképpen teljes lesz, ami nem igazán jó, mivel sok shader esetében a nagyobb pontosságnak nincs lényegi haszna, és kihasználtságra vonatkozó limittel rendelkező SIMT architektúrának (ilyen a GCN is) az egész szituáció nem kedvez. Az AMD a megoldást kétféle csomagolási stratégiában látja, amelyeket struktúrák tömbje, illetve tömbök struktúrája néven illetnek. A GCN3 és GCN4 hardvereken mindkettő a felére csökkenti a vektorregiszterekre vonatkozó terhelést, így a kihasználtságra vonatkozó limit csökken, vagyis az újabb verziójú GCN dizájnok esetlegesen több wavefrontot futtathatnak a multiprocesszoron. Ez 10-20%-os extra sebességet jelenthet az adott shaderre vonatkozóan.

A GCN5 esetében azonban nem csak a vektorregiszterek terhelése lesz visszafogva, hanem konkrétan nő az operációk végrehajtásának tempója. Elméleti szinten ez a struktúrák tömbje opciónál 50%-kal jobb sebességet eredményez, míg a tömbök struktúrája verzió konkrétan a duplájára gyorsítja a feldolgozást. Az utóbbi optimalizálást alkalmazó programokban nagyon nehéz lesz még csak megközelíteni is a Vega 10-et, mivel a szimpla pontosság melletti elméleti számítási teljesítmény duplájára gyorsul az érintett shaderekre vonatkozóan. Bár az órajelek még nem véglegesek, de ez jelen állás szerint bőven 20 TFLOPS fölötti tempót jelent, míg a mostani leggyorsabb VGA-k alig lépnek túl a 10 TFLOPS-on, függetlenül a csomagolásra vonatkozó optimalizálástól. Magát a képességet viszonylag gyorsan kihasználhatja a piac, mivel a TressFX 4.0-nak létezik egy erre optimalizált verziója, amely ugyan még nem publikus, de a fejlesztők számára elérhető. Ilyen formában a Vega 10 kétszer több hajtincset képes megjeleníteni sebességvesztés nélkül, de persze maga az optimalizálás felhasználható a kétszer nagyobb teljesítmény biztosítására is, ez már egyéni preferencia kérdése.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés