Hirdetés

Az EPYC mellé szánja az AMD a Radeon Instinct termékcsaládot

Persze a gyorsítók bármilyen processzor mellett működnek, elvégre PCI Express csatolóba illeszkedő megoldások.

Az AMD az EPYC sorozat mellett bejelentette a Radeon Instinct termékcsaládot is, amelyről korábban már beszéltek, de ezúttal a specifikációk is kiderültek, pont úgy, ahogy az új szerverprocesszoroknál.

A Radeon Instinct természetesen továbbra is a gépi tanulást tartja szem előtt. Ennek rendel mindent alá a sorozat, de igazából használható más szerveres feladatok gyorsítására is. A gépi tanulást manapság amúgy is szokás kihangsúlyozni, hiszen ez a terület produkál lényeges növekedést.

Az érkező, x16-os PCI Express 3.0-s Radeon Instinct modellek pontos paramétereit az alábbi táblázat részletezi:

AMD Radeon Instinct sorozat (GCN architektúrával)
Típus MI6
MI8
MI25
GPU kódneve Polaris 10
Fiji
Vega 10
Architektúra GCN4
GCN3 GCN5
Maximális magórajel 1243 MHz 1000 MHz 1500 MHz
Shader részelemek száma 2304 4096 4096
Mintavételezők száma 144 256 256
Parancslisták száma 64
64 64
QoS-t támogató parancslista
van van van
DMA motorok száma 2 2 2
FP16 számítási teljesítmény 5,7 TFLOPS 8,2 TFLOPS 24,6 TFLOPS
FP32 számítási teljesítmény 5,7 TFLOPS

8,2 TFLOPS

12,3 TFLOPS
FP64 számítási teljesítmény 0,358 TFLOPS 0,512 TFLOPS 0,768 TFLOPS
Effektív memória-órajel 7000 MHz 1000 MHz
1890 MHz
Memória típusa GDDR5 HBM HBM2
Memóriabusz 256 bit 4096 bit 2048 bit
VRAM kapacitása 16 GB 4 GB 16 GB
Memória-sávszélesség 224 GB/s 512 GB/s 484 GB/s
Maximális fogyasztás
150 watt
175 watt
300 watt

A táblázatban szereplő gyorsítók között elég sok különbség van. A célpiac szempontjából az AMD a MI6-ot a gépi tanulás dedukció, míg a MI25-öt a tréning szakaszára ajánlja. A MI8 igazából egy kivételes megoldás, mivel ennek a méreteiből származik az előnye, elvégre olyan helyre is befér, ahova más hasonló teljesítményű gyorsító nem. Továbbá, amennyiben az adott feladat nem érzékeny a memória kapacitására, de a sávszélességre és a számítási teljesítményre igen, akkor a MI8 egy ideális választássá válik.

A képességek tekintetében az összes Radeon Instinct modell támogatja az AMD, PCI-SIG SR-IOV (single root I/O virtualization) szabványára épülő, hardveres virtualizációs rendszerét, amelyet MxGPU technológiaként szoktak emlegetni. Mindezek mellett a large BAR támogatása is megoldott a több GPU-s peer-to-peer kommunikációhoz.

AMD Radeon Instinct MI6, MI8 és MI25 AMD Radeon Instinct MI6, MI8 és MI25 AMD Radeon Instinct MI6, MI8 és MI25
AMD Radeon Instinct MI6, MI8 és MI25 [+]

A MI25-ös modell a MI6-hoz és MI8-hoz képest további extra képességeket kínál. Ezek közül az egyik a fejlettebb menedzsmentáramkör, amivel a hardverek egyszerűen monitorozhatóvá válnak a széles spektrumon skálázható szerverekben, és a menedzselhetőség távolról is megoldható. További extra az ECC támogatása, illetve a fejlett memóriaalrendszer is lényeges, ami képes közvetlenül elérni az x86/AMD64-es szerverprocesszorok laptábláit. Utóbbi talán a konstrukció legnagyobb előnye, mivel lehetővé teszi azt, hogy a MI25 nagyméretű adathalmazzal is könnyedén megbirkózzon. Ezzel a képességgel a GPU-s gyorsítás használata az x86/AMD64-es szerverekben egyszerűbbé válik, mivel a korábbi hardvereken viszonylag sok programozói munkaórát elvitt a gyorsító memóriájára való optimalizálás, vagyis a feldolgozásra váró adatok olyan méretekre történő felosztása, hogy azok beférjenek a GPU fedélzeti memóriájába, illetve a szoftver képes legyen az elérhető fedélzeti tárat hatékonyan menedzselni. Ezt a Radeon Instinct MI25-ös gyorsító nem igényli, a hardver képes magától megoldani a feladatot, mindenféle szoftveres segítség nélkül.

A három év garanciával érkező Radeon Instinct gyorsítók a 64 bites Linux operációs rendszeren üzemképesek, és a ROCm szoftvercsomag biztosítja működésüket. A programozási környezet lehet ISO C++, OpenCL, CUDA a HIP konverziós eszközökön keresztül, illetve Python az Anaconda Numba fordítóját használva.

Az AMD elsődlegesen az EPYC mellé szánja a Radeon Instinct megoldásokat, kiemelve azt, hogy az egyutas EPYC platformba hat is beépíthető anélkül, hogy PCI Express átkapcsolót kellene használni, de nyilván bármilyen processzorral üzemképesek. Az Inventec már bejelentette, hogy terveznek egy olyan rack szervert, amely 125 darab Radeon Instinct MI25-öt használ, és 3 PFLOPS lesz a teljesítménye. A Falconwitch egy jóval szerényebb megoldással készül, mivel ennél a fejlesztésnél maximum 16 Radeon Instinct MI25-öt lehet bevetni, de sokak számára a 400 TFLOPS is elég lehet. A gyorsítók már elérhetők a partnerek számára, míg a rájuk épülő szerverek forgalmazása egy picit később kezdődik meg.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés