Az AMD a tegnapi napon jelentette be a Radeon Instinct termékcsalád frissítését, amelyet az új, Rome kódnevű platform mellé szánnak. Úgy néz ki, hogy nem egy, hanem két modell is érkezik, amelyekhez megérkezett a pontos specifikáció is, de azt hozzá kell tenni, hogy amíg a Radeon Instinct MI60-at még idén elkezdik szállítani, addig a MI50 verzió elérhetősége a következő esztendő első negyedévének a végére csúszik.
A Radeon Instinct természetesen továbbra is a gépi tanulást tartja szem előtt, de már nem csak ennek rendel mindent alá a sorozat, így például a két új modell dupla, szimpla és felezett pontosság mellett is igen erősnek számít, konkrétan a piac két leggyorsabb megoldásáról van szó. De beszéljenek inkább a nyers számok, így az érkező, x16-os PCI Express 4.0-s Radeon Instinct modellek pontos paramétereit az alábbi táblázat részletezi:
Típus | MI50 |
MI60 |
---|---|---|
GPU kódneve | Vega 20 |
|
Architektúra | GCN5 | GCN5 |
Maximális magórajel | 1746 MHz | 1800 MHz |
Shader részelemek száma | 3840 | 4096 |
Mintavételezők száma | 240 | 256 |
Parancslisták száma | 64 | 64 |
QoS-t támogató parancslista |
van | van |
DMA motorok száma | 2 | 2 |
Int4 számítási teljesítmény | 107,2 TOPS | 117,8 TOPS |
Int8 számítási teljesítmény | 53,6 TOPS | 58,9 TOPS |
FP16 számítási teljesítmény | 26,8 TFLOPS | 29,5 TFLOPS |
FP32 számítási teljesítmény |
13,4 TFLOPS |
14,7 TFLOPS |
FP64 számítási teljesítmény | 6,7 TFLOPS | 7,4 TFLOPS |
Effektív memória-órajel | 2000 MHz |
2000 MHz |
Memória típusa | HBM2 | HBM2 |
Memóriabusz | 4096 bit | 4096 bit |
VRAM kapacitása | 16 GB | 32 GB |
Memória-sávszélesség | 1 TB/s | 1 TB/s |
Maximális fogyasztás |
300 watt |
300 watt |
Infinity Fabric linkek száma |
2 | 2 |
RAS képességek támogatás |
van | van |
A képességek tekintetében mindkét friss fejlesztés támogatja az AMD, PCI-SIG SR-IOV (single root I/O virtualization) szabványára épülő, hardveres virtualizációs rendszerét, amelyet MxGPU technológiaként szoktak emlegetni. Mindezek mellett a large BAR támogatása is megoldott a több GPU-s peer-to-peer kommunikációhoz. További fontos tényező az ECC támogatása, illetve a fejlett memóriaalrendszer, ami képes közvetlenül elérni az x86/AMD64-es szerverprocesszorok laptábláit. Ez talán a konstrukció legnagyobb előnye, mivel lehetővé teszi azt, hogy az MI50 és MI60 nagyméretű adathalmazzal is könnyedén megbirkózzon. Ezzel a képességgel a GPU-s gyorsítás használata az x86/AMD64-es szerverekben egyszerűbbé válik, mivel a korábbi hardvereken viszonylag sok programozói munkaórát elvitt a gyorsító memóriájára való optimalizálás, vagyis a feldolgozásra váró adatok olyan méretekre történő felosztása, hogy azok beférjenek a GPU fedélzeti memóriájába, illetve a szoftver képes legyen az elérhető fedélzeti tárat hatékonyan menedzselni. Ezt a Radeon Instinct MI50-es és MI60-as gyorsító nem igényli, a hardver képes magától megoldani a feladatot, mindenféle szoftveres segítség nélkül.
A fentieket persze már a Radeon Instinct MI25 is tudta, de nem kell aggódni a friss modellek újításokat is kínálnak. Az egyik a PCI Express 4.0 támogatása, ami a szerverek piacán egy lényeges szempont, hiszen itt azért nem feltétlenül lehet úgy optimalizálni a szoftvereket, hogy a CPU és a GPU közötti összeköttetés sávszélességére ne legyenek érzékenyek. Ezt egészítik ki az Infinity Fabric linkek, amelyekből GPU-nként kettő van, ezzel pedig a két GPU közötti közvetlen kapcsolat összesen 200 GB/s-os lehet. Itt érdemes megjegyezni, hogy három vagy négy gyorsítónál gyűrűs összeköttetést kell alkalmazni. Végül a két újdonság fontos fejlesztése még a RAS (reliability, availability, serviceability) képességeket támogatása.
A három év garanciával érkező Radeon Instinct gyorsítók a 64 bites Linux operációs rendszeren üzemképesek, és a ROCm szoftvercsomag biztosítja működésüket. A programozási környezet lehet ISO C++, OpenCL, CUDA a HIP konverziós eszközökön keresztül, illetve Python az Anaconda Numba fordítóját használva.