Hirdetés

Az NVIDIA processzora volt az idei GTC sztárja

A Grace mintáit már szállítja a cég a gyártópartnerek számára.

Az NVIDIA még a 2021-es esztendőben jelentette be, hogy platformot terveznek, az idei GTC-n pedig már arról beszélt a cég, hogy a szóban forgó tervekkel kapcsolatban a célegyenesre fordultak.

A GPU tekintetében már a múlt évben bemutatkozott a Hopper architektúra, ami a H100-as gyorsítóval megadja a platform adatpárhuzamos végrehajtásra optimalizált alapját, míg a Grace kódnevű CPU vonatkozásában az idei évre van beütemezve a start, és emiatt az NVIDIA a korábbinál bővebben is beszélt a fejlesztésről.

A Grace kódnevű dizájn sok szempontból már ismert, hiszen tudni róla, hogy 72 darab ARMv9 architektúrára épülő Neoverse V2 magot vonultat fel, magonként 64-64 kB-os L1 utasítás- és adatgyorsítótárral, illetve 1 MB-os L2 cache-sel, plusz ezen túlmenően az összes mag további 117 MB-os L3 gyorsítótáron osztozik. A rendszer érdekessége, hogy négy darab 128 bites vektormotort használ az ARM SVE2 utasításkészletével, így elég jó – az NVIDIA szerint 3,55 TFLOPS-os – számítási teljesítményt kínál majd dupla pontosságú lebegőpontos operációk mellett.

Maga a lapka a TSMC 4N nevű 5 nanométeres node-ján készül, és 480 GB-nyi, ECC-t is támogató, tokozás mellé integrált LPDDR5X rendszermemóriát használ, amit a memóriavezérlő 500 GB/s-os memória-sávszélességgel ér el, továbbá a lapka része még 64 darab PCI Express 5.0-s sáv is. Alapvető részelem lesz az NVLINK, pontosabban ennek negyedik generációs változata, amely a CPU-k közötti memóriakoherens összeköttetést 900 GB/s-nál nagyobb tempóval oldja meg. A fogyasztás tekintetében egy Grace CPU Superchip konfiguráció 500 wattos TDP kerettel dolgozik, és ebben benne van a memória is.

[+]

A fentiekből látszik, hogy a Grace leginkább a HPC-piacra fókuszálhat, mivel a legnagyobb limitjét a fő előnye adja: az integrált rendszermemória. Az NVIDIA ettől még összehasonlítja a fejlesztés Superchip, azaz kétutas verzióját az újgenerációs x86-os dizájnokkal, de rendkívül kevés adatot adtak meg arról, hogy konkrétan mik a tesztkörülmények, így a 20-30 százalékos teljesítmény, illetve 70 százalékos hatékonyságbeli előny egyelőre nem sokat mond.

Az NVIDIA megemlítette, hogy már szállítják az újdonság mintáit a partnereknek. Mivel az előző évből adott a H100-as gyorsító, így a normál Grace, ennek a Superchip konfigurációja, illetve a Grace és Hopper kombináció a CPU végleges startja után relatíve könnyen elkészíthető, a skálázhatóság szempontjából pedig lehet építeni az NVSwitch-re, nagyobb méretekben pedig a gyártás alatt álló BlueField-3 DPU-kra, amelyek szintén előkerültek az idei GTC-n.


[+]

Némileg kapcsolódó projekt a DGX Quantum, amely a Quantum Machines OPX+ nevű univerzális kvantumvezérlő rendszer QPU-ja mellé társítja be a Grace és Hopper konfigurációt. Ez egy érdekes kombinációt jelent a kvantumszámítógépek és a klasszikus számítási modellek között, egyfajta hibrid platformot biztosítva. A szoftveres alapot a CUDA Quantum adja, ami lehetővé teszi a QPU-k, GPU-k és CPU-k programozását egyetlen rendszerben.

Azóta történt

Előzmények

Hirdetés