Hirdetés

Formálisan is bejelentette a Tesla V100 PCIe verzióját az NVIDIA

A korábban leleplezett modell bemutatásakor már tudni lehetett, hogy jön egy PCI Express 3.0-s verzió, de a bejelentésre csak most került sor.

Az NVIDIA az idei GTC-n mutatta be a Tesla V100-at, pontosabban annak a Mezzanine SXM2 verzióját, ami lényegében az NVLINK-es megoldás. Erről az alábbi cikkben részletesen beszámoltunk, tehát az olvasóink megismerhették magát a lapkát, illetve a rá épülő termék specifikációit.

A korábbi bejelentés azonban csak az NVLINK-et használó modellre vonatkozott, de már akkor tudni lehetett, hogy lesz egy x16-os PCI Express 3.0-s csatolóba való Tesla V100 is, viszont az NVIDIA akkor erről még titkolózott, legalábbis olyan formában, hogy a specifikációit nem árulták el, de tagadni nem tagadták a létezését.

A formális bejelentésre most került sor, így már lehet tudni, hogy a PCIe verziójú Tesla V100 nem sokban különbözik a Mezzanine SXM2 verziótól. Ebben is 80 darab aktív SMV található, ami összesen 5120 darab FP32-es, 5120 darab integer, 2560 darab FP64-es, valamint 40 960 darab tensor feldolgozót eredményez. A textúrázó csatornák száma is marad összesen 336, illetve a 4096 bites memóriabusz sem változik, ahogy az erre felfűzött 16 GB-nyi HBM2 memória és az ECC támogatás sem.

A különbséget máshol kell keresni. Egyrészt a x16-os PCI Express 3.0-s csatolót használva nincs lehetőség az NVLINK interfész bevetésére, tehát ezek le vannak tiltva a lapkán belül. Egy képesség is platformfüggővé válik, ugyanis a GPU továbbra is képes a CPU-k laptábláinak közvetlenül elérésére, de csakis akkor, ha a processzor architektúrája IBM Power9. A Mezzanine SXM2 verziónál erre nem kell külön figyelni, mert NVLINK-et igazából csak a Power9 utasításrendszert használó processzorok támogatnak, az x16-os PCI Express 3.0-s modellnél viszont számolni kell azzal, hogy ez a képesség a legtöbb szerverben elérhetetlen lesz. Az IBM Power9 processzorok mellett egyébként a gyorsítótár koherencia támogatása mindenképpen elveszik, mivel ez egy NVLINK-hez kapcsolódó funkció.

A teljesítmény és a fogyasztási keret is módosult. Egyrészt a PCI Express 3.0-s verzió 250 wattos limitet használ, így az NVIDIA turbó órajelnek sem 1455, hanem 1370 MHz-et tervez. Ezzel számolva 7 TFLOPS-os, 14 TFLOPS-os, 28 TFLOPS-os és 112 Tensor TFLOPS-os elméleti teljesítményadat jön ki 64 bites, 32 bites és 16 bites lebegőpontos számítások, illetve az új Tensor magok mellett. Az NVIDIA nem nyúlt a memória effektív órajeléhez, amely ezáltal maradt 1,75 GHz, így a memória-sávszélesség 900 GB/s.

A Tesla V100 PCIe verzió passzív hűtést használ, tehát olyan szerverekbe szerelhető csak bele, amelyek biztosítják a 250 wattos hőteljesítmény megfelelő elvezetését. A termék valamikor az év második felében lesz elérhető, de pontos dátum még nincs, ahogy pontos ár se.

Azóta történt

Előzmények

Hirdetés