Hirdetés

Leleplezte a Tesla V100-at az NVIDIA

A Volta architektúra számos újítást kínál a szerverpiacra, és az év második felében elérhető is lesz az NVIDIA DGX-1V szerverrel.

Az NVIDIA az idei GTC-n leleplezte a Tesla V100 jelzésű gyorsítót, amely már a vállalat új, Volta architektúrára épülő lapkáját kapta meg. Ez annyira nem érhette váratlanul a világot, hiszen a vállalat alapvetően beállt egy olyan ciklusra, hogy ha az új termék ténylegesen nem is lesz elérhető a GTC pillanatában, a leleplezés mindenképpen megtörténik.

A paraméterek tekintetében Jen-Hsun Huang, a vállalat elnök-vezérigazgatója egy 815 mm²-es GPU-ról beszélt, amely már egy meglepő adat volt, de a 21 milliárd tranzisztor bizony sok helyet igényel. A Tesla V100 GV100 kódnevű GPU-ját a TSMC gyártja, méghozzá a 12 nm-es FFN node-on, ami a jelenleg elérhető 16 nm-es FinFET továbbfejlesztése. Ezért van az, hogy a tranzisztorsűrűség a GP100-as GPU-hoz képest gyakorlatilag elhanyagolható mértékben javult. Itt tehát fontos kiemelni, hogy a TSMC esetében (amúgy általánosan is) a nanométer előtti szám rendkívül csalóka, ugyanis amíg a 16 és a 12 nm-es FinFET node között nüansznyi a különbség, addig a 12 és 10 nm-es node esetében a javulás óriási az utóbbi javára. És ez teljesen független attól, hogy a 12 szám szerint közelebb áll a 10-hez, mint a 16-hoz.

A második generációs HBM memória természetesen megmarad, ahogy a 4096 bites memóriabusz is, tehát ezúttal is 4 darab memóriatömb lesz a GPU mellett az alatta fekvő interposeren, ami 16 GB-os kapacitást kínál. A memória-sávszélesség meglepetésre nem 1 TB/s, elvégre ez lenne az elérhető maximum, de az interposer extrém kiterjedése valószínűleg ezt nem teszi elérhetővé, így a HBM memóriák effektív 1,8 GHz-en járnak majd.

NVIDIA Tesla V100
NVIDIA Tesla V100 [+]

Az NVIDIA magáról a lapkáról elárulta, hogy 16 MB-nyi gyorsítótár található benne, illetve az is kiderült, hogy a beépített multiprocesszorok összesen 20 MB-nyi regiszterterületet kínálnak. Ennél érdekesebb, hogy a vállalat konkrétan elárulta Tesla V100 számítási teljesítményét, amely 64 bites és 32 bites lebegőpontos számítások mellett rendre 7,5 TFLOPS és 15 TFLOPS lesz. Az, hogy ez konkrétan milyen felépítéssel jön ki, arról később írunk egy részletesebb elemzést, viszont már most megemlítjük a Volta architektúra legnagyobb újítását, azaz a Tensor magokat. Ebből a szempontból már 120 tensor TFLOPS érhető el, ami a gépi tanulás szempontjából lényeges paraméter.

A Tesla V100 a Tesla P100-hoz hasonló dizájnban érkezik, így rendkívül kritikus az NVLINK interfész. Ez ráadásul egy második generációs megoldás. Ez egy irányba 25 GB/s-os adatátvitelt kínál, és mivel a GV100-ban hat darab, kétirányú kommunikációra képes NVLINK található, így összesen 300 GB/s biztosított. Nem ez azonban a legfőbb előnye a továbbfejlesztésnek, hanem az IBM Power9 processzorokat használó szervereknél a gyorsítótár koherencia támogatása. A Voltak másik fontos újítása a modernizált MPS (Multi-Process Service), amely a korábbinál lényegesen jobb QoS konstrukciót kínál, így az eddiginél hatékonyabban képes megosztani a GPU erőforrásait több alkalmazás futtatása esetén. Továbbá, amíg a GP100 csak 16 MPS klienst támogatott, addig a GV100 már 48-at is kiszolgál. A harmadik és egyben legnagyobb újítás azonban az IBM processzorok melletti ATS (Address Translation Services) támogatás. Ez lehetővé teszi a GV100-as GPU-nak, hogy direkten elérhesse a CPU-k laptábláit. Utóbbi esetben az NVIDIA az architektúrát nem emelte ki, de minden bizonnyal ez a funkció is az IBM Power9 processzorokra vonatkozik.

A Tesla V100 a P100-as modellhez hasonlóan 300 wattos TDP fogyasztással érkezik, de itt újítás, hogy a TDP limit bizonyos határok között konfigurálható lesz. Tehát az ügyfelek megadhatnak egy maximális fogyasztási hatást a rendszernek, ami 300 watt alatt lehet. Ezzel ugyan a teljesítmény csökken, de végeredményben a fogyasztás is, így az adott termék jobban hozzáilleszthető az egyedi szerverkörnyezetekhez.

Az NVIDIA bejelentette a DGX-1 szerver modernizált változatát is, amit egyszerűen csak DGX-1 with Tesla V100 néven lehet rendelni. A névadást tehát nem bonyolították túl, de azért adtak neki egy DGX-1V rövidítést. Ez az új szerver nyolc Tesla V100-at tartalmaz és már előrendelhető, méghozzá 149 000 dolláros áron. Az első modellek leszállítása az ősszel kezdődik meg. Különálló formában a Tesla V100 az év végén lesz hozzáférhető az OEM partnerek számára, így valamikor 2018-ban épülnek rá az első, nem NVIDIA által tervezett szerverek. A Tesla V100-nak nincs listaára, ugyanis az direkten nem rendelhető.

A vállalat az új DGX-1 mellett még bemutatott egy DXG Stationt is, ami 69 000 dollárba kerül, négy darab Tesla V100-at használ és elsődlegesen a gépi tanulással foglalkozó mérnököket célozza meg. Végül jön a HGX-1 is, amely a DGX-1V-hez nagyon hasonló lesz, de inkább a felhős igényeket célozza meg.

Azóta történt

Előzmények

Hirdetés