Betekintés az NVIDIA Volta architektúra képességeibe

A vállalat csak a gépi tanulásra fókuszált az új lapkánál, ami érdekes dizájnt szült.

1. Gépi tanulás mindenek felett
1. Gépi tanulás mindenek felett 2. Megújult compute blokk 3. A motorháztető alatti titok
Írta: Abu85
2017-05-12 07:00

Gépi tanulás mindenek felett

Az NVIDIA a tegnapi napon bemutatta a Tesla V100 jelzésű gyorsítót, amelyről az alábbi hírben írtunk, és ígéretet tettünk arra, hogy később elemezzük magát a lapkát is, amit most meg is teszünk.

A GV100 [+]

A Volta architektúra alapvető reformnak tekinthető a Pascal architektúrához viszonyítva, ugyanis az elsődleges fejlesztési tényező a gépi tanulásra vonatkozó igények minél hatékonyabb kiszolgálása volt. Ebben ugyan a Pascal elég jól működött, de messze nem olyan jól, mint egyébként kellene, emiatt a tervezés minden egyes pontját a hatékonyság növelésének szentelte a vállalat. A GV100 kódnevű lapka esetében alapvető újdonság a TSMC 12 nm-es gyártástechnológiája, ami szám szerint nagy előrelépésnek hangzik, de képességei tekintetében valójában nagyon közel áll az eddig használt 16 nm-es FinFET-hez, ugyanakkor egy 21 milliárd tranzisztorból álló, 815 mm²-es lapkánál a nüansznyi változások is fontosak. A fejlesztés következtében 84 darab streaming multiprocesszort sikerült beépíteni, amit az NVIDIA hivatalosan SM-nek jelöl, de ezúttal is előkerült már pár előadáson az SMV név, ami a Volta streaming multiprocesszor rövidítése.

A streaming multiprocesszorok felépítése szintén megváltozott a Pascal architektúrához képest, ugyanis amíg ez a Maxwell generációnál alkalmazott négyről kettőre csökkentette az említett egységeken belüli compute blokkok számát, addig a Volta esetében az NVIDIA visszaemelte ezt négyre. Igen ám, de a korábbi architektúrákhoz képest a compute blokkok felépítése nagyon megváltozott, és mostantól sokkal több szeparált futószalag van bennük kialakítva. Ez azért van, mert korábban a vállalat az egyes feladatokat megpróbálta multifunkciós és multipreciziós ALU-kkal megoldani, de a Volta fő fejlesztése az, hogy ezeket az ALU-kat leegyszerűsíti, és az egyes főbb feladatokhoz különálló egységet rendel, melyeket különálló futószalagra húznak fel. Ennek vannak előnyei és hátrányai is, nem véletlenül alakultak ki a különböző fejlesztési irányok. A fontosabb feladatokra szeparált ALU-kat használó dizájn elsődleges előnye, hogy egyszerűsíti az architektúra tervezhetőségét, az egyes feladatoknál növeli a hatékonyságot, illetve kevésbé komplex ütemező beépítését teszi szükségessé. A hátrány leginkább a komplex programokban jelenik meg, ahol nem tipikusan egy specifikus feladat végrehajtása zajlik, és ebben az esetben ez a hardveres dizájn kevésbé hatékony, mintha a rendszer multifunkciós és multipreciziós ALU-kkal lenne felszerelve.

Az új SM [+]

Az NVIDIA szempontjából a váltás így is megéri, mert a gépi tanulás egy rendkívül kiszámítható feladat, gyakorlatilag 95%-ban mátrixszorzás, tehát ahhoz, hogy egy hardver igazán jól működjön benne, mindent a mátrixszorzás hatékony végrehajtásának kell alárendelni. A többi műveletben még bevállalható az is, hogy a hatékonyság csökkenjen, mivel a mátrixszorzásokon a rendszer az ebből eredő hátrányt úgyis behozza. Emiatt szeparálta a vállalat a feldolgozókat, ugyanis a gépi tanulás szempontjából ez kritikus, a többi igény pedig, úgy néz ki, annyira nem számít.

A cikk még nem ért véget, kérlek, lapozz!

Kapcsolódó cégek:
NVIDIA

Azóta történt

Formálisan is bejelentette a Tesla V100 PCIe verzióját az NVIDIA

A korábban leleplezett modell bemutatásakor már tudni lehetett, hogy jön egy PCI Express 3.0-s verzió, de a bejelentésre csak most került sor.

Hír 2017-06-21 24
Részletesebben ecsetelte a Volta legnagyobb fejlesztéseit az NVIDIA

A vállalat Hot Chips előadásán a Tensor magoké és az L1 gyorsítótáré volt a főszerep.

Hír 2017-08-24 69
Picit csúszik az NVIDIA Xavier SoC

2019-re azonban biztosnak tűnik a nagy mennyiségű elérhetőség.

Hír 2017-09-27 3
Felújítja saját szuperszámítógépét az NVIDIA

A SaturnV új verziója már működik, de egyelőre csak korlátozott tempó mellett, a kiegészítés azonban folyamatban van.

Hír 2017-11-14 18

Előzmények

Leleplezte a Tesla V100-at az NVIDIA

A Volta architektúra számos újítást kínál a szerverpiacra, és az év második felében elérhető is lesz az NVIDIA DGX-1V szerverrel.

Hír 2017-05-10 52
Az NVIDIA új VGA-járól árulkodhat a Hynix bejelentése

A vállalat a GDDR6-os memória leleplezése mellett azt is elárulta, hogy már készül is egy grafikus kártya, ami a friss fejlesztésükre épül.

Hír 2017-04-24 80
Bevezetés az NVIDIA Pascal architektúra rejtelmeibe

A vállalat az egész rendszer tervezését alárendelte a gépi tanulásnak.

Elemzés 2016-04-06 47
Az NVIDIA leleplezte a Tesla P100-at

A Pascal architektúrára épülő újdonság az év végén, illetve a következő év elején érkezik.

Hír 2016-04-05 105

Percről percre

USB to S/PDif konverter a modern RIAA, elektroncsövekkel

lo Végigmegyek azon az evolúción, mely az S/PDif konverterrel folytatott évekig tartó kísérletezésemől szól.

Broken Roads teszt

gp Azt, hogy mi történt az atomháborút követően Amerikában, jól ismerjük a Falloutokból. A Broken Roads e történetet ausztrál szempontból meséli el – igencsak hasonló eszközökkel.

NVIDIA: a következő nagy dolog az AI-generálta videó

it Az NVIDIA vezérigazgatója szerint még nagyobb keresletet hoznak majd a chipjeik iránt az AI által generált videók. Pedig nagy baj nincs, legutóbb így is 200 milliárd dollárral nőtt a cég piaci értéke a kedvező tőzsdei hangulat miatt.

Állásajánlatok

Full Stack Developer Diákmunka

Cég: Ozeki Kft.

Város: Debrecen

Részletek

Eladó - Szerviztechnikus

Cég: Alpha Laptopszerviz Kft.

Város: Pécs

Részletek

Betekintés az NVIDIA Volta architektúra képességeibe