Hirdetés

Kolosszális AI gyorsítót mutatott be a Graphcore

A Colossus MK2 a TSMC 7 nm-es node-ját használja, aminek hála közel 60 milliárd tranzisztort hasznosítanak.

A Graphcore jelenleg az egyik legambiciózusabb brit IT vállalatnak számít, ugyanis a felfutás alatt lévő AI-piacon célozzák a gépi tanulás tréning szakaszát, ami bizony komoly számítási teljesítményt igényel. A sebességre való igény már életre hívta a cég, Colossus MK1 nevű gyorsítóját, ami első termékként egy nulladik generációs tesztként is felfogható, mivel a valós célja leginkább a megfelelő szoftveres háttér kiépítése volt. Most azonban bemutatkozott a Colossus MK2, ami már kellően erős háttérrel rendelkezik ahhoz, hogy élesben is helytálljon, mi sem bizonyítja ezt jobban annál, hogy az elődnél nyolcszor gyorsabb.

A Graphcore a GC200 kódnevű IPU (Intelligence Processing Unit) esetében mindent bevetett. Többek között a TSMC 7 nm-es gyártástechnológiáját alkalmazzák, amelynek segítségével 59,4 milliárd tranzisztort építettek 823 mm²-es lapkába. Mindebbe 1472 úgynevezett IPU-Tiles fért bele, egy ilyen magából a feldolgozómagokból, illetve a hozzá tartozó belső memóriából áll. Egy teljes IPU-ra levetítve 8832 darab szál fut a rendszerben, vagyis feldolgozónként hat, miközben a lapkán belüli memória kapacitása eléri a 900 MB-ot, amit 47,5 TB/s-os sebességgel címezhetnek az egymástól független magok. Mindezeken túl a chipen belüli kommunikáció 8 TB/s-os tempóval valósulhat meg az IPI-Exchange egységeken keresztül.


[+]

Egy GC200-as IPU x16-os PCI Express 4.0-s interfésszel kapcsolódhat a host processzorhoz, továbbá az egyes lapkák összeköttetésére tíz darab IPU-Link áll rendelkezésre, amelyek 320 GB/s-os adatátviteli teljesítményt kínálnak.

A Colossus MK2 gyorsító 250 TFLOPS-os teljesítményre képes FP16.16 és FP16.SR (stochastic rounding) formátumon, illetve számos FP32-es módot is támogatnak.

A Graphcore négy darab Colossus MK2-t fog be az IPU-M2000-es szerverbe, amelyen belül akár 450 GB exchange memória is lehet. Utóbbiból maximum 448 GB streaming memóriaként is használható, hogy a nagy neuronhálók tréningelésével se legyen gond. Magából a szerverből összesen 16 darab köthető össze az IPU-Fabric révén, így végeredményben 64 darab Colossus MK2-vel lehet számolni. Ez a rendszer IPU-POD64 néven érhető el. Maga a fejlesztés azonban egészen tág határok között skálázható, akár 64 000 darab GC200-as IPU is összekapcsolható egy szuperszámítógéppé, amivel 16 EFLOPS-os AI teljesítmény nyerhető.


[+]

A szoftveres háttér tekintetében a Graphcorea Poplar SDK-t kínálja, amelyet a friss lapkával párhuzamosan terveztek. Ez támogatja a legelterjedtebb, gépi tanuláshoz tervezett keretrendszereket, illetve komplett menedzselési lehetőséget kínál a hardverhez.

Azóta történt

Előzmények

Hirdetés