Hirdetés

Dedikált AI gyorsítóval erősíti új Z CPU-ját az IBM

A Z Telum ilyen formában új biztonsági képességekre tesz szert.

Az IBM az idei Hot Chips alkalmával bemutatta az új Z Telum nevű nagyszámítógépekbe (mainframe) szánt processzorát. A Z termékskálát a vállalat leginkább tranzakciófeldolgozáshoz és pénzügyi szolgáltatásokhoz szánja, vagyis üzletileg kritikus alkalmazások futtathatók rajta, ezáltal nemcsak a teljesítmény fontos, hanem kiemelt szerephez jut a biztonság, a megbízhatóság, illetve az alacsony késleltetésű elérés is. Ezek miatt a Z Telum nem tipikusan azokat a piaci szegmenseket célozza, amelyeket például az x86/AMD64, az ARM, vagy akár a Power architektúrára épülő szerverprocesszorok.

A vállalat friss, CISC-alapú, Z architektúrára épülő fejlesztése a Samsung 7 nm-es node-ján készül és 22,5 milliárd tranzisztort tartalmaz, amivel a kiterjedése 530 mm²-es. Egy ilyen, 5 GHz-es órajel feletti működésre tervezett lapkán belül nyolc darab, egyenként két szálat futtató, OOO (out-of-order) logikát alkalmazó processzormag található. Egy magnak 32 MB-es L2 gyorsítótára van, és ezek egy 320 GB/s-os adatátviteli tempóra képes gyűrűs buszra vannak felfűzve, amin keresztül a magok kommunikálhatnak egymással. Az L2 gyorsítótárak virtuálisan egy 256 MB-os L3-at adhatnak ki, és a virtuális L3-ból nyolc lapka összefűzésével lehet egy 2 GB-os virtuális L4 gyorsítótár.

(forrás: ServeTheHome) [+]

A skálázást tekintve az IBM egy tokozásra két Z Telum processzort helyez, méghozzá MCM (multi-chip module) formában, és négy tokozás köthető össze egy fiókon belül, ami végeredményben nyolc processzor összeköttetését jelenti. De a rendszer a fiókok szintjén is skálázható, ezekből maximum négy köthető össze, ami összességében 32 darab Z Telum processzort eredményez.

Az IBM szerint a rendszert ért fejlesztésekkel az egy tokozásra levetített teljesítmény 40%-kal javult az előző generációhoz viszonyítva, viszont nem ez a Z Telum legnagyobb ütőkártyája, hanem a nyolc mag mellé helyezett AI gyorsító, amely a gépi tanulás dedukció szakaszára lett kialakítva.

(forrás: ServeTheHome) [+]

Nagyon érdekes, hogy amíg több cég inkább a magokon belülre helyezi a hasonló képességű részegységeket, addig az IBM a magokon kívülre, de még a lapkára építette. Ez a cég szerint koncepció volt, ugyanis így egy erős hardvert tudtak beépíteni, amelyet akármelyik mag elérhet, és leadhatja számára a feldolgozandó feladatot.

Az IBM AI részegysége konkrétan 128 darab, nyolcutas, 16 bites lebegőpontos operációkat támogató SIMD-motort köt össze egy mátrixtömbön belül, és ezt kiegészíti még 32 darab, szintén nyolcutas, de 32 és 16 bites lebegőpontos operációkat egyaránt támogató SIMD-motor. A rendszer összteljesítménye 6 TFLOPS-nál is több, ami egy 32 processzorból álló konfigurációra levetítve 200 TFLOPS feletti tempót kínál. A futtatandó neuronháló tréningelése egyébként történhet akárhol, az ONNX (Open Neural Network Exchange) szabványnak köszönhetően ennek nincs jelentősége.

(forrás: ServeTheHome) [+]

Az egész dizájn úgy van kialakítva, hogy rendkívül alacsony késleltetés mellett adjon eredményt, ami az IBM szerint azért hasznos, mert valós időben lehet reagálni az egyes feladatokra. Például felismerhetők lehetnek a pénzügyi tranzakcióknál a csalások, így a hardver egyfajta utolsó utáni védvonalként visszautasíthatja a kérelmet, ezzel megakadályozva a bűncselekményt.

A Z Telum processzorra alapozó IBM z és LinuxONE rendszerek várhatóan a következő esztendő első felében lesznek rendelhetők.

  • Kapcsolódó cégek:
  • IBM

Azóta történt

Előzmények

Hirdetés