Hirdetés

Részletezte az új Xeon Phi fejlesztést az Intel

A Knights Mill a Knights Landing kódnevű lapka közvetlen továbbfejlesztése.

Az Intel az idei Hot Chips alkalmával a Knights Mill kódnevű Xeon Phi fejlesztésről beszélt, ami hivatalosan is az aktuális Knights Landing közvetlen leszármazottja. Ez olyannyira igaz, hogy az alapok lényegében megegyeznek. A hálós topológián belül a részegységek továbbra is HUB-okon keresztül tartják a kapcsolatot, továbbá megmarad 36 csatornát használó PCI Express 3.0-s vezérlő, a két darab háromszor 64 bites DDR4-es memóriavezérlő, a négy darab memóriavezérlő a tokozáson található memóriákra, illetve a 36 darab processzormodul is.

A memóriavezérlők szempontjából a tokozáson található 16 GB-nyi MCDRAM memóriára vonatkozó memória-sávszélesség ismét túllépi 500 GB/s-ot. Ez lényegében gyorsítótárként funkciónál, míg a 384 bites buszon elérhető, DDR4 szabványú teljes memória 2400 MHz-es effektív órajelen üzemel majd és 115,2 GB/s-os memória-sávszélességet kínál, a kapacitása pedig maximum 384 GB lehet.

Ez eddig nem tűnik sok változásnak, lényegében ugyanezek igazak a Knights Landingre is, ugyanakkor a Knights Mill továbbfejlesztett processzormodulokat kapott. Ezek tudják azt, amit a KNL kódnevű processzormodulok, vagyis 1 MB-os gyorsítótárat osztanak meg két darab módosított Silvermont architektúrájú processzormag között. Erről a rendszerről az alábbi hírben már írtunk, de lényeges módosítás, hogy a magokban négy párhuzamos szál dolgozik majd, ami felfogható négyszálú Hyper-Threadingnek. Ez még mindig ismerős lehet a Knights Landingből, de mostantól jöjjenek a változások.


[+]

A Knights Landing leglényegesebb eleme az volt, hogy egy-egy mag mellé két darab VPU volt rendelve (ez egy modulra levetítve négyet jelentett), és egy VPU-n gyakorlatilag egy 512 bit széles vektormotort kellett érteni, ami az AVX512-F utasításkészlettel dolgozott. A Knights Mill esetében az Intel ettől a dizájntól jelentősen eltér. A vállalat effektíve egy VPU-ként kezeli a módosítását, tehát azt hinnénk, hogy minden szempontból romlott a rendszer, de a mérnökök szétválasztották a feldolgozókat. A Knights Mill két darab 512 bit széles szimpla és dupla pontosságra is képes vektormotor helyett tartalmaz egy darab csak dupla és négy darab szimpla, illetve variálható pontosságra képes 512 bites feldolgozót.

A változás végeredményben azt eredményezi, hogy a dupla pontosság melletti órajelenkénti számítási teljesítmény a Knights Landinghez képest a felére esik a Knights Mill kódnevű lapkában, hiszen a feldolgozók száma is a felére csökkent. A szimpla pontosság esetében viszont már előrelépés tapasztalható, mivel a feldolgozók száma megduplázódott, ahogy az órajelenkénti számítási teljesítmény is.

A variálható pontosság teljesen új, ilyen a Knights Landingben nem is volt, és ezeket az operációkat az a VPU-nkénti négy darab 512 bites vektormotor dolgozza fel, amelyek a szimpla pontosságért is felelnek. Ehhez az Intel az AVX512-t kiegészítette a VNNI-16-tal (Vector Neural Network Instructions), ami 16 bites integer bemenetekkel dolgozik és 32 bites integer kimenetet eredményez. Ez kifejezetten a gépi tanulás tréning szakaszához igazodó fejlesztés, és a VNNI-16-ot bevetve egy processzormodul órajelenként 256 fixpontos operációt tud végrehajtani, amit a teljes lapkára levetítve igen kedvező teljesítmény jöhet ki.


[+]

További újítás a Quad FMA, vagyis a QFMA, ami egy újfajta programozási paradigmával hozható elő, ugyanis a Knights Mill támogatja a futószalag szintű párhuzamosságot. A QFMA lényegében FMA utasítást hajt végre úgy, hogy az adott operáció eredményét továbbküldi a következő operációba és így tovább. Ez gyakorlatilag tetszőleges mélységig folytatható. A QFMA kombinálható a VNNI-vel, amivel QVNNI hozható létre, így javítva a gépi tanulásra vonatkozó tréning folyamatok hatékonyságát.

A Knights Mill lapkát használó Xeon Phi processzorok és gyorsítók elvileg még idén elérhetők lesznek.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés