Hirdetés

Kína bedobta a saját gyorsítóit a Tianhe-2-be

A Xeon Phi gyorsítók helyére bekerültek a Matrix2000-ek. A nagyvas új neve Tianhe-2A.

Kína a HPC Forum 2017-es rendezvényen bejelentette, hogy frissítették a világ második leggyorsabb szuperszámítógépének számító Tianhe-2-t. A rendszernek a leggyengébb pontjának a bele épített 48 000 darab Xeon Phi gyorsító számított, amire Jack Dongarra, az Oak Ridge-i Nemzeti Laboratórium professzora is felhívta korábban a figyelmet. Kína azonban ezzel nem nagyon törődött, ugyanis már két évvel korábban bejelentették, hogy saját gyorsítót terveznek, így csak idő kérdése volt, amíg a Matrix2000 kiváltja a problémás Xeon Phi gyorsítókat. A váltás lényegében megtörtént, és a Tianhe-2 új neve Tianhe-2A lett.

James Lin, Shanghai Jiao Tong Egyetem igazgatóhelyettese szerint a Tianhe-2A 16 000 helyett már 17 792 node-ból áll, és egy node két darab 12-magos, 2,2 GHz-es órajelen üzemelő Intel Xeon E5-2692 processzort használ, amelyekhez egy-egy Matrix2000 gyorsító kapcsolódik egy x16-os PCI Express kapcsolaton keresztül. Itt érdemes kiemelni, hogy egy ilyen úgynevezett GPDSP belső felépítése az első bekezdésben linkelt hírben taglaltakhoz képest megváltozott. Hat helyett végül négy blokk van a lapkában, de az is lehet, hogy fizikailag mind a hat blokk megtalálható benne, és kettő csak le van tiltva. Erre a rejtélyre sajnos még nincs válasz, de a lényeg, hogy egy Matrix2000-ben 128 darab aktív feldolgozóegység található, amelyeken belül két darab 256 bites vektorfeldolgozó található. Az órajelet 1 GHz helyett végül 1,2 GHz-re sikerült beállítani, amivel a lapka dupla pontosság melletti elméleti számítási teljesítménye eléri a 2,46 TFLOPS-ot, vagyis a korábban tett tempóra vonatkozó ígéreteket sikerült teljesíteni.


[+]

A Matrix2000 gyorsító maximum 240 wattot fogyaszt és nyolccsatornás, DDR4 szabványú, 2400 MHz-en ketyegő lapkákra építő fedélzeti memóriát használ, amelynek a pontos kapacitása nem ismert, de a nem megerősített adatok 64 GB-ról szólnak, és ez reális lehet a korábbi terveket figyelembe véve. Az új megoldások OpenMP 4.5-öt és OpenCL 1.2-t használva programozhatók.


[+]

Az összesítés alapján az Tianhe-2A elméleti számítási teljesítménye 94,97 PFLOPS-ra nő, szemben a korábbi 54,9 PFLOPS-szal. Ez egyébként bizonyosan nem elég az első helyhez a top500.org listáján, hiszen a Sunway TaihuLight még így is gyorsabb, viszont a második hely megőrzése szinte biztosra vehető. Ennél fontosabb azonban, hogy a rendszer hatékonysága drámaian javult. Mivel a teljes fogyasztás nagyjából 18 megawattra fog nőni a korábbi 17,8 megawattal szemben, és ebbe bele kell azt is számolni, hogy 1792-vel több node van. Utóbbi szempontból a bővítés azért is vált lehetővé, mert a korábbi TH-Express 2-t felváltotta a Galaxy összeköttetés, ami 10 helyett 14 Gbps-ra képes alacsonyabb késleltetéssel. Az összes memória szintén nőtt, méghozzá 3,4 PB-ra a korábbi 1,4 PB-ról, illetve az adattárolásra vonatkozó teljesítmény megduplázódott, és minimum 19 PB-ra duzzadt a kapacitás. Utóbbit még bevallottan bővítik, tehát ez még nem végleges adat.

A Matrix2000-et állítólag még több, Kína által finanszírozott projektben is felhasználják, így fontos szerepet kap a jövőben. Emiatt valószínű, hogy készülnek a továbbfejlesztései is.

Azóta történt

Előzmények

Hirdetés