Hirdetés

Problémák vannak a Frontierrel, de az Oak Ridge Nemzeti Laboratórium nem aggódik

A rendszer elvileg a következő év januárjában lesz teljesen használható, amely tervet úgy néz ki, hogy tartják.

Írta: Abu85
Forrás: insideHPC
2022-10-10 17:10

Az insideHPC egy friss riport keretében részletezte a világ első exascale rendszerével kapcsolatos híreszteléseket, amelyek a HPE Slingshot fabric interfészével kapcsolatos problémákat taglalják. Erre már korábban is felhívták a figyelmet két írás alkalmával, noha ennek a tesztidőszakban nem volt nagy jelentősége, mert sok beüzemelés alatt álló rendszernek vannak akár jelentős gondjai.

A Frontier azóta megszerezte az első helyet a top500.org listáján, így felmerül a kérdés, hogy mi is a helyzet a működéssel kapcsolatos problémákkal. Justin Whitt, az Oak Ridge Nemzeti Laboratórium programigazgatója, az insideHPC-nek adott interjúban elárulta, hogy felmerülő gondok leginkább a rendkívül nagy feladatok teljes rendszeren történő futtatásával kapcsolatosak, ezen belül is azzal, hogy az elérhető összes hardveren összehangolt legyen a működés. Alapvetően utóbbiról gondoskodik maga a HPE Slingshot fabric interfész, mert a compute node-okat négy darab ilyen 200 Gbps-os kapcsolat köti össze.

Felmerülhet a kérdés, hogy a top500.org első helyéhez szükséges High-Performance LINPACK tesztprogram hogyan tudott jól működni, de Justin Whitt szerint ennek a futtatása különbözik a komplexebb alkalmazásoktól, amelyek hatékony futtatását a legnehezebb elérni az extrém méretű rendszereken. Dolgoznak is rajta, hogy megértsék a hardverrel kapcsolatos problémákat, ugyanis ekkora léptékben mindig lesznek meghibásodások, továbbá az ezek közötti átlagos idő egy Frontierhez hasonló óriási gépnél órák, és nem napok kérdése. Emiatt kiemelte, hogy meg kell győződniük arról, hogy értik a hibákat, és hogy nincs olyan minta, ami miatt aggódniuk kellene.

Az Oak Ridge Nemzeti Laboratórium célja, hogy a felhasználók számára elérhetővé tegyék a rendszeren történő eltérő alkalmazások futtatását. Justin Whitt szerint egy egész napos, rendszerhiba nélküli működés már kiemelkedő eredmény lenne, de a céljuk jelenleg órákra vonatkozik, noha annál többre, mint amennyit most elérnek. A szakember azt is elárulta, hogy az Instinct gyorsítóra vonatkozó pletykák csak a teljes kép egy részét adják. Valójában a problémák számos különböző hardvert érintenek, és ezek nem túl szokatlanok, mivel láttak már hasonlókat pár korábban telepített gépüknél. A Frontier pusztán azért jelent nagyobb kihívást, mert 685 darab különböző hardverelemből tevődik össze, és a teljes kiépítést tekintve nagyjából 60 millió alkatrész dolgozik a működése során.

Az előbbiek magyarázatot adnak arra is, hogy a HPE Cray EX235a platform kapcsán miért nincsenek hasonló híresztelések különböző problémákról a LUMI és az Adastra nevű szuperszámítógépeknél, illetve a Frontier tesztrendszerének számító TDS konfiguráción. Egyszerűen ezek sokkal-sokkal kisebbek, mint maga a Frontier, tehát lényegesen kevesebb alkatrészből állnak, ami jelentősen csökkenti a potenciális meghibásodások kockázatát. Itt felmerül az a tényező is, hogy ha elkezdünk ilyen extrém méretű exascale rendszereket építeni, akkor a rendelkezésre állás tekintetében nagyon jelentős háttérmunkát kell végezni a napi szinten felmerülő hibák felderítésében és elhárításában.

Justin Whitt arról is beszélt, hogy amikor a 2018-as esztendő végén, illetve 2019-ben összeállították a Frontier tervét, akkor azt a célt tűzték ki, hogy 2023. január 1-jén a felhasználói programok számára is rendelkezésre áll majd, és úgy néz ki, hogy az ütemtervnek ezt a részét tartani tudják.

Hozzászólások (47)

Azóta történt

Európa erősít a szuperszámítógépek élmezőnyében

A friss top500-as lista legjobb tíz helyén belül csak a EuroHPC projektjei szolgáltak újdonsággal.

Hír 2022-11-15 1
Meglepően stabilan tartják pozícióikat a zöld szuperszámítógépek

A HPE Cray EX235a továbbra is viszi az első tíz hely zömét, de a Henri tartja magát az élen.

Hír 2023-05-23 2

Előzmények

APU-kat párosít CPU-kkal a készülő legerősebb szuperszámítógép

Eddig nem látott konfigurációt alkalmaz az El Capitan, de bizonyos szempontból logikus döntést hoztak a tervezők.

Hír 2022-06-23 21
Exascale szuperszámítógéppel vette vissza az első helyet az USA

A Frontier nem csak gyorsabb, de kevesebbet is fogyaszt a korábbi csúcstartónál.

Hír 2022-05-31 29
Végül 2 EFLOPS-ra lesz képes a Frontier

Az Oak Ridge Nemzeti Laboratórium központjában épülő nagyvas fogyasztása nem változik.

Hír 2022-03-29 5
Hozzáférhető a Frontier nevű szuperszámítógép tesztrendszere

A készülő, exascale rendszerre írt alkalmazások már ellenőrizhetők a Crusheren.

Hír 2022-01-18 4

Percről percre

Biztonsági tanácsot és újabb áttörést ígér az OpenAI

it Nem csak biztonsági tanácsot állított fel az OpenAI, de egy új, áttörést ígérő AI-modell tréningezését is elindította.

Középpontba kerültek a hibrid autók, alig fogyaszt a BYD újdonsága

it 2,9 literes fogyasztást és több mint 2100 kilométeres hatótávot ígérnek a BYD új hibrid technológiájához, de a Toyota (és a Subaru, Mazda) is a hibrid motorokra koncentrál épp.

Egyre több európai használja a Telegramot, ezért megkereste az EU

it Hamarosan sokkal szigorúbb szabályozás alá esik az EU-ban a Telegram, mivel egyre több a helyi felhasználója.

Állásajánlatok

Full stack Laravel fejlesztő

Cég: Promenade Publishing House Kft.

Város: Budapest

Részletek

Eladó - Szerviztechnikus

Cég: Alpha Laptopszerviz Kft.

Város: Pécs

Részletek

Hirdetés

Problémák vannak a Frontierrel, de az Oak Ridge Nemzeti Laboratórium nem aggódik

Azóta történt

Európa erősít a szuperszámítógépek élmezőnyében

Meglepően stabilan tartják pozícióikat a zöld szuperszámítógépek

Előzmények

APU-kat párosít CPU-kkal a készülő legerősebb szuperszámítógép

Exascale szuperszámítógéppel vette vissza az első helyet az USA

Végül 2 EFLOPS-ra lesz képes a Frontier

Hozzáférhető a Frontier nevű szuperszámítógép tesztrendszere

Percről percre

Biztonsági tanácsot és újabb áttörést ígér az OpenAI

Középpontba kerültek a hibrid autók, alig fogyaszt a BYD újdonsága

Egyre több európai használja a Telegramot, ezért megkereste az EU

Állásajánlatok

Full stack Laravel fejlesztő

Eladó - Szerviztechnikus

Tényleg három színben érkezett a Nothing Phone (2a)

2024 - Alig egy nap múlva jön a Sony új State of Play előadása

F1 24 - Íme a végső gépigény

Mozgásban a Conscript

5G-vel és hőkamerával strapálja magát az Ulefone

Premier előzetesen a Star Wars: Hunters

Poco M6 Plus néven újrázhat a Redmi Note 13R

Hirdetés

Hird﻿e﻿t﻿és

Problémák vannak a Frontierrel, de az Oak Ridge Nemzeti Laboratórium nem aggódik

Azóta történt

Előzmények

Percről percre

Állásajánlatok

H﻿i﻿r﻿deté﻿s﻿

Hirdetés

Hirdetés