Hirdetés

Legfrissebb anyagok

PROHARDVER! témák

Mobilarena témák

IT café témák

GAMEPOD.hu témák

LOGOUT.hu témák

Hirdetés

Spyra: nagynyomású, akkus, automata vízipuska

lo Type-C port, egy töltéssel 2200 lövés, több, mint 2 kg-os súly, automata víz felszívás... Start the epic! :)
Biztonsági tanácsot és újabb áttörést ígér az OpenAI

it Nem csak biztonsági tanácsot állított fel az OpenAI, de egy új, áttörést ígérő AI-modell tréningezését is elindította.
F1 24 - Íme a végső gépigény

gp Akik a Champions Editiont vásárolták meg azok már játszhatnak a programmal.

Új hozzászólás Aktív témák

#1 GIJoe addikt

Új Válasz 2013-06-05 19:09:37 #1
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

GIJoe

addikt

Így első blindre azt mondom a FirePro aláz, Intelnek kár ebbe időt/energiát tenni
#2 Zso2 őstag GIJoe #1

Új Válasz 2013-06-05 19:23:23 #2
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Zso2

őstag

válasz GIJoe #1 üzenetére

Ezt nagyon nehéz volt megállapítani a számokból.. Nem is várta senki,hogy első lesz..Nem mind1 a fogyasztás /teljesítmény ,ugye ez a legfontosabb,mert hiába 2x 3x gyorsabb akármelyik nála,ha ellenben 8-10x többet zabál.

Adelante ALONSO - Forza Ferrari | BF3-- satazso | Intel Core + Windows = Jaguar, behúzott kézifékkel.
#3 otto1 tag

Új Válasz 2013-06-05 19:36:07 #3
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

otto1

tag

De, mivel Xeon, meg Intel ezt fogják venni...
#4 Lala77 tag

Új Válasz 2013-06-05 19:40:09 #4
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Lala77

tag

Ez nekem eddig nem jött át a hírekből, hogy a profi felhasználásra tervezik, bár a Xeon név gyanús lehetett volna
Viszont a másik kettőhöz nem kell egy újabb procit is venni, ha duplázni akar az emberfia...
A két kártya és a Xeon Phi ár-arányáról lehet tudni valamit?

ingyombingyom
#5 buherton őstag Zso2 #2

Új Válasz 2013-06-05 20:32:28 #5
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

buherton

őstag

válasz Zso2 #2 üzenetére

Kb 100-szor gyorsabb... Ha Xeon Phi 10 W-ot fogyaszt, a VGA tuti hogy nem 1 kW-ot fogyaszt.

tely, baly, fojó, mennyél, mingyárt, telyföl, tolyás, malyd, kapú, egyenlőre, ejsd, jáccani, ahoz, fúj, hüje, muszály, alat, álok, lasan, fojtatás, ál, fontós, költsön, eggyüt, lyob (jobb?), mek, mongyak, milyért - !!! Tanúlyunk már meghejjessen irni... !!!
#6 LordX veterán buherton #5

Új Válasz 2013-06-05 20:41:44 #6
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz buherton #5 üzenetére

AMD FirePro W9000: 274 W
Intel Xeon Phi 5110P: 225 W
Az nV érdekes módon nem specifikálja a teljesítményt.
#7 buherton őstag LordX #6

Új Válasz 2013-06-05 21:13:37 #7
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

buherton

őstag

válasz LordX #6 üzenetére

Köszi a megerősítést!

tely, baly, fojó, mennyél, mingyárt, telyföl, tolyás, malyd, kapú, egyenlőre, ejsd, jáccani, ahoz, fúj, hüje, muszály, alat, álok, lasan, fojtatás, ál, fontós, költsön, eggyüt, lyob (jobb?), mek, mongyak, milyért - !!! Tanúlyunk már meghejjessen irni... !!!
#8 Dragbajnok tag LordX #6

Új Válasz 2013-06-05 21:18:53 #8
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Dragbajnok

tag

válasz LordX #6 üzenetére

[Nvidia Tesla K20C-225W]
#9 ermisukrám tag

Új Válasz 2013-06-05 21:34:47 #9
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ermisukrám

tag

hát ez eléggé gyér. inkább ne is jelentesse így meg az intel mint végtermék.

Aki másnak izébizé annak nyelve szabadlapos
#10 lezso6 HÁZIGAZDA

Új Válasz 2013-06-05 21:45:38 #10
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

Ez nagyon kevés így, de kérdés, hogy vajon miért. Én adok neki annyi esélyt, hogy a későbbiekben ez radikálisan javulhat.

A RIOS rendkívül felhasználóbarát, csak megválogatja a barátait.
#11 drkbl őstag GIJoe #1

Új Válasz 2013-06-05 22:15:06 #11
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

drkbl

őstag

válasz GIJoe #1 üzenetére

Per pillanat ennyire elég: [link]
Ez x86, nem valami gyökeresen más, megvan a maga célterülete.

[ Szerkesztve ]
#12 stargazerhu aktív tag

Új Válasz 2013-06-05 22:25:42 #12
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

stargazerhu

aktív tag

Kíváncsi voltam mit tud egy 7950es VGA és vele szemben egy 3770K-s proci @4,6GHz-en
Hát ezt:[link]
#13 LordX veterán ermisukrám #9

Új Válasz 2013-06-05 22:32:04 #13
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz ermisukrám #9 üzenetére

Már rég megjelentek ezek a kártyák, boldogan szállít az Intel mindenkinek, aki véletlenül kérne belőle.
#14 lezso6 HÁZIGAZDA stargazerhu #12

Új Válasz 2013-06-05 22:33:25 #14
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lezso6

HÁZIGAZDA

LOGOUT blog

válasz stargazerhu #12 üzenetére

Az elég szomorú, mert alig van valamivel előrébb a Phi, még ha a levonom a tuningot, akkor is.

A RIOS rendkívül felhasználóbarát, csak megválogatja a barátait.
#15 ermisukrám tag LordX #13

Új Válasz 2013-06-05 22:44:53 #15
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

ermisukrám

tag

válasz LordX #13 üzenetére

ohhh

Aki másnak izébizé annak nyelve szabadlapos
#16 Meteorhead aktív tag

Új Válasz 2013-06-05 22:49:07 #16
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Meteorhead

aktív tag

Az Intel már előre megmondta, hogy nem a GPU-kkal akarnak versenyezni, mert nyers erőben meg sem közelíti azokat. Intel célja egy olyan masszívan párhuzamos platform építése volt, aminek a belépési költsége 0.
A GPUk állati erősek, de még mindig nem váltották meg a világot. Egyszerűen túl nehéz programozni őket (én is ebből élek, úgyhogy tudom). Ezt meg az ember bedugja a gépbe, és MPI-al eléri mint egy új node-ot a clusterben.
Amit pedig elfelejtenek az emberek, hogy bár OpenCL-t tud futtatni, és nem is kellene ennyire véresen gynegének lennie, a legnagyobb előnye, hogy ezen bármilyen C++ kódot le lehet fordítani, mivel C++ feature complete (x86 lévén). Azt, hogy virtuális függvényeket , függvénypointereket, polymorphizmust orrvérzésig használhat az ember számokban nem kifejezhető, és a GPUk azt nagyon soká fogják csak tudni. A HW hiába tudná már, nincs API amin keresztül rendesen ki is lehetne használni (portable módon meg aztán végképp).
#17 cer tag lezso6 #14

Új Válasz 2013-06-05 22:52:50 #17
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

cer

tag

válasz lezso6 #14 üzenetére

Le tudnátok írni az egyes mérési pontokat Magyarul vagy esetleg ehhez a CLBenchmark-hoz van magyar Manual?
A régi kártyáknál bevethető ez a program?
#18 stargazerhu aktív tag lezso6 #14

Új Válasz 2013-06-06 00:13:26 #18
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

stargazerhu

aktív tag

válasz lezso6 #14 üzenetére

Értelmezni nem is akartam, mivel nem voltak sterilek a körülmények, futottak még dolgok, nem kapcsoltam le mindent, csak gyorsteszt volt...
#19 stargazerhu aktív tag cer #17

Új Válasz 2013-06-06 00:14:01 #19
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

stargazerhu

aktív tag

válasz cer #17 üzenetére

Próbáld ki, hogy bevethető-e!
#20 haxiboy veterán stargazerhu #19

Új Válasz 2013-06-06 01:38:08 #20
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

haxiboy

veterán

válasz stargazerhu #19 üzenetére

Ilyenből 3 az maga az álom

Premium Mining Rigek és Gamer/Workstation gépek: tőlem, nektek :)
#21 petXYZW tag

Új Válasz 2013-06-06 04:33:54 #21
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

petXYZW

tag

A CLBenchmark "tree search" algoritmusára kíváncsi lennék!? Vajon miért marad el a két "GPU based" megoldás a Xeon Phi-től. Illetve sejtem miért...
#22 petXYZW tag Meteorhead #16

Új Válasz 2013-06-06 04:48:15 #22
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

petXYZW

tag

válasz Meteorhead #16 üzenetére

"Azt, hogy virtuális függvényeket , függvénypointereket, polymorphizmust orrvérzésig használhat az ember számokban nem kifejezhető, és a GPUk azt nagyon soká fogják csak tudni. A HW hiába tudná már, nincs API amin keresztül rendesen ki is lehetne használni (portable módon meg aztán végképp)."
Szerintem ezek a dolgok nem arra valók, hogy valamilyen dedikált "computational task"-ban szerepeljenek, hanem alapvetően absztrakciót, programozást elősegítő eszközök, módszerek, valóban összetett problémák megoldásához.
A "programozóknak" az nem tetszik, hogy az OpenCL-ben programozni kell...

[ Szerkesztve ]
#23 Bici félisten

Új Válasz 2013-06-06 07:14:42 #23
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Bici

félisten

Ha ilyen izmos a FirePro a többihez képest, akkor hogyhogy nem hallunk híreket arról, hogy az ilyen-olyan élvonalbali szuperszámítógépekben AMD GPU-k vannak?
Lehet, hogy nem lobbiznak eléggé?

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html
#24 Attix82 őstag

Új Válasz 2013-06-06 07:18:11 #24
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Attix82

őstag

Hát ez a CLBenchmark mennyire hiteles? Sok benchmark van és kb mindbe más a VGA/CPUk erősorrendje.

[ Szerkesztve ]
#25 zoltanz nagyúr Attix82 #24

Új Válasz 2013-06-06 08:18:29 #25
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

zoltanz

nagyúr

válasz Attix82 #24 üzenetére

Szintetikus tesztprogramoknál szokott előfordulni csalás vagy trükközés (driver-eken stb keresztűl).

Manapság egy előnye van ha nem vagy szegény, színvonalasabb ellenségeid lehetnek
#26 Meteorhead aktív tag petXYZW #22

Új Válasz 2013-06-06 08:31:39 #26
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Meteorhead

aktív tag

válasz petXYZW #22 üzenetére

A programozóknak az OpenCL-lel nem az a bajok, hogy programozni kell benne (bár igen, sajnos létezik az a 70%-os programozói réteg, aki egy mezei host oldali párhuzamos kóddal sem bánik el, sem task, sem data parallel esetben), hanem az a baja, hogy isszonyatosan verbose és macera az interface-e.
Egy olyan egyszerű problémát megoldani, hogy egy GPU képes-e double-ben számolni, vagy csak floatot lehet használni kernelben olyan trágya módon lehet megoldani, hogy az ember csinál egy #define REAL float/double sort a kernel kódba, amit runtime kell a kódba beleírni, mert akkor derül ki, hogy az adott hardver amin fut képes-e rá. Igen, C++-an léteznek template-k. Ilyenekre találták ki őket. (Igen, AMD-nek van már static C++ OpenCL compilere, de az a kód nem lesz hordozható)
OpenCL-ben nincs dinamikus memóriaallokáció (ami állatira megnehezíti a legegyszerűbb hatékony reduction kódok írását, mert egy csomó méretet host oldalról kell beleinjektálni a kódba, hogy compile-time konstans legyen.
Tisztában vagyok vele, hogy a rengeteg feature amit korábban felsoroltam az egy magasabb szintű absztarkciót szolgál, de el nem tudom mondani, hogy mennyivel egyszerűbb lenne az életem, ha STL tárolókat használhatnék egészen az utolsó függvényig, ami feldogolgozza az adatokat, és nem kéne közbeékelnem egy cl:uffert, és a köré épített egész masinériát. Fejlesztési idő ÓRIÁSI mértékben lerövidülne.
Egyébként értem amit mondasz, hogy van egy fajta programozói lustaság, (bár nekem azért van munkám, mert kevesen értenek ehhez) de tényleg macera. Olyan programot írni, ami minden user gépén fut állati macera írni, és OpenCL C99 kernel nyelve ehhez csak hozzárak. Csak a template-ek már megváltásként hatnának.
#27 lenox veterán

Új Válasz 2013-06-06 08:46:38 #27
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

lenox

veterán

Az miert van, hogy local memoryval lassabb a Sobel mint global memoryval?
#28 petXYZW tag Meteorhead #26

Új Válasz 2013-06-06 09:45:04 #28
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

petXYZW

tag

válasz Meteorhead #26 üzenetére

Most erre mit mondjak...minden szavaddal egyet tudok érteni és megértem.
Az tény, ha bármit szeretnél létrehozni ami GPU-n fut, és nem két vektort ad össze, ahhoz tényleg "akarni kell" és egy adag szop@s garantált, amitől elmehet az ember kedve.
#29 petXYZW tag lenox #27

Új Válasz 2013-06-06 09:49:09 #29
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

petXYZW

tag

válasz lenox #27 üzenetére

Szívesen megnézném a tesztek forrását, bár már egy két konkrétabb megnevezés is segítene, ezért hoztam fel a "tree search"-t...

[ Szerkesztve ]
#30 Abu85 HÁZIGAZDA petXYZW #21

Új Válasz 2013-06-06 11:56:52 #30
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz petXYZW #21 üzenetére

Nagyon jó flow control hardver kell hozzá. Ezzel jól kezelhető a branch-divergency.
Közben kiderült a Xeon Phi-ről, hogy nem is olyan megosztott az az L2 cache. Konkrétan minden maghoz saját tartozik, és a másik maghoz tartozó L2 tárat se írni se olvasni nem tudják. Az Intel ezt nem pont így ígérte, de mindegy. Ez is ad némi magyarázatot az eredményekre.

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#31 Mr Bond 007 őstag

Új Válasz 2013-06-06 12:55:37 #31
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Mr Bond 007

őstag

Ha annyira tré akkor ez hogy?
KATT
#32 petXYZW tag Abu85 #30

Új Válasz 2013-06-06 14:33:04 #32
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

petXYZW

tag

válasz Abu85 #30 üzenetére

"flow control hardver kell hozzá."
Én nem hiszem, hogy ez az oka! Úgy gondolom, hogy egyszerűen feladat-párhuzamos a kód és ez fekszik a Xeon Phi-nek, míg a másik kettőnek kevésbé. Nekem ez a véleményem, de pont ezért írtam, hogy ez esetben jó lenne látni, milyen a konkrét kereső algoritmus és milyen problématérben keres. Ha egyáltalán ezt takarja a "tree search" a CLBenchmark fejlesztőinél...
#33 con_di_B tag petXYZW #32

Új Válasz 2013-06-06 16:09:48 #33
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

con_di_B

tag

válasz petXYZW #32 üzenetére

A "Tree search" egy teljesen szintetikus teszt (értsd, nem az a lényeg, hogy mit old meg, hanem az, hogy mit terhel) ami kifejezetten arra készült, hogy extrém divergens kódvégrehajtást eredményezzen. Elméletben ez persze nem fair a masszívan SIMD hardverekkel szemben, de a gyakorlat azt mutatja, hogy ezek között is lényegi különbség van a divergencia kezelése terén, amit érdemes mérni.
A "bemegyünk a gráfba és jól eltévedünk" jellegű problémáknál ezen kívül az is szempont, hogy ennél a fajta divergenciánál nem csupán a vezérlés nehéz, hanem a memória-elérés mintája is a lehető legrosszabb.
Éppen ezért ebben a tesztben azok a hardverek tudnak jó eredményt elérni, amelyek 1) nem annyira érzékenyek a divergens vezérlésre 2) jól kezelik (gyorsítótárazzák) a legordasabb memória-eléréseket is.
Ezeket a problémákat hagyományosan nem szeretik GPU-ra átültetni, de az OpenCL messze nem csak a GPU-król szól.
Folyamatpárhuzamosságról ebben az esetben nincs szó.

[ Szerkesztve ]
#34 petXYZW tag con_di_B #33

Új Válasz 2013-06-06 16:26:03 #34
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

petXYZW

tag

válasz con_di_B #33 üzenetére

Pontosan ezt a választ vártam.
Ez esetben a tesztnek, a "kód-divergencia", "random memory-access pattern" vagy hasonló nevet kellet volna adni, nem pedig, hogy "tree search".
Ugyanis így már teljesen világos a GPU lemaradása.
A "tree search" tehát azért nem szerencsés elnevezés, mert a gráfkeresőket lehet a GPU számára emészthetővé tenni olyan módon, hogy a divergenciából eredő lassulás ne jelentkezzen és a memória elérés minták ne legyenek olyan "ordasak". Ráadásul olyan előnyi is lesznek a megközelítésnek ami kifejezetten kedvez a GPU-nak.

[ Szerkesztve ]
#35 cer tag Abu85 #30

Új Válasz 2013-06-06 18:45:53 #35
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

cer

tag

válasz Abu85 #30 üzenetére

Hello Abu,
Közzé tennétek az alább felsorolt a paramétereket magyarul...
Azt mondom ha már magyar portál, akkor legyen magyarul.
Lehet nem sok köszönet lesz majd leírva, de egészen biztos vagyok benne, sokan megköszönik íratlanul.
Én meg írásban, előre is köszönöm!
Physics: SPH Fluid Simulation
Graphics: Raytrace
Vision: Optical Flow
Image Filter: Sobel - Global memory usage
Image Filter: Sobel - Local memory usage
Image Filter: Sobel - Image usage
Image Filter: Separated Gaussian Blur - Global memory usage
Image Filter: Separated Gaussian Blur - Image usage
Image Filter: Median3x3 - Image usage
Programming Principles: Bucketing - Parallel Associative Local
Programming Principles: Reduction - Parallel Commutative case with Local memory usage
Programming Principles: Scanning - Parallel Associative case with Local memory usage
Programming Principles: Scanning - Sequential Associative case
Programming Principles: Sum - Global atomic add
Programming Principles: Sum - Local atomic add
Programming Principles: Bitonic Merge Sort
Programming Principles: Tree search
#36 drkbl őstag

Új Válasz 2013-06-08 21:48:42 #36
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

drkbl

őstag

Chinese supercomputer destroys speed record and will get much faster
A Tianhe-2 kínai szuperszámítógép (32,000 Intel Ivy Bridge Xeon foglalat, 48,000 Xeon Phi kártya, összesen 3,120,000 mag) 90%-os készültségnél 30,65 petaflop teljesítményt ért el, 74%-al felülmúlva a jelenlegi csúcstartót (Titan, Opteron + K20x).
#37 LordX veterán drkbl #36

Új Válasz 2013-06-09 00:13:26 #37
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz drkbl #36 üzenetére

Több, mint 2,5x annyi Xeon Phi van benne, mint K20X a Titan-ban, és 1,74x gyorsabb. (És a full teljesítménybe belejön a CPU erő is, ami még talán nagyobb is, mert 2x6(+HT) IVB vs 16 Opteron mag..)
#38 drkbl őstag LordX #37

Új Válasz 2013-06-09 01:14:54 #38
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

drkbl

őstag

válasz LordX #37 üzenetére

Igen,de 90% készültségi foknál. 54,9 petaflops az elméleti sebessége 100% kiépítettségnél. A Titan 20+-ból 17,59-et hoz.

[ Szerkesztve ]
#39 Bici félisten drkbl #36

Új Válasz 2013-06-09 10:12:21 #39
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Bici

félisten

válasz drkbl #36 üzenetére

Az biztos, hogy az intel ért ahhoz, hogy kell eladni a cuccait, függetlenül attól, hogy az a legjobb a mezőnyben, vagy sem.

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html
#40 LordX veterán drkbl #38

Új Válasz 2013-06-09 19:50:55 #40
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz drkbl #38 üzenetére

Nem érted. Ha Celeronból tennének bele hatmilliárd darabot, akkor is brutális teljesítményű clustert lehet csinálni. Ettől még a Celeron nem lesz gyors.
Szóval nem csoda, hogy félkészen is nagyobb teljesítményű, ha félkészen is már 2,5x több darab van benne, mint K20X a Titanban.
#41 drkbl őstag LordX #40

Új Válasz 2013-06-09 20:35:26 #41
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

drkbl

őstag

válasz LordX #40 üzenetére

Egy Phi 60 mag, egy K20x 2,688 mag. A Titan összesen 50,532,352 mag, 18,688 node. A Tianhe-2 3,120,000 mag, 14,366 node per pillanat.
#42 LordX veterán drkbl #41

Új Válasz 2013-06-09 20:42:13 #42
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

LordX

veterán

válasz drkbl #41 üzenetére

Egy Phi mag és egy Kepler mag összehasonlítása tök értelmetlen, mert nem lehet őket egyesével megvenni. Egy Phi kártya és egy K20X kártya a minimális egység, azokat kell összehasonlítani.
#43 tocsa senior tag

Új Válasz 2013-06-10 02:37:39 #43
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tocsa

senior tag

Mi a cikk forrása? Csak azért kérdezném, mert érdekelne a XeonPhi OpenCL driver mibenléte.
Mennyire lehet kiforrott a XeonPhi OpenCL meghajtója? Az a gyanúm, hogy még nagyon pre alpha fázisban lehet, ezért nem lehet igazán következtetést levonni a XeonPhi valós, végleges teljesítményéről. A driver kiforratlansága akér erősen akadályozhatja. Hogy mi lesz egy jobb driverrel azt meg nehéz megmondani, 2-3x vagy jobb gyorsulás is simán elképzelhető, de az is elképzelhető, hogy ennyire futja amit itt látunk.

[ Szerkesztve ]

Acer Predator Helios 500 Ryzen, Samsung 960 Pro NVMe + GeChic 15.6" kulso monitor a mobil irodahoz
#44 tocsa senior tag Meteorhead #16

Új Válasz 2013-06-10 02:40:21 #44
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tocsa

senior tag

válasz Meteorhead #16 üzenetére

De jó hallani a szavaidat! Nekem is ez a gondom, és pontosan ezt pofáztam egy másik topic-ban, de az emberek 99.9% nem értette meg.

Acer Predator Helios 500 Ryzen, Samsung 960 Pro NVMe + GeChic 15.6" kulso monitor a mobil irodahoz
#45 Abu85 HÁZIGAZDA tocsa #43

Új Válasz 2013-06-10 09:17:17 #45
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz tocsa #43 üzenetére

A CLBenchmarknak van egy listája, hogy mi hogy teljesít.
Az OpenCL driver már végleges. Ettől persze még gyorsulhat, de már nem alfa meg béta driverek vannak.
Kiindulva abból, hogy a Larrabee legnagyobb problémája az volt, hogy nem skálázódott, könnyen lehet, hogy ennek is ez a legnagyobb gondja. Végtére is az x86-ot, mint a teljesítmény legnagyobb gátló tényezőjét nem cserélték le csupán változtattak rajta.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#46 tocsa senior tag Abu85 #45

Új Válasz 2013-06-10 16:29:02 #46
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

tocsa

senior tag

válasz Abu85 #45 üzenetére

Akkor ez cumi? Miért választották a Kínaiak a szuperszámítógépükhöz?

Acer Predator Helios 500 Ryzen, Samsung 960 Pro NVMe + GeChic 15.6" kulso monitor a mobil irodahoz
#47 Abu85 HÁZIGAZDA tocsa #46

Új Válasz 2013-06-10 16:37:23 #47
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Abu85

HÁZIGAZDA

válasz tocsa #46 üzenetére

Nagy kérdés, hogy mit szeretnének azon futtatni. A Xeon Phi sok terültre elégtelen, de pár helyre azért nem rossz. Maga a skálázódás sem lehet gond, ha a programot direkten úgy írják meg, hogy az 512 kB-os gyorsítótárakban mindig ott legyen az adat.

[ Szerkesztve ]

Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
#48 Bici félisten Abu85 #47

Új Válasz 2013-06-10 16:52:57 #48
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

Bici

félisten

válasz Abu85 #47 üzenetére

Az AMD nem tervezi a GCN felépítést a szuperszámítógépek világába bevezetni? Vagy limitál a DP teljesítmény?

Eladó régi hardverek: https://hardverapro.hu/apro/sok_regi_kutyu/friss.html
#49 dezz nagyúr drkbl #41

Új Válasz 2013-06-18 22:14:18 #49
Új hozzászólás
Összes hozzászólása itt Válaszok az összes hozzászólására itt Válaszok erre a hozzászólásra
Privát üzenet küldése

dezz

nagyúr

válasz drkbl #41 üzenetére

Egy K20x "mag" nem úgy mag, mint egy Phi mag. Inkább ALU-nak mondanám. Egy Phi magban is sok SIMD ALU van.

Új hozzászólás Aktív témák

Témaindító írás

Adatok az Intel Xeon Phi teljesítményéről

ph A szerverekbe szánt eszközről egyelőre kevés gyakorlati információ van, de végre befutott pár CLBenchmark eredmény.

Aktív témák

Hirdetés

Új prémium hirdetések

Új ingyenes hirdetések

Állásajánlatok

Diákmunka junior fejlesztő

Cég: Ozeki Kft.

Város: Debrecen

Részletek

Eladó - Szerviztechnikus

Cég: Alpha Laptopszerviz Kft.

Város: Pécs

Részletek