- Feltűnt a dél-koreai hitelesítésen a PlayStation VR2 PC adaptere
- Amlogic S905, S912 processzoros készülékek
- Computex 2024: belép a kézikonzolok piacára a Zotac is
- Azonnali alaplapos kérdések órája
- Milyen billentyűzetet vegyek?
- Milyen CPU léghűtést vegyek?
- NVIDIA GeForce RTX 4080 /4080S / 4090 (AD103 / 102)
- Vezetékes FEJhallgatók
- Bluetooth hangszórók
- Nikon DSLR topik
Hirdetés
-
Többet költenek a PS5 felhasználói
it Csökkennek a PlayStation 5 konzol eladásai, de a Sony szerint nincs miért aggódni, mert a felhasználók többet költenek.
-
Spyra: nagynyomású, akkus, automata vízipuska
lo Type-C port, egy töltéssel 2200 lövés, több, mint 2 kg-os súly, automata víz felszívás... Start the epic! :)
-
Itt az első olyan, MI-re kiélezett laptop, ami ellenáll a környezeti hatásoknak
ph A széleskörűen konfigurálható újdonságból remek választás kerekedhet a zordabb körülmények közepette végzett, helyszíni munkákhoz.
Új hozzászólás Aktív témák
-
9950es
aktív tag
A 22nm-es variáns felfogható egy next gen konzolnak cakkompakk?
120 fps or GTFO :D
-
FRENK1988
veterán
Ezen hogy menne a krájzisz?
Nem a lóerő öl, hanem a NYOMATÉK! :)
-
LordX
veterán
32 darab in-order x86 mag? Ez valami vicc? Hatalmas pofára esés lesz ebből az egészből.
"A rendszer 16 utas, 512 bites vektoros egység úgymond etetésére vállalkozott, miközben a 8 MB-os gyorsítótár nincs bankokra osztva." Ezt nem lehet átfogalmazni? Ötszöri újraolvasásra sem vagy teljesen biztos benne, hogy azt értem, amit akartatok írni. (Milyen rendszer, a 32 x86 mag? Mi 16 utas, a rendszer vagy a vektoros egység? A gyorsítótár az kié?)
-
buzus
aktív tag
Akkor ez most pöpec cucc?
-
LackoMester
addikt
Jól hangzik , de majd meglátjuk mire lesz képes....az árára inkább gondolni sem merek...
ott a kisértet a ganéná.... by: Bendegúz
-
aktív tag
alul a képen Knights Ferry van, a címben meg Fierry. valamelyik nem jó.
हरे कृष्ण हरे कृष्ण कृष्ण कृष्ण हरे हरे हरे राम हरे राम राम राम हरे हरे Góranga!
-
nagyúr
"mely az előzeteseknek megfelelően nem jelenik meg kereskedelmi forgalomban"
Akkor nem értem a felhajtást... egyébként elsőre elméletben meggyőző, de tényleg ki kellene próbálni - lásd Fermi, Larrabe. De maga a MIC elgondolás tetszik.
[ Szerkesztve ]
-
Móci
addikt
Ez akkor a 'villantunk egyet az x86-os procikból összetákolt cuccunkkal' rovat?
Ha az intelen múlna, akkor mindenben x86-os processzor lenne."...In a struggle to be happy and free, swimming in a primitive sea..."
-
menalcas
őstag
Szerintem ez sem lesz befejezve
Az élet túl rövid ahhoz, hogy mindig biztonságosan távolítsd el a pendrive-ot.
-
vanhalen
senior tag
Véletlen automatikusan "hulladék generációt" olvastam
-
LordX
veterán
válasz #95904256 #18 üzenetére
Nem, nem igaz, kifejtettem.
Az x86 utasításkészlet alapvetően egy skalár utasításkészlet, ami kapott pár vektor-kiegészítést (SSEx). Az 1980-as években tervezték. Skalár problémák megoldására. És foltozgatták, hogy aktuálisabb problémákra többé-kevésbé használható legyen. Soha, de soha nem lesz olyan hatékony vektorműveletekre, mint egy effektíve erre tervezett utasításkészlettel rendelkező processzor (pl. egy GPU). Kis körültekintéssel egy GPU elméleti számítási teljesítményének 70-80%-át könnyedén ki lehet használni - egy HT-s P4 esetében ez a szám nem nagyobb mint 30%, ha hülyére optimalizálod a kódot, de azóta fejlődött a tudomány, legyen 40. Még mindig 2x akkora TFLOPS-ot kell papíron kitolnia magából, hogy ugyanott legyen egy nem-benchmark programban, mint egy Fermi. De mivel inorder, kötve hiszem, hogy hozza ezt a szintet.
De ne legyen igazam.
-
Abu85
HÁZIGAZDA
Az is problémát jelenthet, hogy GPU-kra inkább feladat-párhuzamosan programoznak. A Larrabee koncepciója inkább az adatpárhuzamosságra épül. 30+ magnál annyi szál van, hogy a CPU-nál alkalmazott programozási módszerekkel baromira nehéz felügyelni a chipben zajló folyamatokat. Ezért is alkalmaznak a fejlesztők a GPU programozására más módszereket.
Senki sem dől be a hivatalos szóvivőnek, de mindenki hisz egy meg nem nevezett forrásnak.
-
#95904256
törölt tag
válasz TESCO-Zsömle #24 üzenetére
Hogy ez miért is nem jó példa:
- a HW-tesszelálás nagyságrendekkel több erőforrást használ
- emulációnál rengeteg adatmozgatásról is gondoskodnia kell a kódnak -
MittuDomain_
őstag
Klasszikus Abu-cikk, ha a felét értem sokat mondok...
(Persze a szöveg része tiszta, csak a számok kevésbé, no offense)és ez a fórum hozzászólásokra is igaz, tanulnom kell még, na
[ Szerkesztve ]
Si tacuisses, philosophus mansisses.
-
hakosh
tag
Amikor megláttam azt az Intel VGA-t, akkor olyan érzés fogott el, amilyet még ember is ritkán vált ki belőlem. Olyan furcsa és ijesztő is egy kicsit, de mégis kíváncsi vagyok rá, hogy mi az
-
isti84
csendes tag
válasz #95904256 #23 üzenetére
Sajna régen tanultam ezekről, de valamicske tudás maradt. Jelen esetben az inorder, amit a cikk is emleget egy baromi rossz ötlet. Ilyen arhitektúrára baromi nehéz jó fordítót írni. LordX elmondta miért nem életképes egy x86-os mag grafikus megjelnítésre. Egy példát én is adhatok. Ráncosabb homlokú kollegák emlékezhetnek a Delta Foce c. FPS-re. Az egy 3D gyorsítást mellőző program volt, az akkori x86-os arhitektúrák nagy részét egyszerűen berohasztotta. Tudom nem a legjobb példa, de talán innen is látszik kicsit a CPU-GPU képességeinek különbsége.
Másrészről, a FERMI egy marha jó tehnológia, de nem ezért a felárért. Irtózatos nyers ereje van általános számításokra. De sajna már látsznak a jelek a chip butítására, mint pl.: GF108.
S ha már csak a feldolgozó szálak számával számolunk. Látom keresel AMD X6-ost. Az a CPU 6 feldolgozószálon képes műveletet végrehajtani, a most fellelhető nem profi és nem alkalmazás célú szoftverek, azaz a játékok, nem képesek kihasználni. Vegyünk egy AMD GPU-t, csak a márka kedvéért, egy 4670 es kártyánál (csak tippelek bocsi) van 32 feldolgozószál. Ha mondjuk egy nyers videófájlt kell átdolgozni akkor a 32 feldolgozószállal dolgozó GPU-ra írt kódolók gyorsak és hatékonyak is. Ellenben a 6 szállal dolgozó CPU-nál.
De mint írtam a hsz. elején sajna régen tanultam ezeket. Kéretik szólni ha valamit rosszul írtam.
István
Kockák előre!!! :D
-
LordX
veterán
válasz #95904256 #23 üzenetére
Nem a kód hatékonyabb, hanem az erőforrások kihasználása. Egy CPU az általános célú, mindenre van egy-egy végrehajtó egysége (vagy több mikroutasításra bontják, és több lépésben oldják meg), sőt, legacy cuccokat is kell támogatni valamivel, ami kb. soha nem fog csinálni semmit, de a "papíron FLOPS"-ba beleszámít.. Ha épp egy speciális feladatot hajtasz végre, akkor a többi részegység nem csinál semmit. Egy szuperskalár processzorban nagyon nem triviális (konkrétan NP teljes) az, hogy milyen sorrendben kell az utasításokat kiadni, hogy várható értékben minél nagyobb legyen a részegységek kihasználása, a legdurvább fordítók sem végeznek tökéletes munkát, sokszor kihagynak olyan lehetőségeket, amit egy járatos ASM programozó azonnal meglát.
Egy GPU egy végrehajtóegysége ellenben olyan mint egy faék, pl. az Evergreen családban egy processzorban 5 ALU van, sőt az nVidia G200 processzora skalár, azaz EGY darab ALU. Előbbinél a kihasználtság csak annak a kérdése, hogy hány darab független utasításod van egyszerre, utóbbinál meg mindig 100%, csak tudd elég adattal etetni.
Mátrixszorzó algoritmus (és eddigi tapasztalataim alapján jóóóó sok mátrixszorzást végeznek "tudományos célra") van CUDÁra ami a GPU teljesítményének 95%-án működik, CPU-n nem láttam még olyat, ami a elméleti teljesítmény felét tudná (én ne dobná magát hanyatt, ha a mátrix nagyobb, mint a L2 cache). Ellenben egy feltételes ugrásokkal teletűzdelt kód kb. rémálom egy GPU-nak, addig egy CPU >80% pontossággal bebecsüli melyik úton kell továbbhaladni és már akkor elkezdi végrehajtani, amikor még ki se derült az eredmény.
TL: DR: Az x86 másra való.
Értem én az Intel marketingjét, hogy mivel megy rajta x86, az eddigi kód futtatható (max újra kell fordítani, hogy legyen AVX is a kódban, lásd a mellékelt fordítót), de hogy a régi x86 kód nem fog gyökeres módosítások nélkül 32 vagy 640 vagy akármennyi ami több mint 2 szálon futni, az hót ziher. Akkor meg már tök mindegy, hogy x86, vagy nem.
[ Szerkesztve ]
-
Yany
addikt
"A 22 nm-es gyártástechnológiát használó MIC architektúra több mint 50 processzormagot alkalmaz, ami elméletben borzalmas nyers erőt jelent."
Vagyis borzalmasan fog teljesíteni?
Építs kötélhidat - https://u3d.as/3078
-
cwn
tag
sli-be megy a cucc?, mert ha beteszek 8 fermit egy alaplapra leszedi az egrol a csillagokat
-
#95904256
törölt tag
Ha valaki linkelne Knights Ferry eredményeket, azt megköszönném.
Az előbb egy ilyet találtam: High Performance and Scalable GPU Radix Sorting
quad core i7 -> 240M 32-bit key/s
Knights Ferry -> 560M 32-bit key/s
GTX480 -> 1005M 32-bit key/s -
hugo chávez
aktív tag
Knights Ferry-Fermi összehasonlítás: Compilers and More: Knights Ferry Versus Fermi
[ Szerkesztve ]
"sajnos ez a beszélgetés olyan alacsony szintre jutott, hogy a továbbiakban már nem méltó hozzám" - by Pikari
Új hozzászólás Aktív témák
Állásajánlatok
Cég: Alpha Laptopszerviz Kft.
Város: Pécs
Cég: Ozeki Kft.
Város: Debrecen