- Felpörög az asztali CPU-piac a következő pár hónapban
- Hősködik és száguldozik az új Arc meghajtó
- A Panasonic is nyit a TiVo okostévé rendszer irányába?
- Rengeteg csatlakozó van a HP legfrissebb, irodai célú monitorgóliátján
- Computex 2024: teljesen integrált hibrid hűtéssel közeleg az MSI új csúcs-VGA-ja
- Egérpad topik
- Nvidia GPU-k jövője - amit tudni vélünk
- Memóriakártya topic
- Vezeték nélküli fülhallgatók
- Notebook hibák
- Sony MILC fényképezőgépcsalád
- Milyen billentyűzetet vegyek?
- Intel Core i5-7640X / i7-7740X "Kaby Lake-X" és i9-7xxx "Skylake-X" (LGA2066)
- Computex 2024: teljesen integrált hibrid hűtéssel közeleg az MSI új csúcs-VGA-ja
- Dell notebook topic
Hirdetés
-
Egyre több európai használja a Telegramot, ezért megkereste az EU
it Hamarosan sokkal szigorúbb szabályozás alá esik az EU-ban a Telegram, mivel egyre több a helyi felhasználója.
-
A Z Flip6 jókora, a Galaxy Ring parányi akkumulátort kap
ma A telepadatok az FCC listázásában jelentek meg.
-
Felpörög az asztali CPU-piac a következő pár hónapban
ph A friss pletykák szerint az AMD és az Intel is a frissítésein dolgozik.
Új hozzászólás Aktív témák
-
Zoli0726
aktív tag
Már a 2.8as app sdk óta elérhető a bolt.
-
marcell991
tag
Épp a hétvégén futottam bele a Bolt Github oldalába [link], tényleg nyílt forrású
Developers, developers, developers, developers! http://youtu.be/KMU0tzLwhbE
-
bitblueduck
senior tag
A bolt-os példa egész értelmesen néz ki az elsőhöz képest, lehet én is kipróbálom holnap egy hello world-re
An open mind is like a fortress with its gates unbarred and unguarded.
-
petXYZW
tag
"Belekatekertem" a videóba. Azon rugózik, hogy az OpenCL kód milyen hosszú, a másik meg milyen rövid?
-
petXYZW
tag
Kedves Höh!
A második videóban, az első példakód estén, azt demonstrálja, hogy a gazdaeszközön futó kód, az OpenCL esetében milyen nagyon hosszú, tele van csúnyaságokkal context, program, bufferek stb., ráadásul runtime fordítja kernel kódot. (~120 sor) pfejj
A második példakód esetén, C++ wrapernek nevezi - kétségtelenül az, csak éppen semmi értelme - azt a vékony absztrakciós réteget amit ráhúztak az alap C-s openCL hívásokra, ami gyakorlatilag semmit nem változtat az egész logikáján. Én a magam részéről, ezt nem is szoktam használni. (~75 sor)
Olyan, mint a progi amit bemutat, a karakterkódokhoz hozzáadtak egyet...A harmadiknál (BOLT) ami már csak 35 sor - elsőnek, mint legfontosabb fícsör - már nincs semmi ami az OpenCL-ből maradt volna. Nincs inicializálás stb.
1. Tehát az alkalmazásod logikája semmit nem változott van egy rész ami a kvázi valamilyen előkészítés - a puffereket azért fel kell tölteni, nevezzük akárminek őket -, majd valamilyen függvény szerintem mindegy minek nevezzük kernel, funktor ahogy tetszik, ami a tényleges munkát végzi.
2. Egy szombat délelőtt összedobok egy C++ wrapert, ami nemcsak elfedi a csúnya OpenCL API-t, hanem hasonlóan lerövidíti a kódot.
3. A runtime fordítás adott esetben még előny is lehet. Arról a kis csúsztatásról meg ne is beszéljünk, hogy a kernel kód egy string-ben van. Lehet az külön fájlban is, miért kellene egy string belsejében highlight nélkül szopni vele, a KernelAnalyzer-ről nem is beszélve.
4. És a legfontosabb, a példák mindig ilyen semmittevő kernelekről, funktorokról szólnak. Mi van akkor, ha van BARRIER utasítás vagy a kernel is 120 sor?
-
Jack@l
veterán
Jé egy hozzáértő , osztom a vélemélnyt.
A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
-
Jack@l
veterán
Ha már c++ amp/opencl-ról is szó esett, itt egy real-life felhasználás:
http://totalcar.hu/magazin/hirek/2013/05/01/atvilagit_eson_es_havon_az_uj_csodafenyszoro/[ Szerkesztve ]
A hozzászólási jogosultságodat 2 hónap időtartamra korlátoztuk (1 hsz / 10 nap) a következő ok miatt: Az ÁSZF III 10/8. pontjának megsértése - trollkodás - miatt. Többször és többen is kértek már, hogy hozzászólás írásakor használd a linkelés funkciót, mert ennek elmaradása sokak számára zavaró.
-
MCBASSTION
aktív tag
szerintem itt az volt a lenyeg, hogy az egyszerubb dolgokat konnyen lehessen gyorsitani GPU-n, es ehhez a c++-hoz erto programozonak ne kelljen szopni az OpenCL apival. Mondjuk azert annyira nem szopas, es legalabb normalisan megtanulja, hogy hogyan is kell GPU-ra programozni, de mindegy. Szerintem AMD bacsi azt gondolja, hogy ahhoz, hogy a heterogen programozas elterjedjen ez szukseges.
Mondjuk teny, hogy azert igy sokkal egyszerubb. De egy bonyolultabb peldat en is megneznek
windows7sins.org
-
petXYZW
tag
válasz MCBASSTION #11 üzenetére
A BOLT jó dolog, csak nem értem ezzel, és a hasonló videókkal mit akarnak. Azoknak, akik értenek a C++, az OpenCL megtanulása, feldolgozása nem okozhat gondot.
"Mondjuk azert annyira nem szopas, es legalabb normalisan megtanulja, hogy hogyan is kell GPU-ra programozni, de mindegy."
Azt gondolom pont ez a lényeg!
-
lenox
veterán
Nem mindig olyan szerencses az ember, hogy van ideje elmelyedni egy temaban. Van amikor tobbet er egy nap alatt 5-szorosere gyorsitani valamilyen feladat megoldasat, mint egy het alatt 10-szeresere. Szoval van, hogy kompromisszumot kell kotni, ez is egy kompromisszum, ami az esetek egy reszeben hasznalhato.
Amugy ha jol ertem ez elvben megy intelen es nvidian is, ugye?
-
LordX
veterán
Ez mind szép és jó, de pl. egy scan, egy redukció vagy konvolúció jár úgy hat tonna host és kernel kóddal, úgy, hogy az elemi művelethez még egy bit kódot nem írtál. És ezek teljesen ugyanazok minden esetben. Nem nehézség, de a produktivitást brutálisan megdobja, ha nem kell a mechanikus lépésekkel foglalkozni.
-
petXYZW
tag
Igazad van, a produktivitás fontos. Magam részéről mindig próbálok mérlegelni, hogy mi tart tovább, egy számomra új, de már létező wraper-t megtanulni vagy egy sajátot készíteni. Úgy gondolom mindkét módszernek lehetnek további előnyei hátrányai. Amit a videón láttam az nem nyűgözött le.
Ettől függetlenül egy érdekes diasorozat a BOLT-ról - bár nem túl friss -, amiből számomra az is kiderült, eltérőek a "képességei" OpenCL és AMP mellett. Legalábbis akkor még eltérőek voltak.
http://www.slideshare.net/hsafoundation/bolt-for-hsa-by-ben-sanders
[ Szerkesztve ]
Új hozzászólás Aktív témák
- Hivatalos, hogy Game Pass-be jön a Call of Duty: Black Ops 6
- Középpontba kerültek a hibrid autók, alig fogyaszt a BYD újdonsága
- Kerékpárosok, bringások ide!
- Autós topik
- Ukrajnai háború
- World of Tanks - MMO
- Politika
- Egérpad topik
- Redmi Note 13 Pro+ - a fejlődés íve
- EA Sports WRC '23
- További aktív témák...
- ASUS ROG GTX 1060 OC 6GB Gaming (ROG STRIX-GTX1060-O6G-GAMING) - Garancia + Számla, BeszámítOK!
- Asus DUAL RTX 2060 6GB videokártya /Újszerű/Csavarmatrica/Beszámítás/
- gtx 1070 turbo
- ASUS RTX 4090 24GB GDDR6X TUF Gaming OC Edition - Új, bontatlan - Eladó! 650.000.-
- EVGA RTX 3070 Ti 8GB XC3 ULTRA - bontatlan - eladó!
Állásajánlatok
Cég: Ozeki Kft.
Város: Debrecen
Cég: Promenade Publishing House Kft.
Város: Budapest