IDF14: friss adatok a Broadwell IGP-jéről

Az idei IDF alkalmával az Intel egy külön előadás formájában újra részletezte a Broadwell kódnevű fejlesztést, amelyről az alábbi cikkben már beszámoltunk. A legnagyobb újítás még mindig a Gen8-as architektúrára épülő IGP, illetve a mély integráció irányának megkezdése.

Az Intel az előadás során beszámolt az IGP felépítéséről. A vállalat az alábbi oldalon leírt összes információnkat megerősítette, így ezeket nem taglaljuk újból, viszont vannak extra adatok, amelyek tényleg érdekesek lehetnek. A Gen8-as architektúrára épülő IGP az Intel szerint fejlődött a GPGPU-s feladatokban is, ami várható volt, hiszen szinte mindegyik gyorsítótár méretét megnövelték a tervezők. Ennek az adatok gyors elérése szempontjából sok haszna van, tehát ez az állítás még konkrét teszteredmények nélkül is hihető.

A friss információk szerint az Execution Unitokon, azaz a feldolgozókon belül a regiszterterület sem változott, így a hét szállal dolgozó két darab 128 bites vektormotorhoz továbbra is 28 kB-os regisztertár tartozik. Ebből a vektormotorok órajelciklusonként 96 bájtot olvashatnak, illetve 32 bájtot írhatnak bele. Az is kiderült, hogy shader tömbökben található 256 kB-os URB, azaz a Unified Return Buffer nevű gyorsítótárból a Local Data Share (LDS) funkcióra 64 kB-nyi terület van fenntartva. Ebből órajelciklusonként 64 bájt olvasható, illetve 64 bájt írható bele. Itt lényegi változás tehát nincs a Gen7.5 architektúrához viszonyítva, de ahogy fentebb említettük az egyes gyorsítótárak megnövelt mérete még így is gyorsulást hozhat.

A korábbi elemzésünkben említettük, hogy javult a 32 bites integer műveletek feldolgozási sebessége is. Utólag kiderült, hogy a feldolgozókon belül mostantól nem csak az egyik, hanem a másik 128 bites vektormotor is használható ezekre a számításokra, így lényegében kétszeresére gyorsul a rendszer, amennyiben a kódban nincs olyan függőség, ami akadályozná a második vektormotor bevetését.

A Broadwell implementációja az egységes virtuális memóriára
A Broadwell implementációja az egységes virtuális memóriára [+]

Az Intel kitért az OpenCL 2.0-ra, amelynek az egyik legfontosabb újítása az egységes virtuális memória. A fentebb linkelt cikkben már említettük, hogy ezt a funkciót a Broadwell támogatja. Ennek értelmében a processzormagok és az integrált grafikus vezérlő között megosztott a virtuális memória, így az előbbi két részegység teljesen mellőzheti a memóriamásolásokat, illetve ezek eliminálásával hatékonyabb algoritmusok hozhatók létre és a heterogén módon programozható hardverek használata is egyszerűbb lesz. Az Intel az implementáció a VT-d szolgáltatáson keresztül oldotta meg. Utóbbinak feltétlenül aktívnak kell lennie, hogy az egységes virtuális memória előnyeit képes legyen kihasználni az adott lapka. Ellenkező esetben az emulált OpenCL 2.0-s funkciók lépnek érvénybe, vagyis az integrált grafikus vezérlő funkcionálisan nem viselkedik másképp a dedikált opciókhoz, illetve a régebbi integrált megoldásokhoz viszonyítva.

A Broadwell egységes virtuális memóriára vonatkozó OpenCL 2.0-s implementációja természetesen az utolsó szintű gyorsítótárhoz van kötve. Nyilván ez logikus, hiszen ehhez hozzákapcsolódik az IGP-n belüli L3 gyorsítótár és ezen belül a többi részegység is. Nyilván ilyenkor az IGP a processzormagok által használt rendszermemóriába dolgozik, tehát alapvetően egy teljesen koherens funkcióról van szó, ugyanakkor továbbra is fenn kell tartani egy nem koherens memóriaterületet, ami tulajdonképpen a hagyományos értelemben vett videomemória. Ennek méretét jellemzően a kész termékek BIOS-ában lehet befolyásolni, és ez az érték a memória tényleges kapacitásából lesz lecsípve.

Az Intel a multimédiás fejlesztésekről is beszélt. Ezekről az alábbi oldalon szintén írtunk, de extra adat, hogy a Broadwell IGP-je már a VP8-as kodeket is egy fixfunkciós részegységen keresztül kezeli, illetve a cég említést tett a fixfunkciós JPEG és MJPEG dekódolóról, igaz ez már a Haswell IGP-jének is a része volt. A HEVC támogatása szempontjából – a várakozásoknak megfelelően – a GPGPU-s megoldás került előtérbe, így a Broadwell IGP-je elsődlegesen egy GPGPU-s felületen, például az OpenCL-en keresztül fogható be erre a munkára. Valószínű, hogy később érkezik egy olyan grafikus meghajtó is, amely tartalmaz egy beépített HEVC dekódolót, hiszen a Gen7, Gen7+ és Gen7.5 architektúrára épülő IGP-k esetében egy ilyen fejlesztés már le van kódolva az Intel által használt virtuális utasításarchitektúrára, és ezt a kódot – némi tesztelés után – engedélyezni lehet a Gen8-as IGP-kre is. Természetesen ez az opció is egy GPGPU-s megoldás, tehát az IGP általános számítási kapacitását használja fel a HEVC tartalmak dekódolására.

A Quick Sync Video minősége a Haswell és a Broadwell esetén
A Quick Sync Video minősége a Haswell és a Broadwell esetén [+]

Javult a Quick Sync Video blokk teljesítménye is, így mostantól kétszer gyorsabban dolgozik, illetve a képminősége is jobb lett, ahogy azt a fenti kép is demonstrálja. Mindemellett a videók esetén alkalmazható utófeldolgozásra alapozó szűrők minősége is fejlődött. Ezt az Intel – a PC-ben utazó cégek közül egyedi módon – fixfunkciós egységgel oldja meg, tehát szoftveresen ezek minősége nem befolyásolható, így azt a minőségi szintet kell elfogadni, amire az adott hardverbe épített blokk képes, és az a meghajtók frissítésével nem fog javulni. Éppen ezért az Intel minden generációváltáskor javít a fixfunkciós egység által előállított minőségen. A Broadwell IGP-jébe épített dedikált hardver az elődöknél jobb élesítés és noise reduction utófeldolgozást alkalmaz.

A Broadwell utófeldolgozásra alapozó szűrői
A Broadwell utófeldolgozásra alapozó szűrői [+]

A fentiek mellett a Broadwell támogatja a 4K-t is, de ebből a kijelzők kezelése szempontjából nincs változás a Haswellhez képest, így DisplayPort 1.2-n keresztül marad a 3840x2160 pixeles felbontás 60 Hz-es frissítéssel, míg a HDMI 1.4-es interfészen 4096x2160 pixel mehet át 24 Hz-es frissítés használatával.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények