Hirdetés

Vannak vagy nincsenek letiltott ROP-ok az NVIDIA GeForce GTX 1070-en?

A vállalat teljesen korrekt specifikációt adott meg, és a furcsa eredményeknek is van teljesen racionális magyarázata.

Az NVIDIA nagyjából egy hónapja mutatta be a GeForce GTX 1070 jelzésű VGA-t, amely tulajdonképpen a GP104-es lapka némileg alaposabban megvágott verziójára épül. Ennek a technikai paramétereit az erre vonatkozó hírünkben leírtuk, amelyek egyébként ezúttal teljesen helytállóak.

A specifikációkban szereplő elméleti értékeket azonban a GeForce GTX 1070 valóban meg sem közelíti, ami tényleg jó alapot ad ezeknek a pletykáknak, de valójában megvan ennek is a teljesen racionális magyarázata.

Az egész kiindulópontja a PCGamesHardware.de tesztjének pixelkitöltési sebességre vonatkozó mérése volt, amelyből tényleg az látszik, hogy az elméletben várthoz képest sokkal rosszabbul teljesít a GeForce GTX 1070. Kiszámolható ugyanis, hogy elméletben a tesztelt 1898 MHz-es órajellel 121,5 gigapixel/másodperces teljesítmény közelében kellene végezni, miközben a gyakorlatban csak 84,8 gigapixel/másodperces tempót sikerült kinyerni. Mindeközben a GeForce GTX 1080-on a tesztelt 1886 MHz-es órajel elméleti 120,7 gigapixel/másodperces maximumból hozott 113 gigapixel/másodpercet, ami tulajdonképpen helytállónak néz ki.

A félreértésre az adhat okot, hogy ha esetleg teoretikusan feltételezzük, hogy tényleg csak 48 ROP aktív a lapkával, akkor az elméleti pixelkitöltési sebesség a fentebb említett órajelen 91,1 gigapixel/másodperces, és a gyakorlati mérés nagyjából annyival van ezalatt, amennyi a GeForce GTX 1080 elméleti és gyakorlati eredménye közötti eltérés. Ugyanakkor az igazság az, hogy a GeForce GTX 1070 valóban rendelkezik mind a 64 ROP-pal, a teljes 2 MB-os L2 gyorsítótárral, illetve nem alkalmaz a memóriavezérlő területén sem különösebb trükköket.


(forrás: PCGamesHardware.de) [+]

A furcsa eredményeknek magyarázata a hibás specifikáció helyett sokkal kézenfekvőbb. A GP104-es lapkából úgy van letiltva az 5 darab SMP, hogy lényegében ki van kapcsolva egy GPC blokk a négyből. Ezzel a hardver nem csak az SMP-ben található egységeket veszt el, hanem egy raszter motort is a négyből. Ez azért fontos tényező, mert a GP104-es lapkában egy raszter motor órajelenként 16 pixelt dolgoz fel, és a konfiguráció úgy van felépítve, hogy a 64 ROP-ra 64 pixel jusson. Három raszter motorral azonban csak 48 pixel jut 64 ROP-ra, és tulajdonképpen ez okozza a fenti tesztben kimért limitet. Ez egyébként nem azt jelenti, hogy a 64 ROP-nak ezen a VGA-n egyáltalán nincs értelme, de nyilván a raszter motorok korlátozó hatása számos helyzetben rányomja a bélyegét a ROP-ok kihasználhatóságára.

Az NVIDIA által kiadott specifikáció a GeForce GTX 1070-re tehát teljesen helytálló, maximum egy picit hiányos, hiszen egyáltalán nem mindegy, hogy a 20-ból azt az 5 SMP-t hogyan vágják ki a rendszerből, a gyakorlati eredmények szerint szimplán kivágnak egy teljes GPC blokkot.

Azóta történt

Előzmények

Hirdetés