Hirdetés

Újabb kérdések a PhysX körül

A PhysX kapcsán sokszor felmerül a motor drámaian gyenge teljesítménye a processzorok oldaláról. Ez kifejezetten akkor szembetűnő, ha a konkurens megoldások közül felhozzuk a Havokra épülő Red Faction: Guerrilla és Star Wars: The Force Unleashed című játékokat, amelyek pusztán a CPU erejére támaszkodnak, és mégis a csúcsot képviseli a fizikai hatások szimulálásakor. Az AMD már korábban támadta a PhysX motort, a többmagos processzorok gyenge kihasználásának vádjával, de az NVIDIA elmondta, hogy a 3DMark Vantage esetében 12 feldolgozási szál engedélyezett. Persze a játékok esetében a feldolgozás erősen korlátozott, hogy a lehető legnagyobb előnye legyen a GPU-val történő gyorsításnak.

Az NVIDIA általában kétszeres vagy négyszeres előnyről beszél a CPU-hoz viszonyítva, és ezt az állítást David Kanter a Real World Technologies szakértője alaposabban megvizsgálta. Az alábbi weboldalon elérhető tesztben a Cryostasis és a PhysX Soft Body Demo került górcső alá. A programokat a zöldek többször is használták bizonyítékként a GPU-s gyorsítás erejének demonstrálására. Az elemzésért az Intel VTune programja felelt, ami analizálja az alkalmazást számos szempont alapján. Az eredmények vizsgálata meglehetősen hosszadalmas folyamat, de az összegzés alapján kiderült, hogy PhysX x87-es utasításokat és mikrooperációkat használ, ami manapság nagyon ritkának számít, hiszen az SSE kiterjesztés számottevően gyorsabb feldolgozási sebességet kínál. Kifejezetten érdekes a GPU-s gyorsítás is, ugyanis látszik, hogy az eszközmeghajtó ilyenkor automatikusan többszálú feldolgozást ír elő, ám a CPU-n történő futtatás esetén az alkalmazás dönt a többszálú munkavégzésről. Talán mondani sem kell, hogy a játékokban egyetlen feldolgozás szálon fut a PhysX, így a CPU teljesítménye mesterségesen van korlátozva.

De miért x87?

Felmerülhet a kérdés, hogy minderre mi szükség van, hiszen az x87 már a múltat képviseli, és azt sem lehet mondani, hogy a mai processzorok nem támogatják a vektoros SSE vagy akár az SSE2-es utasításkészletet. A legnagyobb gond, hogy a CPU-k csak két x87-es operációt képesek végrehajtani órajelenként, miközben az évek óta alapnak számító SSE2 már dupla pontosság mellett kettő, míg szimpla pontosság esetén négy utasítással is elboldogul. A legerősebb AMD-s és Inteles processzoroknak a négy (dupla) és a nyolc (szimpla) instrukció órajelenkénti feldolgozása sem jelent gondot. Bár a támogatás hiánya miatt a PhysX esetében nem lehet kimérni az SSE tényleges előnyeit, a konkurens megoldások (Havok, Bullet) kétszer gyorsabban futnak az SSE-re optimalizálva, így hasonló tempóelőny lenne kimutatható a PhysX esetében is. Ez gyakorlatilag azt eredményezné, hogy a GPU előnye jelentősen redukálódna, vagyis az erősebb processzorok GPU-s gyorsítás nélkül is megbirkóznának a kérdéses játékokkal.

Az x87-es kód alkalmazása lényegében egy mesterséges limitáció, amire az egy programszálon történő feldolgozás csak rátesz egy lapáttal. Persze nem érdemes számítani arra, hogy az NVIDIA optimalizálja a PhysX-et az SSE utasításkészletekre, hiszen a cégnek semmi érdeke nem fűződik ahhoz, hogy a fizikai motorjuk jól fusson az AMD és az Intel processzorain. Kifejezetten érdekes azonban a konzolok felé tanúsított magatartás, ugyanis a PhysX használja az AltiVec kiterjesztéseket, ami lényegében alkalmazhatóvá teszi a rendszert az Xbox 360-ra és a PlayStation 3-ra. Természetesen az NVIDIA szempontjából logikus, hogy a PC-s játékosok csak akkor számítanak, ha GeForce-ot vásárolnak a számítógépbe.

Kérdéses, hogy mindez hova vezet, hiszen tökéletesen látható, hogy az AMD a hardver fejlesztésére helyezi a hangsúlyt, így a játékosok igényeihez igazítja a Radeonokat, míg az NVIDIA inkább a HPC piac felé fordul, és a zárt szolgáltatásaival próbálja leküzdeni sebességbeli hátrányát. Gyakorlatilag a legnagyobb vesztesek a játékosok lesznek, hiszen a két koncepció, hasszútávon nem él meg egymás mellett, és előbb vagy utóbb az egyik gyártó feladja a harcot. Erre természetesen rásegít a rendszerszintű integráció is, ami negatív hatással lesz a VGA-k eladásaira, hiszen az új generációs processzorok IGP-i elérik a belépőszintű kártyák teljesítményét. Az AMD persze kifejezetten erre játszik, hiszen a Radeon HD 5450 a teljesítmény szempontjából visszalépésnek minősül az elődhöz képest, miközben az árcédulája magasabb. Ez a stratégia beválni látszik, mivel a konkurens megoldás ellen ez a termék is vállalható, és előkészíti a terepet a Fusion számára. A Sapphire már készül is a váltásra, mivel a Computex alatt erősen pletykáltak az alaplapgyártásért felelős üzletág bővítéséről. Várhatóan a Fusion platformokra épülő termékek forgalmazása kompenzálja a VGA-piacból befolyó bevétel csökkenését. Az NVIDIA számára ez kifejezetten kedvezőtlen fejlemény, de a zárt szolgáltatások csak GeForce mellett érhetők el, így az IGP-s processzor mellé venni kell egy VGA-t is. Ez alapvetően nem lenne baj, hiszen az AMD is számít arra, hogy a gyorsabb grafikus kártyák vásárlása iránt megmarad az igény. Ugyanakkor a vásárlók számára kínos helyzetek is előfordulhatnak, hiszen semmi kétség, hogy az AMD és az Intel is kifizetteti a processzorba integrált grafikus magot, így extra pénzt kell adni egy hasonló teljesítményű GPU-ért, ha a zárt szolgáltatások szükségesek a vásárlónak.

Azóta történt

Előzmények

Hirdetés