Hirdetés

Az NVIDIA bemutatta a GP104-es GPU-ra épülő GeForce-okat

A GP104 rejtelmei

Az NVIDIA ma hajnalban megtartotta az ígért előadását, amelyen belül a GP104-es GPU-ról, illetve a rá épülő két VGA-ról esett szó, amelyek GeForce GTX 1070 és 1080 néven érkeznek. A lapkával kezdve az elemzést, a GP104 kialakítása annyira nem lehet meglepő a szintén Pascal architektúrára épülő GP100 kódnevű GPU ismeretében. Tulajdonképpen annyi változás történt, hogy a GP100 hat darab GPC blokkja helyett a mérnökök négyet építettek be, így 40 darab streaming multiprocesszor került a GP104-be, ami 2560 shader processzort jelent, ehhez pedig 160 darab textúrázó csatorna tartozik.

A TSMC 16 nm-es FF+ node-ján készülő, 7,2 milliárd tranzisztorból álló, GP104-es GPC blokkok azonban nem ugyanolyanok, mint a GP100-es verzióban dolgozók, mivel van bennük setup motor, tesszellátor, szűrt mintákkal visszatérő textúrázó csatorna. Továbbá kevesebb FP64-es CUDA magot kaptak, de az még nem derült ki, hogy mennyivel. A lényeg igazából az, hogy a GP104 a GP100-zal ellentétben grafikai számításra is alkalmas, így építhető rá GeForce, illetve esetlegesen Quadro is. A ROP blokkok száma négy lesz, és egy blokk 16 darab blending egységet tartalmaz, vagyis összesen 64 blending egység áll majd rendelkezésre. Figyelembe véve a 256 bites memóriabuszt, ez a konfiguráció lényegében a GM204-es lapkánál megismert rendszer másolata.

A GP100 egyéb örökségeit is megkapja a GP104, így végre olyan GMU-kkal (Grid Management Unit) rendelkezik, amelyek támogatják az erőforrás-korlátozást, vagyis az NVIDIA a DirectX 12 és a Vulkan API alatt is hatékonyan tudja majd támogatni az aszinkron compute képességet, ami igen fontosnak bizonyult, hiszen minden eddig megjelent, szabványos explicit API-n futó program kihasználja. Mindemellett a preempciós modell is megváltozik, így a Pascal ebből a szempontból már jóval finomabb szemcsézettségű lesz a Maxwell architektúrához viszonyítva, emiatt a virtuális valóságban amúgy elég karcsún teljesítő Maxwellt alaposan helybenhagyja majd. Az NVIDIA saját tesztjei szerint a timewarpok kezelése szempontjából majdnem háromszor jobb eredményt kínál a GeForce GTX 1080 a GeForce GTX 980-nál.

Itt leginkább nem a nyers sebességre kell gondolni, mert az a virtuális valóság szempontjából nagyon csalóka. Az erre kialakított tesztek gyakorlatilag nem érnek semmit, ugyanis két, elméletben ugyanolyan tempóval futó rendszer is rendkívül eltérő élményt adhat a timewarpok kezelésének különbsége miatt. A Pascal lényege ebből a szempontból az, hogy az azonnali eredményt követelő timewarp feladatok futtatása kvázi valós idejűvé válik, szemben a Maxwell architektúra kényszerűen rajzolási határokhoz idomuló feldolgozási modelljével. Utóbbi jelentős késleltetést adhat hozzá a rendszerhez, így a timewarpok jó eséllyel nem készülnek el időre.

NVIDIA VRWorks Audio
NVIDIA VRWorks Audio [+]

A virtuális valóságnál maradva az NVIDIA végre elkezd koncentrálni a hangzásvilágra is, ami ezen a területen kiemelten fontos. Ez talán nem meglepetés olvasóinknak, mivel az elmúlt év nyarán már megírtuk, hogy a zöldek saját hangprocesszoron dolgoznak. Erről a vállalat még ma is elég kevés adatot közöl, és sokan az AMD TrueAudio blokkjához hasonlítják, de az eddig elérhető információk alapján az NVIDIA megoldása sokkal közelebb lesz a Polaris architektúrában érkező TrueAudio Next kódnevű rendszerhez, amelyről az alábbi hírben írtunk. Ezt főleg azért gyanítjuk, mert az NVIDIA a fizikailag korrekt hangzást emelte ki, amihez az Optix rendszert használják fel. Persze a hardveres implementáció ettől még különbözhet, de a – csúnyán fogalmazva hallható – végeredmény szempontjából ugyanarra a problémára kínálna egy-egy némileg eltérő megoldást a két cég.

A szimultán multiprojekciós futószalag előnye
A szimultán multiprojekciós futószalag előnye [+]

Végül újdonság lesz még a szimultán multiprojekciós futószalag, amelynek keretében a GP104 maximum 16 darab független nézőpozícióra képes továbbküldeni a geometriai információkat. Ez leginkább a több kijelző kezelése szempontjából fontos; az aktuális többmonitoros rendszerek esetében ugyan megoldható, hogy például három kijelzőhöz három különböző nézőpozíció tartozzon, de azoknak mindenképpen egy síkban kell lenniük. Az NVIDIA megoldása lényegében felkínálja a nézőpozíciók tetszőleges elhelyezését, így például ha három kijelzővel számolva a két oldalsó valamekkora szöget zár be a középső megjelenítővel, akkor ez a szög a nézőpozíciókat biztosító kamerák szempontjából is figyelembe vehető. Ennek köszönhetően maga a leképezés szögfüggővé tehető. Ez a virtuális valóságban is működhet, bár a haszna ezen a területen korlátozottabb, mivel az egy szemnek szánt nézőpozícióra levetítve a lencse alakja nem jelent olyan potenciális képtorzulást, hogy azt ne lehetne egy jóval egyszerűbb utófeldolgozással kezelni, ráadásul a lencse alakját tekintve sem szögletes, hanem ívként jellemezhető.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

Előzmények

Hirdetés