Hirdetés

NVIDIA SLI: videokártyák párban

NVIDIA SLI

Bevezető

A számítástechnika világában egyre elterjedtebb a párhuzamosítás elve, gondoljunk csak a HyperThreading technológiára vagy a jövőben megjelenő többmagos processzorokra, a multi-monitor támogatásra vagy akár az Native Command Queuing „felfedezésére”, mellyel a merevlemezek multitaszkos környezetbeli teherbírását optimalizálták. Amikor egyes számítógép-alkatrészek más módszerekkel már nem vagy csak nagyon kis mértékben képesek tovább gyorsulni, akkor a párhuzamosítás az egyik legkézenfekvőbb megoldás, könnyű kivitelezése mellett azonban számos negatívummal is számolni kell megvalósításakor.

Természetesen vannak alkalmazások, programok, melyeket a párhuzamosítással nem tudunk felgyorsítani, hiszen a szűk keresztmetszet eleve az ember. Mindennapi feladataink során a számítógépen csak a legritkább esetben végzünk egyszerre több feladatot, és még ha a háttérben a rendszer dolgozik is, a párhuzamosítás ezekben az esetekben a minél simább, akadályoktól mentes munkára is elég, a gyorsulást a felhasználó nem érzi többszörösnek. Ha nem ide, akkor hova kellhet igazán a „kraft”? Az NVIDIA szerint a 3D-s grafikához!


Az SLI 1998-ban, két 3dfx Voodoo2 SLI-be kötve

Ha egy kicsit (1998-ig) visszamegyünk az időben, és fölidézzük a 3dfx virágkorát, eszünkbe juthat az SLI (Scanline Interleaving) technológia, mellyel a 3dfx képes volt a vetélytársakat könnyedén a porba tiporni. Mit is látunk a képernyőn, amikor játszunk? Egy „átlagos” 3D-s kép objektumok tömkelege, melyet a program forgat, dönt, eltol, megjelenít, eltűntet. Az objektumok lehetnek a „legegyszerűbb”, több ezer háromszögből álló Alien-fejtől a pixel és vertex shader programok tömkelegéig bármik, és ha arra gondolunk, hogy az igazán élvezetes játékélményhez 1024x768-as felbontásban a videokártyának másodpercenként 60 (fps) x 786432 db pixel kirajzolására kell képesnek lennie (úgy, hogy még be sem kapcsoltuk az élsimítást), akkor már sejthetünk valamit, miért is kellhet a „kraft” a videokártyák világában.

NVIDIA SLI


Az új SLI 2004-ben, két NVIDIA GeForce 6800 egymás mellett

Az új, 2004-es SLI részletesebb bemutatása előtt lássuk, hogyan is jöhetett létre maga a technológia. Az NVIDIA-féle SLI (Scalable Link Interface) lényegében a PCI Express busz mellékterméke – létrejött, mert lehetősége volt létrejönni. A PCI Express architektúra lehetővé teszi, hogy az egyes PCI Express sávokat tetszőlegesen vezessük el az x1, x2, x4, x8 és x16-os foglalatokig. Az NVIDIA nForce4 Ultra lapkakészlet alapvetően 16 PCI Express sávot engedélyez a VGA számára, ám ezt az architektúra rugalmasságának köszönhetően 1x16 vagy 2x8-as felállásban is megvalósíthatja az alaplapgyártó. Az alaplapon fizikailag ez két x16-os foglalat képében jelenik meg, azonban elektronikusan ez két x8-as foglalat. Mivel még a jelenlegi csúcskártyák sem képesek kihasználni a nyolc PCI Express sáv által elérhető sávszélességet (2 GB/s fel és le is), így ez a módszer a gyakorlatban kifogástalanul működhet.


NVIDIA NV40 kinagyítva [+]

Az NV40-es GPU „röntgenképén” jól látható, hogy az NVIDIA már az NV40 tervezésekor gondolt az SLI lehetőségére, a GPU-nak van egy területe, amely lehetővé teszi az egyik GPU számára, hogy egy másikkal kommunikáljon és megossza a feladatokat kettejük között. Tehát, úgy tűnik, hogy egy hozzávaló lapkakészlettel, „néhány” tranzisztorral, és egy felkészített meghajtóprogrammal lehetővé válik két GPU erejének egyesítése. De vajon 1 + 1 = 2? Csak attól függ, hogy a GPU-k között hogyan oszlanak meg a feladatok. Lássuk, hogy az NVIDIA hogyan oldotta meg ennek megvalósítását.

A 3dfx bekebelezésével a 3dfx-féle SLI-technológia is az NVIDIA tulajdonába került, ám az SLI az NVIDIA olvasatában nem azt a bizonyos Scanline Interleavinget jelenti. A 3dfx-féle Scanline Interleaving metódus keretein belül az egyes videokártyák a képernyőn megjelenő képkocka egyes sorainak megjelenítéséért felelősek, vagyis az első kártya a páratlan, míg a második kártya a páros sorokat számolja ki. Az SLI névre az NVIDIA-nak csak marketingszempontokból volt szüksége, sokaknak még mindig a két GPU összekapcsolásából eredő teljesítmény jut eszébe az SLI-ről, márpedig ez elég ahhoz, hogy felkeltse a figyelmet, és jó időre a középpontba állítsa az NVIDIA megoldását.

Az NVIDIA féle Scalable Link Interface ettől eltérő módo(ko)n növeli a teljesítményt. Az első módszer a split-frame rendering (SFR) névre hallgat. Ez esetben mindkét kártya a végső képkocka egy-egy részét rendereli, a választóvonal horizontális. Az első kártya, mely a „vezérkártya” (az első PCI Express foglalatba került) rendereli le a képernyő felső területét, míg a második felelős a képernyő alsó területéért. Ez a megoldás terhelésfüggő, tehát a kártyák a munkán osztoznak meg 50-50 %-ban, a renderelnivaló képkocka komplexitásától függően. Ez az optimális megoldás, hiszen így mindkét GPU mindig teljes terhelés alatt van, tehát elviekben elképzelhető a folyamatos majdnem kétszeres sebességnövekedés (csak azért majdnem, mert szinkronizálásra és az adatok két GPU közti ide-oda pumpálására is időt kell szakítani), ugyanakkor mivel mindkét kártya folyamatosan és szinkronban dolgozik, nincs esetleges várakozás köztük az egyes frame-ekre, mint ahogy azt majd látni fogjuk a másik módszer esetében.

A második módszer az alternate frame rendering (AFR) névre hallgat, az SFR-nél megismert módszernél jóval egyszerűbb módon történik a képkockák kiszámítása, ugyanis nincs terhelésfüggő megosztás. Az AFR esetében az egyes frame-eket a GPU-k felváltva számolják ki, tehát például az első kártya felelős a páratlan, a második pedig a páros frame-ek kiszámolásáért. Ez a mód bizonyos szintű látenciát (késleltetést) eredményez, hiszen előfordulhat, hogy a processzor által a videokártyák felé küldött, egymás utáni frame-eket az egyik GPU gyorsabban számolja ki, mint a másik. Ez csak azokban az esetekben fordulhat elő, amikor a megjelenítendő képkockák sorozatában hirtelen komplexitásváltozás történik, ekkor előfordulhat bizonyos mértékű késlekedés a játékos által elvégzett mozgás (billentyű vagy egérkombináció) és a képernyőn megjelenő frame között. Ez az AFR-módot az SFR-nél kevésbé optimalizálttá teszi.

Az SLI-módok bemutatása után már nyilvánvalóvá válik, hogy a játékokban elért sebességnövekedés több faktortól is függ. Mindenekelőtt a meghajtóprogram az, amitől a játékok sebessége elsődlegesen függ, és talán ez az a pont, amely a leggyengébb láncszem a gépezetben. Az NVIDIA driver-írói egyelőre csak a „Top 100” játékra készítették fel a meghajtóprogramokat, így ha olyan játékba vagy programba botlunk, melyre nincs optimalizálva a driver (NVAPPS.XML), sebességnövekedést egyáltalán nem fogunk tapasztalni, hiszen az SLI nem fog működni. A drivert manuálisan is rá lehet bírni az SLI-s működésre, azonban ehhez profilokat kell létrehoznunk, ami ugyan egyszerűnek egyszerű, de ekkora anyagi beruházásnál bosszantó lehet. Emellett a játék sebességét döntően befolyásolja az az SLI-mód, amelyet az NVIDIA fejlesztőmérnökei az adott játékhoz társítottak. Ezt manuálisan nem tudjuk átállítani, alapértelmezés szerint ez a mód az AFR. Elképzelhető, hogy egyes játékok esetében az SLI-s működés által elért sebességnövekedés driver-verziónként változik, hiszen pl. a driver-írók variálgatják az egyes játékokhoz beállított SLI-módot (SFR/AFR). Végül a processzor sebessége is igen meghatározóvá válik, hiszen egy lassabb processzor kevésbé tud kiszolgáni két videokártyát a kellő adatokkal, így processzor- vagy vegyeslimitált beállításokkal elképzelhető, hogy akár lassulást is tapasztalunk az egykártyás rendszerhez képest.

A cikk még nem ért véget, kérlek, lapozz!

Azóta történt

  • NVIDIA SLI a magyar piacon

    A PCI Express felületű videokártyák után az SLI-kompatibilis alaplapok is megjelentek a hazai üzletekben – ideje, hogy mérlegeljük a szükséges beruházás mértékét.

  • Asus A8N-SLI Deluxe alaplap

    Az Asus nForce4 SLI chipsetje révén két videokártya egyidejű használatát lehetővé tevő csúcslapját izzasztjuk meg.

  • Milyen videokártyát válasszunk?

    Mai körképünkben a megfelelő grafikus vezérlő kiválasztásához szolgálunk útmutatóval – az integrált megoldásoktól a csúcskártyákig.

  • Grafikus kettősfogat a Gigabyte istállójából

    A gyártó a sebesség megszállottjainak készítette két GeForce 6600 GT GPU-t egyetlen lapon egyesítő 3D1 videokártyáját.

Előzmények

Hirdetés