Hirdetés

Az ARM felvázolta a mobil piac jövőjét

Sokakat meglepetésként érhet, hogy az AMD saját rendezvényén az ARM számára is jutott szerep. Az architektúrák tervezésével foglalkozó brit céget Jem Davies képviselte. Az ARM alelnöke a mobil piac szemszögéből körvonalazta a jövőt, és röviden ismertette a vállalat első fejlesztéseit a vázolt elképzelések megvalósítására.

Mára teljesen világossá vált, hogy a mobil piac jövője a heterogén módon programozható lapkákban rejlik. Ez az éra a mobil szegmensben a megfelelő szoftveres háttér hiányában még csak formálódik, de az ARM a fogyasztást érintő problémákra nem lát más megoldást a központi és a grafikus vezérlők számítási kapacitásának egységes kihasználásán kívül. Kétségtelen, hogy a gyártástechnológia rohamosan fejlődik, ám a tranzisztorok energiaigénye sokkal csekélyebb mértékben csökken, ami az évek múlásával jelentősen korlátozná a homogén módon programozható chipek teljesítményét.

Az előző bekezdés elsőre bonyolult lehet, de az ARM egy nagyon egyszerű példával állt elő, szemléltetve a probléma súlyosságát és lényegét. Fontos rögtön kiemelni, hogy az egységnyi kiterjedésű szilíciumot szemléltető ábrák alatti számok nem fedik a valóságot, a vállalat úgy látta jónak, hogy a könnyű érthetőség kedvéért leegyszerűsítik a tényleges adatokat. A valóságban a probléma ugyanez, csak eltérő paraméterekkel. Az első oszlopban egy 45 nm-es csíkszélességgel készülő processzormag szerepel, és minden paraméterből egységes adatot kapott. A második oszlop a 22 nm-es eljárás előnyeit ecseteli. Rögtön látható, hogy az eredeti processzormag négyszer ráférne az egységnyi méretű szilíciumterületre, ám az adatokból leolvasható, hogy a tranzisztorok fogyasztása közel változatlan. A harmadik oszlop a 11 nm-t szemlélteti, ahol az eredeti processzormag tizenhatszor beleférne az adott területbe, továbbá a tranzisztorok energiaigénye a 45 nm-en mért érték 60%-a.


(forrás: PC Perspective) [+]

A gyártástechnológia csökkenésének hatása szembeöltő, hiszen több tranzisztort lehet felhasználni a processzormag számára, figyelembe kell azonban venni, hogy a piac igényei a fogyasztás csökkenését tartják szem előtt. Itt rögtön elő is kerül a probléma gyökere. A 45 nm-es csíkszélességet ugyan sikerült megfelezni, de a tranzisztorok energiaigénye nem csökkent, tekintve, hogy a órajel is nőtt. Ez azt jelenti, hogy amíg egységnyi fogyasztással 45 nm-en a processzormag teljes területe aktív lehet, addig 22 nm-en csupán a tranzisztorok 25%-a kapcsolható be szem előtt tartva a meghatározott fogyasztási keretet. A következő 11 nm-es lépcsőnél már csökkent a tranzisztorok energiaigénye, de ez csak arra elég, hogy az eredetileg meghatározott fogyasztási keretből a szilíciumterület 10%-a üzemeljen, természetesen megnövelt órajel mellett. A gyakorlatban mindez azt jelenti, hogy az adott fogyasztási keret jelentősen befolyásolja a jövőbeli chipek teljesítményét, előrevetítve a generációról-generációra történő egyre kisebb teljesítménybeli előrelépést. Tulajdonképpen hasonló okok vetettek véget az egymagos processzorok karrierjének, és indították be a többmagos CPU-k korát. A vezető vállalatok terveit látva ma már kijelenthető, hogy ez a kor nem tartott sokáig, mivel a fogyasztás újra kezelhetetlen méreteket ölt.

Jem Davies a példából kiindulva nem tartja életképesnek a homogén módon programozható chipeket, így más megoldást kell találni. Világosan látszik, hogy a tranzisztorok beépítésére megvan lehetőség, csak ezek mindegyike nem lehet egyszerre aktív. Jó energiamenedzsmenttel kezelhető a helyzet, ugyanakkor a teljesítmény emelése még mindig problémás. Itt jön képbe a heterogén éra, avagy a heterogén módon programozható lapkák fejlesztése. A csíkszélesség csökkenésével beépíthető extra tranzisztorokat, új elvek alapján kell felhasználni, olyan feldolgozók kiépítésére, amelyek a teljesítmény drasztikus növelésére adnak lehetőséget. A központi processzormagoknál ugyan „butábbak” a grafikus magok, de a számítási teljesítményük az energiaigényükhöz képest elképesztően magas, és alapvetően pont erre van szükség.

Az ARM aktívan menetel a felvázolt irányba, így a fejlesztés alatt álló Cortex-A15-ös processzormag és a Mali-T604-es grafikus vezérlő már támogatja az OpenCL 1.1-es felületet, ami lehetővé teszi a rendszerek heterogén módon történő programozását. A licencelhető GPU nyers számítási teljesítménye 68 GFLOPS, továbbá igény esetén négy Mali-T604-es is kiépíthető egy lapkán belül, kvázi megnégyszerezve a teljesítményt. Problémát jelent azonban a magok közötti cache koherencia. Erre az ARM az AMBA 4 rendszer ACE (AXI Coherency Extensions) kiterjesztését dolgozta ki, ami egy olyan interfész és protokoll, mely rendszerszintű cache koherenciát biztosít a lapkán belüli feldolgozók számára.

Az ARM heterogén jövőképe tehát impozáns, de ne feledjük el, hogy az összes gyártó ebbe az irányba tart, így maga az elképzelés messze nem egyedi. A partnerek azonban licencelhetik a szükséges részegységeket a heterogén módon programozható SoC-ok fejlesztéséhez. A mobil vonalon sajnos a szoftveres ökoszisztéma jobban le van maradva, mint a PC-n, de az érintett vállalatok azon dolgoznak, hogy a lehető leghamarabb beépüljön az OpenCL API támogatása az elérhető operációs rendszerekbe.

  • Kapcsolódó cégek:
  • ARM

Azóta történt

Előzmények

Hirdetés