Hirdetés

Ütős processzormaggal és IGP-vel tör csúcsra az ARM

Az ARM már javában tervezi az új generációs, csúcskategóriás fejlesztéseit, beleértve egy új processzormagot, egy új IGP-t, illetve a CoreLink CCI-500-at, amely az integráció elmélyítésének fontos alapja lesz.

A processzormagok szempontjából a Cortex-A72 érkezik, amely a Cortex-A57 leváltója lesz. Az újdonság teljesítménye majdnem kétszerese az elődnek, vagyis igen szép előrelépésnek nézhetünk elébe, de ami még ennél is fontosabb, az az energiahatékonyság. Sajnos teljesen direkt összehasonlítás itt nincs, mivel Cortex-A72 a 16 nm-es FinFET gyártástechnológiákhoz készül, de közvetlenül elmondható, hogy a 28 nm-es eljárással gyártott Cortex-A15-höz képest ugyanannak a feladatnak a futtatása közben akár 75%-kal kevesebb energiával is beéri. Ez nagyrészt tervezésből adódó előny lesz, tehát nem a modernebb gyártástechnológiából sikerült összehozni, bár nyilván ennek is köze volt hozzá.

A Cortex-A72 egyébként 3,5-szer gyorsabb a Cortex-A15-nél, tehát a fenti fogyasztáscsökkenéshez még extrém teljesítménynövelés is párosul. Természetesen a Cortex-A72 a 64 bites ARMv8 architektúrára épül, és továbbra is opció a Big.Little koncepció használata a Cortex-A53-as magok párosításával.

Az ARM a nemrég bemutatott Mali-T800-as termékcsaládot is frissítette egy csúcskategóriás opcióval, ami a Mali-T880-as jelzést viseli. Erről a fejlesztésről az ARM nem árult el sokat, azon kívül, hogy 1,8-szer lesz gyorsabb az ARM Mali-T760-nál. Ugyanakkor megtudtuk, hogy az új fejlesztés az ARM Mali-T860 compute teljesítményre kigyúrt verziója.

Alapvetően a Mali-T880 esetében is a Midgard architektúrára köszön vissza, ami az úgynevezett Tri-Pipe metodikát használja, vagyis a shader feldolgozónként belül a feldolgozás három különböző futószalagra oszlik. Ugyanakkor a 256 bites vektoros feldolgozók száma a Mali-T880 esetében már háromra nő, ami nagyobb teljesítményt kínál. Összehasonlításképpen a Mali-T860 két vektormotort használ. Az ARM emellett még finomhangolta az architektúrát is, így ez a fejlesztés már támogatja a DirectX 11.2-t is, bár ennek a megcélzott piacokon túl nagy jelentősége nincs.

Végül fontos újítás a CoreLink CCI-500-as lapkán belüli összeköttetés bemutatkozása, ami mellé befutott az I/O koherenciáért felelős MMU-500 is. A belső sávszélesség megduplázása mellett a legfontosabb újítás, hogy az elődnek számító CCI-400-hoz képest a CCI-500-ba már bekerült egy snoop filter is, amely nem csak a processzorklasztereken belül, hanem a teljes processzorrészen biztosítja a cache-koherenciát. Szintén lényeges újítás, hogy az ACE (AXI Coherency Extensions) portok száma négyre nőtt, vagyis a CoreLink CCI-500 összesen négy processzorklasztert képes támogatni, így építhetők 16 magos rendszerchipek is (klaszterenként 4 mag).

Az CoreLink MMU-500 bár nem a CoreLink CCI-500 elválaszthatatlan része, de alapvetően leváltja az MMU-400-at. Az újdonság legnagyobb előnye, hogy kompatibilis a HSA platform IOMMU-ra vonatkozó követelményeivel, így elősegíti a mély integráció hardveres megvalósítását az ARM-os rendszerchipekben.

  • Kapcsolódó cégek:
  • ARM

Azóta történt

Előzmények

Hirdetés