Hirdetés

Újabb adatok érkeztek a Bulldozerről

A Bulldozer architektúra főbb jellemvonásairól az elmúlt év nyarán írtunk, ám az AMD akkor még számos részletet titokban tartott. Az ISSCC alkalmával azonban több információ is napvilágot látott, melyek még többet mutatnak meg a rendszerről. Azt már tudjuk, hogy magok száma a radikálisan újfajta megközelítés miatt nem egyértelmű. Technikailag az érkező lapka négy darab úgynevezett Bulldozer modulból áll, ami nyolc darab dedikált integer magot eredményez, ebből adódóan az AMD nyolcmagos processzorként tekint rá, de más megközelítésből lehet egy nyolc feldolgozási szálat támogató négymagos CPU-nak is nevezni. A lényeg persze nem ez lesz, hanem a termék fogyasztása illetve teljesítménye.

Az új lapka esetében a tervezők magas órajelet elviselő dizájnt alakítottak ki, vagyis a 3 GHz alatt üzemelő megoldások ritkák lesznek. Az előadást vezető Hugh McIntyre szerint 3,5 GHz-es vagy magasabb órajel alkalmazása a terv, amire a Turbo Core 2.0 akár 500 MHz-et is rápakolhat, még akkor is, ha a processzor összes erőforrás ki van használva. A lapka 8 MB-os L3 és modulonként 2 MB-os L2 gyorsítótárat alkalmaz, míg a modulokon belül egy 64 kB-os megosztott utasítás gyorsítótár lesz, az integer magok pedig egyenként 16 kB-os adat gyorsítótárral rendelkeznek. A modulon belül teljesen megosztott az mikrokód ROM, az utasítás behívás illetve a dekódolás is. Az utóbbi egység egy órajel alatt négy instrukciót képes lefordítani, míg az ütemező 40 bejegyzést tárolhat.

Az integer magok négy futószalaggal rendelkeznek, amelyek órajelenként egy utasítás végrehajtására képesek. A modulon belül a magok megosztják az információkat, és a rendszer végrehajtás előtt képesek elemezni a feladatot, vagyis előre el tudja dönteni, hogy a 256 bites lebegőpontos feldolgozót megossza, vagy rendelje hozzá az egyik integer maghoz. Az AMD az utóbbi felállást nevezi AVX módnak, ami lényegében az AVX utasításkészlet támogatását jelenti. Újdonság lesz még az Intel SSSE3, SSE4.1 és SSE4.2, valamint az AES, illetve az AMD FMA4 és XOP támogatása. Sajnos búcsút kell venni a 3DNow! használatától, de az AMD az ígéretéhez híven a sűrűn alkalmazott PREFETCH és PREFETCHW utasításokat megtartotta, vagyis ezek továbbra is élni fognak egy 3DNowPrefetch csoportban. Másik újdonság a PCLMULQDQ utasítás, ami két 64 bites integer operandus átviteltől mentes szorzása.

Az előadáson kiderült, hogy a Bulldozer modul – beleértve a másodlagos gyorsítótárat – 213 millió tranzisztorból épül fel, és 0,8 illetve 1,3 V közötti üzemfeszültségen működhet. A 32 nm-es SHP gyártástechnológiának hála a processzormodul kiterjedése 30,9 mm² lesz. Ebben az értékben csak a modul van benne, tehát a teljes lapkaméretet nem lehet tudni, hiszen kérdéses a 8 MB-os harmadszintű gyorsítótár, valamint a különböző vezérlők kiterjedése. Számításaink szerint a végső lapkaméret nagyjából 310 mm² körül lehet. A modul mérete egyébként nagyjából akkora, mint egy Sandy Bridge-es mag beleértve az L3 gyorsítótár 2 MB-os partícióját. Szintén érdemes megjegyezni, hogy a Llano lapka Husky kódnevű processzormagja az 1 MB-os másodlagos gyorsítótárral 16 mm² lesz. A Bulldozer L3 gyorsítótára egyébként nem a processzor órajelén üzemel, így itt be kell érni 2,4 GHz vagy valamivel magasabb órajellel, a működéshez pedig 1,1 V-ra van szüksége.

Elhangzott némi információ a fogyasztásról, valamint az energiatakarékosságot biztosító funkciókról. A nem aktív Bulldozer modul teljesen lekapcsolható, ami a teljes lapka fogyasztását jelentősen redukálja. Az AMD kimérte a pontos adatokat egy 100°C-os 1 V-on üzemelő modul esetében. A mérés során az elméleti maximális energiaigényt tekintette a vállalat 100%-nak, és ehhez viszonyították az adatokat. A rendszer tipikus terhelés mellett a maximálisra számolt fogyasztás 62-64%-ával is beéri. Itt jöhet képbe majd a Turbo Core 2.0, ami aktívan emelgetheti az órajelet, függetlenül a többi mag kihasználtságától. Készenléti állapotban a fogyasztás az elméleti maximum 37-39%-a lesz, míg a lekapcsolt modul energiaigénye 1%-ra csökken. Az érkező bulldozeres szerverprocesszorok esetében az AMD az aktuális Opteron 6100-as generáció fogyasztási paramétereit fogja alapul venni, vagyis a legerősebb megoldás a 105 wattos ACP osztályba tartozik majd. Az információk szerint a vállalat a CeBIT-en kiállít egy Zambezi lapkára épülő processzort, ami az asztali PC-kbe készül, a megjelenése pedig a Computexen esedékes.

  • Kapcsolódó cégek:
  • AMD

Azóta történt

Előzmények

Hirdetés