Hirdetés

Az Intel Haswellben debütál az AVX2

Az Intel elérhetővé tette az AVX2 előzetes dokumentációját, mely a Haswell kódnéven fejlesztett processzorarchitektúrában fog debütálni. Az első ilyen lapka megjelenése 2013-ra várható, ám ennél pontosabb dátum még nincs megjelölve, de az Intel eddig megszokott frissítési terve alapján valamikor az első vagy a második negyedévben várható a debütálás.

Az AVX2 felfogható az AVX utasításkészlet kiterjesztésének, így továbbra is a VEX utasításkódolást használja. A mostani processzorokban rengeteg olyan SSE-alapú instrukció van, amelyek a Sandy Bridge 256 bites lebegőpontos feldolgozójának csak a felét használják ki, mivel 128 bites utasításokról van szó. Az AVX2 ezen a ponton javít, és számos utasítást bővít 256 bitesre, továbbá új instrukciók debütálása sem marad el, mint például az új bitmanipulációs és memóriaelérési megoldások.

A fentiek mellett azonban az AVX2 legnagyobb újítása a programozók által régóta kért FMA támogatás. Ennek használatával a kritikus számítások eredményei pontosabbak lehetnek, és nem mellékesen a feldolgozás is gyorsabb a hagyományos összeadás és szorzás művelethez képest. Ezen a ponton az AMD és az Intel nem egy utat jár egyelőre. Az előbbi vállalat a Bulldozer architektúrában az FMA4-et, azaz az utasítás négy operandust kezelő megoldását támogatja, míg az Intel csak az FMA3-at implementálta. A különbség a regiszterek kezelésére van hatással. Az FMA4 az összes operandushoz külön regisztert használhat, míg azt FMA3 esetén az eredményt a három operandushoz használt regiszterek közül az egyikbe kerül. Apró eltérésről van szó, de ez már elég ahhoz, hogy a két utasítás ne legyen kompatibilis egymással. Ez a fejlesztők számára komoly probléma. Az FMA4 a programozás kényelmessége szempontjából sokkal előnyösebb, mivel nem ritka, hogy egy programon belül többször is szükség van ugyanazokra az értékekre, ám az FMA3 esetében ez alapvetően nem lehetséges, hacsak a felülírandó regiszter tartalmát a programozó nem másolja másik regiszterbe, vagy ha nincs már szabad kapacitás, akkor újra be kell olvasni a memóriából vagy a gyorsítótárból, ami jelentősen lassítja a munkavégzést.

Az Intel nem indokolta meg, hogy miért döntöttek az FMA3 mellett, de valószínű, hogy a hardveres implementálás volt az oka, ugyanis az FMA4 támogatását sokkal nehezebb beépíteni. Érdekesség, hogy eredetileg az Intel az FMA4 mellett állt, ám később meggondolták magukat.

Az AMD korábban már jelezte, hogy a kompatibilitás megőrzése érdekében implementálják majd az FMA3 támogatást is, és emellett a programozás kényelmességét szem előtt tartva az FMA4-et sem távolítják el. Az Intel az FMA4 estleges implementálásáról még nem beszélt, de ez a jövőben még változhat, hiszen FMA3 utasítás mellett a code-fusion alkalmazása nem lehetséges.

  • Kapcsolódó cégek:
  • Intel

Azóta történt

Előzmények

Hirdetés