Az IA-64 első képviselője, az Intel Itanium

Az IA-64 architektúra, és az Itanium fejlesztése már régóta tart, s nagy várakozással tekintünk a következő generációs, 64 bites Intel processzorok elé. A várható megjelenés - kisebb késedelem után - 2000 második félévének elején várható, míg az első teszt példányok, már ez év, 1999 második félévében várhatók. (Ugyanis a processzor tervezési folyamatai során nem rögtön szilícium chipek, hanem logikai modellek készülnek. A szimulátoron futtatott modellen konkrétan lehet tesztelni egy-egy újítást, s csak a végső simítások után tervezik át a szilícium lapkákra.) Az Itanium külső megjelenését tekintve hasonlítani fog a mai Pentium II illetve Pentium III processzorok kártyás (SECC, SECC2) tokozására, természetesen teljesen új csatlakozási felületet (várhatóan SlotM csatlakozót) és chip-készletet fog igényelni. Az új processzor architektúrán kívül teljesen új cache architektúrát alkalmaznak. Az Itanium már három szintű cache hierarchiával fog rendelkezni a Pentium III-hoz képest - mely csak két szintűt alkalmaz -, így az új cache hierarchia jelentősen nagyobb teljesítményt fog nyújtani minden elődjéhez képest. A processzorba integrált 0-s, és 1-es szintű, illetve a processzorral megegyező órajelen működő külső, 2-es szintű cache rendszert alkalmaznak. A 0-s szintű cache a közlemények szerint inkább a regiszterekhez áll közelebb, mint a tradicionális cache-ekhez. Az új cache hierarchián kívül a cache méretét is nagymértékben kívánják növelni, míg a processzor 10 és 15 millió közötti tranzisztort fog tartalmazni, a cache memóriák együttes mérete elérheti az 50 millió tranzisztort is (valószínűleg 2 illetve 4 MB-os L2 cache-sel forgalmazzák).

A processzor 64 bites memóriakezelést alkalmaz, ami több terrabyte (TB) memória megcímzését engedélyezi, így az IA-64 alapú operációs rendszerek a hírek szerint legalább 4 TB memóriát fognak kezelni. A 64 bites memória architektúra mellett 128 bit szélességűre növelték a rendszerbuszt, a zökkenőmentes, széles átvitel elérése végett (A hírek szerint 200 MHz nagyságú lesz a rendszerbusz sebessége,? SlotM csatlakozó.). A processzor a natív IA-64 kód mellett futtatni tudja az IA-32 (pl. 386+ - PIII) kódot, illetve a PA-RISC formátumú tárgykódot (ez utóbbit kisebb átfordítás után). (A kérdés csupán az, hogy az IA-32 bináris kompatibilitás megőrzése mellett, milyen sebességgel futtatja majd régi 32 bites programjainkat!)

A lebegőpontos számításokért felelős FPU-ról sem feledkeztek el, diszkrét különálló számítási egységek alkotják az FPU egészét, s új felépítése, működése réven a Pentium Pro-nál 20-szor nagyobb, s a Tanner-nél (Pentium III XEON) pedig 3-szor nagyobb 3D-s grafikai teljesítményt szolgáltat.
 

Már dolgoznak az Itanium utáni új továbbfejlesztett hardver architektúrán, az IA-64 vonal fejlesztésén is, hiszen "sokat tanulhatunk egy új architektúra első processzorából" mondja az Intel sajtóközlemény. Az Itanium vonalat folyatató hasonló architektúrájú processzorok 2001-ben, már 1 GHz-es alapfrekvenciával jelennek meg, s a "McKinley" kódnevet viselik. Az Itanium és "McKinley" processzorok 0.18 mikronos gyártási technológiával készülnek. Az Itanium fejlesztési eredményeit és a "McKinley" tapasztalatait felhasználva egy olcsóbb, nem csak szerverekbe, illetve munkaállomásokba szánt processzort ad ki az Intel várhatóan 2003-ban, mely "Deerfield" kódnévre hallgat. A McKinley-t továbbfejlesztve a "Medison" követi 2002 felé, mely már a réz alapú technológiát fogja használni - a mostani alumínium helyett - illetve a 0.13 mikronos gyártási technológiával készül hasonlóan a Deerfield-hez.

Egy teljesen új architektúra csak akkor életképes, ha megfelelően támogatott a fejlesztők által. Hogy kik támogatják az új architektúrát? Mindenek előtt a Microsoft igyekezett még 1996 szeptemberében bejelenteni, hogy a Windows NT operációs rendszer támogatja a későbbi IA-64 vonalat, kezdve az Itaniummal (Win64 vonal). A további támogatók között nem kisebb neveket találhatunk, mint a Silicon Graphics, Compaq, Hewlett-Packard, IBM, Oracle, Adobe, hogy csak pár nevet említsünk a teljesség igénye nélkül, pár alkalmazási területről. A Linux is természetesen támogatja az új architektúrát (a VA Linux System fejlesztésével), s külön érdekesség, hogy a Sun Solaris operációs rendszerének is lesz IA-64 fordítása. Az IA-64 szoftver támogatás fejlesztése és gyors kialakítása végett ez év (1999) május 10-én bejelentette az Intel az Intel 64 Alap létrejöttét. Ez egy 250 millió dolláros befektetési alap, melyet az IA-64 alapú szoftverek fejlesztésének támogatására hozott létre az Intel számos más befektetővel együtt (Compaq, Dell, HP, NEC SGI). Ez minden valószínűség szerint a már együttműködő partnereken kívül számos más céget ösztönöz az IA-64-re optimalizált programok fejlesztésére. Így kívánja elérni az Intel, hogy az első IA-64 processzor, az Itanium kiadásakor már meglévő, széles körű terméktámogatás álljon rendelkezésre.

Az Itanium kiadása körül, sok hír látott napvilágot mely újabb késésre hívják fel a figyelmet, sőt a Sun részéről olyan kijelentés is elhangzott, mely szerint az Itanium már egy eleve halott processzor lenne. (Harlan McGhan (Sun), szerint a Itanium fölösleges kitérő, mely mára már kudarcra ítéltetett. Szerinte az x86-os architektúra még az elkövetkező 25 évben is életképes marad.)

Véleményem szerint, akkor lehet egy új processzorról pontosan, hitelt érdemlően nyilatkozni, ha már bejelentették és a rá írt programokkal tesztelték. (A programokban a processzor megjelenését követően nem lesz hiány, és 1-2 év után véleményem szerint minden szükséges program rendelkezésre fog állni.) Ugyanakkor figyelembe kell vennünk, hogy valóban mennyire zárt a nagyteljesítményű platformok piaca elég, ha csak a jelenleg leggyorsabb processzorra az Alpha 21264-re gondolunk. Maga az Itanium által alkalmazott - EPIC - technológia és a teljesen új architektúra valóban jelentős teljesítménynövekedést hozhat, de a kérdés a fordítókon, a támogatottságon, és nem utolsósorban az elméleti technológia processzorban realizált változatán dől el. A konkrét teszteredmények ismerete nélkül én sem alkotok véleményt, hanem várom a megjelenést, illetve az Itaniummal kapcsolatos újítások további bejelentését.

Hol tart az Itanium fejlesztése ?

Az Itanium fejlesztésének 1999. májusi állapota:

A Itanium processzor tervezési, gyártási folyamatai:

  • A funkcionális logikai egységek ellenőrzése megtörtént
    • Egy multiprocesszoros operációs rendszer kernel beboot-olt az Itanium logikai modelljéről
  • A több processzoros rendszerek alapos vizsgálata jelenleg is folyik
    • Gondos logikai vizsgálat elő-szilícium fázisban
    • Az utó-szilícium tesztek nagy része már rendelkezésre áll
  • A fizikai megvalósítás jó úton halad
    • Az időzítések pontos kidolgozása a vége felé tart
    • A fizikai áramkörök tervezése gyors ütemben zajlik
  • A Itaniumhoz csatlakozó szoftverek fejlesztése:
  • A már befejezett szoftver komponensek:
    • A fordító szinte 100%-osan teljesíti a funkcionális tesztet, további optimalizáció
    • Applikációk: a kulcsfontosságú applikációk 64 bites kód ellenőrzése, elő-szilikon fázis
    • Eszközök: 64 bites fordítási eszközök a logikai modellhez készek, elő-szilikon fázis
    • Operációs rendszerek: az együtt működő cégek operációsrendszerei sikeresen boot-oltak a szimulátorról
  • 1999 közepétől a kiadásig (2000 közepe) befejezendő feladatok:
    • Kulcs applikációk: optimalizáció a kész hardveren
    • Eszközök: SDK (Software Development Kit) fejlesztés, optimalizáció a hardveren
    • Operációs rendszerek: Az IA-64 operációs rendszerek továbbfejlesztése hardveren
Mit tartalmaz az Itaniumhoz kínált SDK ?
  • Fordítót, linker-t, könyvtár állományokat, hibakeresőt (debugger), IA-64 operációs rendszer, Itanium szimulátor (lásd az ábrát)
Az Itaniumot használó operációs rendszerek, melyek már boot-oltak az Itanium logikai modelljéről:
  • Win64 (Microsoft Windows NT vonal)
  • SCO UnixWare, Monterey
  • Novell Modesto
  • HP-UX, számos egyéb ISV applikáció fut a modellen, átfordító egységek a WEB-en elérhetőek
  • Solaris (SUN)
  • IRIX
  • Compaq Unix
  • Linux (VA Linux System), teljes támogatás
Itanium chipset

A Itaniumhoz már elkészült az új chipset, illetve az egyéb alaplapi komponensek. A Itaniumhoz az Intel a 82460GX-es chipset-etét ajánlja, mely 4 processzort tud kezelni. A chipset PCI alapú lesz, és a 66 MHz / 64 bites buszt támogatja, de a későbbiekben bővíthető lesz, a 2002-ben debütáló Intel által tervezett új I/O perifériákkal. A chipset egyenlőre 64 GB-ra limitálja a címezhető memóriatartományt, de egyes PC gyártók készíthetnek "több terrabyte-ot" kezelő saját chipset-et. Ez a chipset csak 4 processzort tud kezelni, de más chipset-ekkel 32-től akár 512 processzoros rendszerek kiépítésére is lesz lehetőség. A chipset a PCI busz révén támogatja az újabb PCI Hot Plug szabványt, illetve a grafikai megoldásokat tekintve támogatja az AGP 4x, illetve az új AGP Pro szabványokat. Alaplapi komponensként a BIOS tervezése is fontos kérdés, a firmware tervezésnek teljesen összhangban kell lennie a chipset-tel, így ezt az IBM egyik mérnöke végzi a chipset fejlesztőkkel együtt.

Itanium hír: 1999. október, IDF - Az Intel Itanium mikroarchitektúrájának bemutatása
 

Egyéb 64 bites architektúrák

Sun UltraSPARC II

A Sun már jelentős ideje meghatározó szerepet tölt be a mikroprocesszorok piacán is. SPARC (Scaleable Processor Architecture) elnevezésű architektúrájuk már 1987 óta létezik, s jelenleg a SPARC Version 9 (V9-es) architektúrát alkalmazzák az UltraSPARC I, II illetve a jövőbeli UltraSPARC III - V processzorokban. A V9-es architektúra teljesen kompatibilis V8-as (32 bites) elődjével, és a fő 64 bites címzési illetve egész számítási újításain kívül számos újdonságot alkalmaz, úgy mint a szuperskaláris implementációt, masszív hibatűrő felépítést, módosított, fejlesztett fordítókat, illetve tovább optimalizált operációs rendszereket (pl. a Sun Solaris operációs rendszere). Az UltraSPARC I processzor SPARC elődeihez képest már 9 pipeline állomást használ mely 4 utasítás végrehajtását teszi lehetővé egy órajel alatt. Továbbá javították a cache kezelést, csökkentették a memória lappangást, 16 KByte-os elkülönített chipre integrált adat és kód cachet alkalmaznak, illetve egészen 4 MByte méretig alkalmazható külső cache. Számos grafikai és képfeldolgozást segítő processzor szintű megvalósítást alkalmaztak már az UltraSPARC I processzorban. Az UltraSPARC s-sorozat második tagja az UltraSPARC II processzor mely hasonlóan a V9-es architektúrát alkalmazza a kompatibilitás megőrzése végett. Ezt a processzort már kifejezetten a nagy számítás igényű munkaállomások, illetve szerverek igényeihez mérten fejlesztették. A multiprocesszoros környezetet tekintve közvetlen 4 utas, illetve maximum 64 utas összetett rendszerek építhetőek ki. A VIS (Visual Instruction Set) multimédia kibővítés jelentősen növeli a grafikát intenzíven használó, multimédiás alkalmazások sebességét. A VIS-nek olyan rugalmas és nagy teljesítményt kölcsönző a felépítése, hogy alkalmas akár az MPEG2 valósidejű feldolgozására is, a 2D-s és 3D-s grafikák, illetve videó feldolgozás mellett. Elődjéhez képest tovább fejlesztették az UltraSPARC II cache támogatását, jóval méretezhetőbbé vált a másodszintű cache (L2) nagysága, egészen 256 KB és 16 MB között (Az L1 cache nagysága maradt 2x16 KB.) 5.4 millió tranzisztort tartalmaz, 0.25 mikronos, 5 rétegű gyártási technológiával készítik. 250 - 480 MHz órajel tartományban üzemeltethető, 126 mm2 a processzor mag nagysága és 21 W-ot fogyaszt 400 MHz-en. A sebességet, és a processzort összességében (a fordítóval együtt) jellemző 19.6 SPECint95 illetve 27.1 SPECfp95 értéket mutat 450 MHz-en.

Az UltraSPARC sorozat következő tagja az UltraSPARC III processzor melynek gyártása várhatóan 1999. október vége felé kezdődik el. Az új processzort már a 0.18 mikronos gyártási technológiával készítik, több mint 16 millió tranzisztorból áll és 70 W körüli fogyasztást mutat. Kezdeti 600 MHz-ces órajellel és 8 MB-os cachesel tervezik, így 35+ SPECint95 és 60+ SPECfp95 mutat majd az előzetes becslések szerint. Az eddigi 64 utas rendszerek helyett akár 1000 processzoros rendszerek is kiépíthetőek lesznek.

A Sun már közzé tette fejlesztési útvonalát, az UltraSPARC IV processzorral kívánja átlépni az 1 GHz-es határ, melyet már 2000-re terveznek, az 1.5 GHz-et megcélzó processzorokat - az UltraSPARC V-öt - pedig 2002 elejére tervezik. A GHz-es UltraSPARC processzorokat a Texas Instruments (TI) 0.07 mikronos technológiájával kívánják megvalósítani, mely lehetővé teszi akár 400 millió tranzisztor egy chip-re történő integrálását is.

Alpha 21264 - EV6

Először is a rejtélyes megnevezést szeretném tisztázni: mit jelent a 21264 illetve az EV6? A 21x64 a processzorra jellemző szám, az első két számjegy a '21' a 21. századot jelöli. Az utolsó kettő, a '64' adja meg, hogy az Alpha-nak az EV architektúrájú processzoráról van szó, és a harmadik számjegy pedig a processzor generációját. Az EVx megfeleltetés a tervezésre, az architektúrára jellemző szám, az EV: az Extended VAX rövidítése. (Továbbá megtalálhatóak esetenként még LCA - Low Cost Alpha, PCA - PC Alpha megfeleltetések is.) Az Alpha processzor családot hosszútávra, 25 évre tervezték. Az Alpha 21x64 processzor család alapvetően egy OOO szuperskalár, második generációs RISC (OOO: out of order - nem sorrendi végrehajtású) architektúrát alkalmaz, mely szabad minden jellegű 16, vagy 32 bites kötöttségtől - tisztán 64 bites - ennek köszönhetőek nagy teljesítmény mutatói. Megjelenésétől kezdődően (1992. november - Alpha 21064 - EV4) mindig a legnagyobb teljesítményű processzorok között szerepel, s létezésének 7 éve alatt a legjobb, pontosabban a legnagyobb teljesítményű processzorrá nőtte ki magát elég, ha csak a SPEC95 értékeket tekintjük. 1995-ben jelent meg a második generációs Alpha processzor az Alpha 21164. Ez jelentős teljesítmény növekedést hozott, már négy pipeline-t tartalmaz (kettő egész, kettő lebegőpontos műveletekre), és 7 illetve betöltés és tárolás esetén 9 lépcsős minden egyes pipeline. Ezen generáció közvetlen leszármazottja az Alpha 21164PC processzor, melyet a multimédiát, videó konferenciát, és 3D-s grafikát segítő technológiával vérteztek fel. Ez a Digital MVI (Motion-Video Instructions) technológiája mely lehetővé teszi külön hardware nélkül a valós idejű videó konferenciát és MPEG2 dekódolását. Ez a processzor 583 MHz-en 17 SPECint95 és 21 SPECfp95 értékeket mutat. A második generációs Alpha processzorok után, 1998 jelent meg az Alpha 21264 processzor mely számos újítást vezetett be. Egyik felettébb fontos újítás a feldolgozó rendszer átalakítása volt, már 4 egész (ebből kettő végezhet párhuzamosan memória műveletet) illetve két lebegőpontos feldolgozó rendszert tartalmaz. A feldolgozó egységek számának növelésén kívül a feldolgozás lépcsőit finomították, így kevesebb áramköri kapu kell, ami nagyobb órajel alkalmazását teszi lehetővé. Ebben a processzorban is alkalmazzák az MVI utasításokat, melyek tovább növelik teljesítményét főképp a videó, 3D-s grafika és MPEG2 alkalmazások esetén. További fontos újítás a kód és adat cache méretének növelése 2-szer 64 KB-ra. A processzormagon kívül is fontos újításokat végeztek a L2 cache-t tekintve, támogatja a 200 MHz-es SRAM (3.2 GB/s) modulokat, 166 MHz-es dupla adatszélességű, speciális órajelű SRAM (5+ GB/s) modulokat. Az L1 cache 2x64 bit széles buszt használ (8+ GB/s állandó sávszélesség) az L2 cache 128 bit széleset (3.2 GB/s áll. sávsz.), és a rendszerbusz 64 bit széleset (1.6 GB/s áll. sávsz.). A processzor 15.2 milló tranzisztorból áll, eleinte 0.35 mikronos, majd 0.25 mikronos 6 rétegű CMOS gyártási technológiával gyártják. 314 mm2 a processzormag nagysága (0.35 mikronnál) és 2 illetve 4 MB-os külső cache-sel szállítják. 575 MHz-nél, 4 MB-os L2 cache-sel 30.3 SPECint95 és 47.7 SPECfp95 értéket mutat (míg a Samsung által becsült értékek: 43 SPECint95, és 64 SPECfp95). 1 GHz-nél a processzor akár 100+ SPECint95 és 150+ SPECfp95 becsült értéket is mutat a szakértők szerint.

Az Alpha 21x64 processzor család hamarosan megjelenő új tagja az Alpha 21364 - EV7 processzor mely, valószínűleg ismét feladja a leckét a konkurenciának. Az Alpha 21364 számos újítását bejelentették már 1998 októberében. Az Alpha 21364 jellemzőit tekintve a 21264-es processzormagra épül, integrált L2 cache-t, memória vezérlőt, és ún. hálózati támogatást tartalmaz. Az integrált L2 cache1.5 MB nagyságú, hatutas csoport asszociatív, 16 GB/s teljes írás és olvasási sávszélességet ad, 2x16 KB-os átmeneti cache-eket alkalmaznak az L1 és L2 illetve L2 és a memória közötti forgalom gyorsítására. Az integrált memóriavezérlő már az új Direct RAMbus memória technológiát használja (800 MHz-es busz frekvenciával), 6 GB/s írás és olvasási sávszélességet ad, továbbá a cache koherenciát segítő technológiát is alkalmaz. Az integrált hálózati interfész több processzoros rendszerek esetén a processzorok közötti adatforgalmat hivatott felgyorsítani, létrehozható direkt processzor - processzor összeköttetés, itt 10 GB/s információ csere sebességet definiál (azonos órajel esetén), illetve aszinkron üzemmódban 3 GB/s-ra limitálja az átviteli sebességet. A technikai paramétereket tekintve már a 0.18 mikronos, 6 rétegű CMOS gyártási technológiával készítik, és 350 mm2 nagyságú lesz a processzor mag. 100 millió tranzisztort tartalmaz melyből 8 milliót a logikai rész (maga a csupasz CPU), és 92 milliót a RAM (cache-ek) kialakítására használnak. 1000 MHz-nél 100 W teljesítményt vesz fel, és a becsült teljesítmény mutatók: 70 SPECint95 és 120 SPECfp95 értékek. Tömeggyártása 2000 második félévében, míg az első teszt példányok 1999 negyedik negyedévében várhatóak. Összesítés kép, az integrált memória vezérlő az egy processzoros rendszerek teljesítményét növeli jelentősen, míg az integrált hálózati interfész a több processzoros rendszerek esetén nyújt további teljesítmény növekedést, elősegítve a komplexebb és elődeinél hatékonyabb rendszerek kialakítását. A hosszútávra tekintve már elkészülőben vannak az EV8 tervei is, melyet 2001 után és 0.13 mikronos technológiával kívánnak gyártani.


Az Alpha 21264 processzor blokk diagrammja


Az Alpha 21364 processzor blokk diagrammja

 

64 bites processzorok valóságos, illetve becsült SPEC95 teljesítmény mutatói.

A cikk, a PC World 1999. júliusi számában található meg. A kiadó és cikkíró engedélyével jelentettük meg. Minden jog fenntartva, IDG Magyarország Lapkiadó Kft és ProgHu - Magyar Programozási Oldalak.