Tartalmi kivonat
Beadandó házidolgozat: Az Intel Pentium III processzor jellemzői Az Intel Pentium III processzor a jelenleg forgalomban kapható legfejlettebb processzor mely processzor az Intel Pentium P6 processzor architektúráján alapszik. Az első Pentium III processzor sorozat magja Katmai kódnéven jelent meg, melyet 0,25 mikronos gyártási technológiával állítottak elő. A buszsebesség 100Mhz, és az elsődleges gyorsítótár is 32KB. Ebből 16KB az adatoké, és 16KB az utasításoké A másodlagos cache 512KB méretű.1999 október 25-én jelentette be az Intel a Pentium III processzorok újabb generációját, a Coppermine nevű chipeket. Ez az első olyan chip, amelyet már kimondottan a 0,18 mikronos technológiához fejlesztettek, nagy teljesítményű PC-kbe, munkaállomásokba és szerverekbe.Valamennyi ezen a napon bejelentett új chip 0,18 mikronos technológiával készül, és tartalmaz minden korábbi Pentium III-jellemzőtA 0,18 mikronos technológia a 0,25
mikronoshoz képest nagy ugrást jelent. Lehetővé teszi kisebb, gyorsabb, kevesebb energiát igénylő chipek gyártását, vagy sokkal több tranzisztor integrálását egy hasonló méretű chipre. - például P6 magot, SIMD utasításkészletet -, valamint egy új Adavanced Transfer Cache-t (ATC), amely 256 bit széles, teljes sebességű buszon keresztül csatlakozik a CPU maghoz. Az új, nagy teljesítményű integrált L2 gyorsítótár a hasonló sebességű Pentium II chipekhez viszonyítva 25%-kal növelte a processzor teljesítményét. Az Intel először a SECC majd a SECC2 tokozással készítette a Pentium III processzorokat. A SECC2 nem jelent mást, mint hogy csak félig van a lapka beburkolva. Hátul műanyag tok rejti, míg elöl a processzor közvetlen kapcsolatban, lehet a hűtővel.Az Intel a Pentium III processzorok nagyobb teljesítmény érdekében bevezetett egy újfajta tokozást az FCPGA-t. A chip megfordításának egyértelmű előnye a jobb hűtés, mivel
az FC-PGA tokozásban a szilíciumlapka közvetlen kapcsolatban áll a hűtőbordákkal.A Coppermine fejlettebb cache-e egyértelmű fejlődés a Katmai L2 gyorsítótárához képest. A cache a független duális buszrendszer egy része, tehát a bemenő adatok 256 bites sávon haladnak, minden második ciklusban 32 byte megy oda vissza (256/8=32). Az alaplapon lévő cache-el szemben gyorsasága növelhető a mag sebességével együtt. Ez azt jelenti, hogy gyorsabb processzor esetén a chip és a cache közötti kommunikáció is gyorsabb lesz, mivel a cache sebessége független az alaplap sebességétől. Tehát, mivel a belső adatút fizikailag el van választva a külső busztól, az nem fogja vissza teljesítményét, és teljes kapacitáson működhet. Az integrált L2 gyorsítótár késése (latency) negyedére csökkent a Pentium II- höz képest. A következő táblázat az Intel Pentium III processzor típusait és jellemzőit foglalja össze: Jellemzők 1.0B GHz, 866,
800EB,733. 850, 800, 850, 800, 750, 700, 750, 700, 866, 800, 600B, 450, 500 733, 667, 533B MHz 550, 650, 600, 667, 600EB, 650, 600E, 600EB, 600 MHz 550E, 533EB MHz SECC2 tokozat igen 550E MHz igen 500E MHz 533EB MHz nem Nem igen Igen FC-PGA 370 tokozat nem nem igen Igen nem nem 0,18 mikronos tech. igen igen igen Igen nem nem 0,25 mikronos tech. nem nem nem igen igen 133 MHz-es rendszerbusz igen nem nem Igen igen nem 100 MHz-es rendszerbusz nem igen igen Nem nem igen 256 KB L2 atc igen igen igen Igen nem nem 512 L2 különálló nem nem nem Nem igen igen Előrehaladott rendszer- igen igen igen Igen nem nem igen igen igen Igen igen igen 4GB cashelhető memória igen igen igen Igen igen igen SSE igen igen igen Igen igen igen Kettős független igen igen igen Igen igen igen igen igen igen Igen igen igen igen igen igen Igen igen igen bufferelés 64 GB címezhető memória
buszrendszer Dinamikus végrehajtású felépítés MMX techonlógia - ‘E’ az ATC-t és a Rendszerpufferelési tulajdonságot jelzi - ‘B’ a 133 MHz-es rendszerbusz jelenlétét jelzi - ‘EB’ az ‘E’ és a ‘B’ tulajdonságokat együtt jelzi 4.1 A Streaming SIMD Extension (SSE) leírása A P6-os kategóriájú processzorok egyik lényeges újítása a Pentium III processzornál jelent meg, és ez az SSE (Steraming SIMD Extension). Az SSE-nek célja, hogy fokozza a ma már fejlett a 3D grafikus és kommunikációs alkalmazások teljesítményét. Az SSE további 70 új utasítással bővíti az IA-32 utasításkészletét A 70 új utasítás a következő három részre oszlik fel: • 50 lebegőpontos (FPU) utasítás • 12 új multimédiautasítás • 8 új gyorsítótár utasítás A Streaming SIMD Extensions (SSE) az alábbi kategóriákra oszthatók: • SIMD egyszeres pontosságú lebegőpontos utasítás • További SIMD egész utasítás •
Cache vezérlő utasítás • Állapot vezérlő utasítások A SIMD egyszeres pontosságú lebegőpontos utasításokkal az SSE egy új SIMD architektúrát határoz meg a lebegőpontos műveletekhez. Az SSE magában foglal egy új általános-célú lebegőpontos utasításkészletet, amely egy újonnan meghatározott lebegőpontosadat típuson végez műveletet. Az architektúra továbbá egy új regiszter készletet is tartalmaz. A SIMD lebegőpontos utasítások: az aritmetikai, négyzetgyökvonás, közelítés, min/max, adat mozgatás, maszk egész, maszk összehasonlítás és beállítás, logikai, EFLAG-ek összehasonlítása és beállítása és konvertálás.Ezek az utasítások jelentősen növelik a teljesítményét azoknak az alkalmazásoknak, amelyek intenzív lebegőpontos számításokat végeznek.A SIMD egyszeres pontosságú lebegőpontos utasítások négy 32-bites egyszeres pontosságú lebegőpontos-adat elemen működnek.Eltérően a meglévő MMX
regiszterektől, melyek nem új fizikai regiszterek, hanem az FPU regiszterek azon 64 bites része, melyeket az MMX utasítások használnak, a 128-bites regiszterek újak a meglévő IA architektúrához képest. Ezeket a regisztereket csakis adatok számítására használják. Memóriacímzéshez az egész regisztereket és a meglévő Intel Architektúra (IA) címzési módokat használják. 6. Ábra Az XMM regiszterek Az SSE egy új adat-típust határoz meg, amely 4 darab 32-bites egyszeres pontosságú lebegőpontos számot tárol egy 128-bites értékké tömörítve. Minden 32bites egyszeres pontosságú lebegőpontos számnak van egy 1-bites előjele, egy 8bites kitevője, és egy 23-bites mantisszája A kitevő egy egész szám, amely a mantissza 2-es alapú exponense. Az egyszeres pontosságú lebegőpontos számok közelítő tartománya 2-126 - 2127 közötti érték.A mantissza két részből áll: egy 1-bites egész számból és egy bináris törtből. 7. Ábra
Az egyszeres-pontosságú lebegőpontos adattípus Korábban az IA x87 processzorok (FPU-k), lebegőpontos számai 80 bites kibővített pontosságú értékekként voltak belsőleg ábrázolva. A PIII processzorok lebegő pontos számai, 32-bites egyszeres pontosságú értékekként vannak ábrázolva. A SIMD egyszeres pontosságú lebegőpontos utasítások támogatják a skaláris és pakolt műveleteket az egyszeres-pontosságú lebegőpontos adat-típusokon.A pakolt műveletek, egyszerre végeznek műveletet a négy lebegőpontos adat-elemen párhuzamosan. A pakolt műveleteknek utasítás mnemonikja a ps toldalék A 8 ábra egy pakolt műveletvégzést mutat be. Amint látható a pakolt művelet függőlegesen végez műveletet a mind négy adat-elemen az Xmm1- és Xmm2-ben párhuzamosan. Az eredmény természetesen az Xmm1-be lesz beírva. 8. Ábra Pakolt műveletvégzés A skaláris műveletek a két operandus legkisebb helyértékű adat elemén hajtódnak végre. A felső
három adat eleme változatlan A skalár műveletek utasítás mnemonikja az ss toldalék. A 9 ábra egy skaláris műveletvégzést mutat be Ahogy az ábra is mutatja a skaláris művelet csak az a0 és b0-on végez műveletet az Xmm1és Xmm2-ből. Az eredmény itt is természetesen az Xmm1-be íródik A felső három elem változatlan marad. 9. Ábra Skaláris műveletvégzés Mint az MMX technológiájú utasításoknál a kiegészítő SIMD utasítások is: • SIMD műveleteket hajtanak végre Integer adatelemeken 64 bites csomagokban • Betölt és tárol adatokat a 64 bites regiszterekben. A cache vezérlő utasítással az SSE kibővíti a már meglévő utasításkészletet, amely: • Vezérli az adatok cache-elését annak érdekében, hogy minimalizálják a cache szennyeződést (módosított blokkok tárolása a cache-ban) és csökkentsék a memóriába történő írások számát. • Előbetölti az adatot, hogy kihasználja az egybeeséseket a memória
és a feldolgozó párhuzamos egységek között és elrejtse a memória lappangást. Az állapotvezérlő utasítások a PIII processzor új vezérlő/állapot regiszter –bit kiegészítések a meglévő IA processzor állapotokhoz képest. Ezek az új regiszterbitek, processzor és operációs rendszertámogatást igényelnek 4.2 Az MMX és az SSE közötti különbségek Az MMX SIMD utasítások integer adatokon végeznek műveletet, míg az SSE ezt kiegészíti az egyszeres-pontosságú lebegőpontos utasítások egyszeres lebegőpontos adatelemeken való műveletvégzésével. Míg az MMX SIMD utasítások kettő 32-bites integer adaton, addig az SSE egyszeres-pontosságú lebegőpontos utasításai négy 32-bites egyszeres-pontosságú lebegőpontos adat-elemeken végeznek műveletet. Az SSE regiszterei 128 bit hosszúságúak és az egyszerespontosságú lebegőpontos adat-elemeknek (mindegyik 32-bit hosszúságú) vannak fenntartva, Az MMX regiszterek az FPU lebegőpontos
regiszterek egy 64 bites része. Az FPU regiszter 80 bit széles, melyből az MMX regiszter 64 bitet használhat. Egy MMX és egy FPU utasítás együtt nem hajtódhat végre. Az SSE-nél nincs ilyen korlátozás, a különálló regiszterek az SSE –nek lettek meghatározva. Itt az alkalmazások képesek egyszerre végrehajtani SIMD lebegőpontos és integer utasításokat is valamint SSE és lebegőpontos utasításokat is. Készítette: Weisz Attila Földrajz IV.-Informatika II 2002-11-20 forrás: internet