AMD představuje GPU Instinct MI200 ‚Aldebaran‘, první 6nm MCM produkt s 58 miliardami tranzistorů, více než 14 000 jádry a 128GB HBM2e pamětí

AMD má oficiálně oznámit Nová generace grafického procesoru MI200 HPC s kódovým označením Aldebaran, který využívá 6nm architekturu CDNA 2 k poskytování šíleného výpočetního výkonu.

AMD představuje Instinct MI200, který pohání výpočetní výkon nové generace s prvním GPU 6nm MCM technologií a více než 95 výkonovými TFLOPs FP32

AMD je první společností, která oficiálně používá technologii MCM, a činí tak s hlavním produktem, Instinct MI200 s kódovým označením Aldebaran. AMD Aldebaran GPU přijde v různých tvarech a velikostech, ale všechny jsou založeny na zcela nové architektuře CDNA 2, která je nejpropracovanější z variant Vega. Některé z klíčových funkcí, než se pustíme do podrobností, jsou uvedeny níže:

AMD uvádí procesory Zen 4 a Zen 4C EPYC nové generace: Genoa s 96 jádry pro rok 2022, Bergamo se 128 jádry

  • AMD CDNA 2. architektura – Druhá generace maticových jader urychluje operace matice FP64 a FP32 a poskytuje až 4krát vyšší teoretický výkon než FP64 oproti předchozí generaci GPU AMD.
  • Vedoucí postavení v obalové technologii První víceblokový GPU v oboru s technologií 2,5D High Fanout Bridge (EFB) poskytuje 1,8x více jader a 2,7x vyšší šířku pásma paměti než předchozí generace AMD GPU a poskytuje nejlepší celkovou teoretickou šířku pásma paměti na trhu s 3,2 terabajty za sekundu.
  • Technologie AMD Infinity Fabric 3. generace – Až 8 Infinity Fabric Links pro připojení AMD Instinct MI200 ke 3rd Gen EPYC CPU a další GPU v uzlu umožňují sjednocenou koherenci CPU/GPU paměti a maximalizují propustnost systému, což umožňuje snadnější škálování CPU kódů pro využití síly akcelerátorů.

Snímek grafického procesoru AMD Instinct MI200:

Uvnitř AMD Instinct MI200 je GPU Aldebaran, který obsahuje dvě matrice, sekundární a primární. Má dvě šablony, z nichž každá obsahuje 8 shader enginů pro celkem 16 SE. Každý engine Shader 16 obsahuje ovladač s plně modifikovaným FP64, krabicovým motorem FP32 a maticovým enginem druhé generace pro operace FP16 a BF16.

READ  Microsoft zveřejňuje prasklé a opravené video Surface Laptop SE

Každý blok jako takový se skládá ze 128 aritmetických jednotek nebo 8192 stream procesorů. To zaokrouhluje celkem 220 výpočetních jednotek nebo 14 080 stream procesorů pro celý čip. GPU Aldebaran je také poháněno novým rozhraním XGMI. Každý čip obsahuje VCN 2.6 engine a hlavní I/O řadič.

postavený na AMD CDNA 2. architekturaAkcelerátory AMD Instinct řady MI200 poskytují špičkový výkon aplikací pro širokou škálu pracovních zátěží HPC. The Akcelerátor AMD Instinct MI250X Poskytuje až 4,9krát lepší výkon než konkurenční akcelerátory HPC s duální přesností (FP64) a překračuje 380 teraflopů maximální teoretické poloviční přesnosti (FP16) pro pracovní zátěže s umělou inteligencí, což umožňuje rušivým metodám urychlit vyhledávání řízené daty.

Pokud jde o výkon, AMD nabízí několik zlepšení v benchmarku v segmentu HPC na řešení NVIDIA A100 s až trojnásobným zvýšením výkonu oproti AMG.

AMD představuje novou generaci procesorů EPYC Milan-X, které jako první obsahují technologii 3D V-Cache s mezipamětí 804 MB

Pokud jde o dynamickou paměť, AMD použilo 8-kanálové rozhraní skládající se z 1024bitových rozhraní pro 8192bitové široké rozhraní sběrnice. Každé rozhraní může podporovat 2GB moduly HBM2e DRAM. To by nám mělo poskytnout až 16 GB kapacity paměti HBM2e na jeden zásobník, a protože je celkem osm zásobníků, celková kapacita bude 128 GB. To je o 48 GB více než u A100, který obsahuje 80 GB paměti HBM2e. Paměť bude nahrávat šílenou rychlostí 3,2 Gbps při plné šířce pásma 3,2 TB/s. To je o 1,2 TB/s větší šířka pásma než u A100 80 GB, který má 2 TB/s.

AMD Instinct MI200 bude pohánět tři superpočítače Tier 1 včetně Exascale v USA hraniční systém; Evropská unie před Exascale systém LUMI; petascal Austrálie Systém Setonix. Konkurence zahrnuje 80 GB A100, který poskytuje 19,5 TFLOPs z FP64, 156 TFLOPs z FP32 a 312 TFLOPs z FP16 výpočetního výkonu. Pravděpodobně však uslyšíme o GPU Hopper MCM od NVIDIA příští rok, takže v roce 2022 dojde k ostré konkurenci mezi těmito dvěma giganty GPU.

READ  Na redditu se objevuje údajný prototyp Google Pixel 7 Pro

Akcelerátory AMD Radeon Instinct 2020

název metronomu AMD Instinct MI300 AMD Instinct MI250X AMD Instinct MI250 AMD Instinct MI100 AMD Radeon Instinct MI60 AMD Radeon Instinct MI50 AMD Radeon Instinct MI25 AMD Radeon Instinct MI8 AMD Radeon Instinct MI6
Architektura GPU Bude oznámeno (CDNA 3) Aldebaran (CDNA 2) Aldebaran (CDNA 2) Arcturus (CDNA 1) Vega 20 Vega 20 Vega 10 Fidži XT Polaris 10
Uzel zpracování GPU pokročilý procesní uzel pokročilý procesní uzel pokročilý procesní uzel 7nm FinFET 7nm FinFET 7nm FinFET 14nm FinFET 28nm 14nm FinFET
GPU zemřít 4 (miliony metrů krychlových)? 2 (miliony metrů krychlových) 2 (miliony metrů krychlových) 1 (homogenní) 1 (homogenní) 1 (homogenní) 1 (homogenní) 1 (homogenní) 1 (homogenní)
jádra GPU 28160? 14 080 14 080? 7680 4096 3840 4096 4096 2304
Rychlost hodin GPU Bude oznámeno 1700 MHz ~1700 MHz ~ 1500 MHz 1800 MHz 1725 MHz 1500 MHz 1000 MHz 1237 MHz
Účet FP16 حساب Bude oznámeno 383 nahoře Bude oznámeno 185 TFLOPs 29,5 TFLOPs 26,5 TFLOPs 24,6 TFLOPs 8,2 TFLOPs 5,7 TFLOPs
účet FP32 Bude oznámeno 95,8 TFLOPs Bude oznámeno 23,1 TFLOPs 14,7 TFLOPs 13,3 TFLOPs 12,3 TFLOPs 8,2 TFLOPs 5,7 TFLOPs
účet FP64 Bude oznámeno 47,9 TFLOPs Bude oznámeno 11,5 TFLOPs 7,4 TFLOPs 6,6 TFLOPs 768 Gyflopů 512 GFLOPs 384 Gyflopů
VRAM Bude oznámeno 128 GB HBM2e 128 GB HBM2e 32 GB HBM2 32 GB HBM2 16 GB HBM2 16 GB HBM2 4 GB HBM1 16 GB GDDR5
paměťové hodiny Bude oznámeno Bude oznámeno Bude oznámeno 1200 MHz 1000 MHz 1000 MHz 945 MHz 500 MHz 1750 MHz
Paměťová sběrnice Bude oznámeno 8192 bit 8192 bit 4096 bitová sběrnice 4096 bitová sběrnice 4096 bitová sběrnice 2048bitový vektor 4096 bitová sběrnice 256bitová sběrnice
Šířka pásma paměti Bude oznámeno ~2 TB/s? ~2 TB/s? 1,23 TB/s 1 terabajt/sec 1 terabajt/sec 484 GB/s 512 GB/s 224 GB/s
tvarový faktor Bude oznámeno Dvojitý slot, plná délka / OAM Dvojitý slot, plná délka / OAM Dvojitý rozparek, po celé délce Dvojitý rozparek, po celé délce Dvojitý rozparek, po celé délce Dvojitý rozparek, po celé délce Dvojitý rozparek, poloviční délka Jeden otvor, po celé délce
chlazení Bude oznámeno pasivní chlazení pasivní chlazení pasivní chlazení pasivní chlazení pasivní chlazení pasivní chlazení pasivní chlazení pasivní chlazení
TDP Bude oznámeno 500 wattů Bude oznámeno 300 wattů 300 wattů 300 wattů 300 wattů 175 W 150 wattů
READ  YGOrganizace | [TCG] Přístup k elektronické bouři

GPU Aldebaran MI200 bude k dispozici ve třech konfiguracích, pouze OAM MI250 a MI250X a dvouslotové PCIe MI210. AMD sdílelo pouze úplné specifikace a výkonová čísla pro GPU řady MI250 HPC. MI250X nabízí 14 080 úplných konfigurací a nabízí 47,9, 95,7 a 383 TFLOP výkonu FP64/FP32/FP16, zatímco MI250 obsahuje 13 312 jader s 45 90,5 362,1 TFLOP výkonu FP64/FP3. Konfigurace paměti zůstává mezi konfiguracemi GPU stejná.

Balíček GPU AMD Instinct MI200:

You May Also Like

About the Author: Danielle Brown

"Přátelský průkopník popkultury. Hodně padá. Sociální média geek. Obecný fanatik do kávy. Televizní nadšenec. Potížista."

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *