AMD představuje GPU Instinct MI200 'Aldebaran', první 6nm MCM produkt s 58 miliardami tranzistorů, více než 14 000 jádry a 128GB HBM2e pamětí

AMD má oficiálně oznámit Nová generace grafického procesoru MI200 HPC s kódovým označením Aldebaran, který využívá 6nm architekturu CDNA 2 k poskytování šíleného výpočetního výkonu.

AMD představuje Instinct MI200, který pohání výpočetní výkon nové generace s prvním GPU 6nm MCM technologií a více než 95 výkonovými TFLOPs FP32

AMD je první společností, která oficiálně používá technologii MCM, a činí tak s hlavním produktem, Instinct MI200 s kódovým označením Aldebaran. AMD Aldebaran GPU přijde v různých tvarech a velikostech, ale všechny jsou založeny na zcela nové architektuře CDNA 2, která je nejpropracovanější z variant Vega. Některé z klíčových funkcí, než se pustíme do podrobností, jsou uvedeny níže:

AMD uvádí procesory Zen 4 a Zen 4C EPYC nové generace: Genoa s 96 jádry pro rok 2022, Bergamo se 128 jádry

AMD CDNA 2. architektura – Druhá generace maticových jader urychluje operace matice FP64 a FP32 a poskytuje až 4krát vyšší teoretický výkon než FP64 oproti předchozí generaci GPU AMD.
Vedoucí postavení v obalové technologii První víceblokový GPU v oboru s technologií 2,5D High Fanout Bridge (EFB) poskytuje 1,8x více jader a 2,7x vyšší šířku pásma paměti než předchozí generace AMD GPU a poskytuje nejlepší celkovou teoretickou šířku pásma paměti na trhu s 3,2 terabajty za sekundu.
Technologie AMD Infinity Fabric 3. generace – Až 8 Infinity Fabric Links pro připojení AMD Instinct MI200 ke 3rdGen EPYC CPU a další GPU v uzlu umožňují sjednocenou koherenci CPU/GPU paměti a maximalizují propustnost systému, což umožňuje snadnější škálování CPU kódů pro využití síly akcelerátorů.

Snímek grafického procesoru AMD Instinct MI200:

Uvnitř AMD Instinct MI200 je GPU Aldebaran, který obsahuje dvě matrice, sekundární a primární. Má dvě šablony, z nichž každá obsahuje 8 shader enginů pro celkem 16 SE. Každý engine Shader 16 obsahuje ovladač s plně modifikovaným FP64, krabicovým motorem FP32 a maticovým enginem druhé generace pro operace FP16 a BF16.

READ Microsoft zveřejňuje prasklé a opravené video Surface Laptop SE

Každý blok jako takový se skládá ze 128 aritmetických jednotek nebo 8192 stream procesorů. To zaokrouhluje celkem 220 výpočetních jednotek nebo 14 080 stream procesorů pro celý čip. GPU Aldebaran je také poháněno novým rozhraním XGMI. Každý čip obsahuje VCN 2.6 engine a hlavní I/O řadič.

postavený na AMD CDNA 2. architekturaAkcelerátory AMD Instinct řady MI200 poskytují špičkový výkon aplikací pro širokou škálu pracovních zátěží HPC. The Akcelerátor AMD Instinct MI250X Poskytuje až 4,9krát lepší výkon než konkurenční akcelerátory HPC s duální přesností (FP64) a překračuje 380 teraflopů maximální teoretické poloviční přesnosti (FP16) pro pracovní zátěže s umělou inteligencí, což umožňuje rušivým metodám urychlit vyhledávání řízené daty.

Pokud jde o výkon, AMD nabízí několik zlepšení v benchmarku v segmentu HPC na řešení NVIDIA A100 s až trojnásobným zvýšením výkonu oproti AMG.

AMD představuje novou generaci procesorů EPYC Milan-X, které jako první obsahují technologii 3D V-Cache s mezipamětí 804 MB

Pokud jde o dynamickou paměť, AMD použilo 8-kanálové rozhraní skládající se z 1024bitových rozhraní pro 8192bitové široké rozhraní sběrnice. Každé rozhraní může podporovat 2GB moduly HBM2e DRAM. To by nám mělo poskytnout až 16 GB kapacity paměti HBM2e na jeden zásobník, a protože je celkem osm zásobníků, celková kapacita bude 128 GB. To je o 48 GB více než u A100, který obsahuje 80 GB paměti HBM2e. Paměť bude nahrávat šílenou rychlostí 3,2 Gbps při plné šířce pásma 3,2 TB/s. To je o 1,2 TB/s větší šířka pásma než u A100 80 GB, který má 2 TB/s.

AMD Instinct MI200 bude pohánět tři superpočítače Tier 1 včetně Exascale v USA hraniční systém; Evropská unie před Exascale systém LUMI; petascal Austrálie Systém Setonix. Konkurence zahrnuje 80 GB A100, který poskytuje 19,5 TFLOPs z FP64, 156 TFLOPs z FP32 a 312 TFLOPs z FP16 výpočetního výkonu. Pravděpodobně však uslyšíme o GPU Hopper MCM od NVIDIA příští rok, takže v roce 2022 dojde k ostré konkurenci mezi těmito dvěma giganty GPU.

READ Na redditu se objevuje údajný prototyp Google Pixel 7 Pro

Akcelerátory AMD Radeon Instinct 2020

název metronomu	AMD Instinct MI300	AMD Instinct MI250X	AMD Instinct MI250	AMD Instinct MI100	AMD Radeon Instinct MI60	AMD Radeon Instinct MI50	AMD Radeon Instinct MI25	AMD Radeon Instinct MI8	AMD Radeon Instinct MI6
Architektura GPU	Bude oznámeno (CDNA 3)	Aldebaran (CDNA 2)	Aldebaran (CDNA 2)	Arcturus (CDNA 1)	Vega 20	Vega 20	Vega 10	Fidži XT	Polaris 10
Uzel zpracování GPU	pokročilý procesní uzel	pokročilý procesní uzel	pokročilý procesní uzel	7nm FinFET	7nm FinFET	7nm FinFET	14nm FinFET	28nm	14nm FinFET
GPU zemřít	4 (miliony metrů krychlových)?	2 (miliony metrů krychlových)	2 (miliony metrů krychlových)	1 (homogenní)	1 (homogenní)	1 (homogenní)	1 (homogenní)	1 (homogenní)	1 (homogenní)
jádra GPU	28160?	14 080	14 080?	7680	4096	3840	4096	4096	2304
Rychlost hodin GPU	Bude oznámeno	1700 MHz	~1700 MHz	~ 1500 MHz	1800 MHz	1725 MHz	1500 MHz	1000 MHz	1237 MHz
Účet FP16 حساب	Bude oznámeno	383 nahoře	Bude oznámeno	185 TFLOPs	29,5 TFLOPs	26,5 TFLOPs	24,6 TFLOPs	8,2 TFLOPs	5,7 TFLOPs
účet FP32	Bude oznámeno	95,8 TFLOPs	Bude oznámeno	23,1 TFLOPs	14,7 TFLOPs	13,3 TFLOPs	12,3 TFLOPs	8,2 TFLOPs	5,7 TFLOPs
účet FP64	Bude oznámeno	47,9 TFLOPs	Bude oznámeno	11,5 TFLOPs	7,4 TFLOPs	6,6 TFLOPs	768 Gyflopů	512 GFLOPs	384 Gyflopů
VRAM	Bude oznámeno	128 GB HBM2e	128 GB HBM2e	32 GB HBM2	32 GB HBM2	16 GB HBM2	16 GB HBM2	4 GB HBM1	16 GB GDDR5
paměťové hodiny	Bude oznámeno	Bude oznámeno	Bude oznámeno	1200 MHz	1000 MHz	1000 MHz	945 MHz	500 MHz	1750 MHz
Paměťová sběrnice	Bude oznámeno	8192 bit	8192 bit	4096 bitová sběrnice	4096 bitová sběrnice	4096 bitová sběrnice	2048bitový vektor	4096 bitová sběrnice	256bitová sběrnice
Šířka pásma paměti	Bude oznámeno	~2 TB/s?	~2 TB/s?	1,23 TB/s	1 terabajt/sec	1 terabajt/sec	484 GB/s	512 GB/s	224 GB/s
tvarový faktor	Bude oznámeno	Dvojitý slot, plná délka / OAM	Dvojitý slot, plná délka / OAM	Dvojitý rozparek, po celé délce	Dvojitý rozparek, po celé délce	Dvojitý rozparek, po celé délce	Dvojitý rozparek, po celé délce	Dvojitý rozparek, poloviční délka	Jeden otvor, po celé délce
chlazení	Bude oznámeno	pasivní chlazení	pasivní chlazení	pasivní chlazení	pasivní chlazení	pasivní chlazení	pasivní chlazení	pasivní chlazení	pasivní chlazení
TDP	Bude oznámeno	500 wattů	Bude oznámeno	300 wattů	300 wattů	300 wattů	300 wattů	175 W	150 wattů

READ YGOrganizace | [TCG] Přístup k elektronické bouři

GPU Aldebaran MI200 bude k dispozici ve třech konfiguracích, pouze OAM MI250 a MI250X a dvouslotové PCIe MI210. AMD sdílelo pouze úplné specifikace a výkonová čísla pro GPU řady MI250 HPC. MI250X nabízí 14 080 úplných konfigurací a nabízí 47,9, 95,7 a 383 TFLOP výkonu FP64/FP32/FP16, zatímco MI250 obsahuje 13 312 jader s 45 90,5 362,1 TFLOP výkonu FP64/FP3. Konfigurace paměti zůstává mezi konfiguracemi GPU stejná.

Balíček GPU AMD Instinct MI200: