AMD 揭露搭載 Zen 4 與 Zen 4c CPU 核心的新一代 EPYC 處理器

AMD（NASDAQ: AMD）舉辦加速資料中心線上新品發表會，推出全新AMD Instinct™ MI200系列加速器，為全球最快的高效能運算（HPC）與人工智慧（AI）工作負載加速器註1，同時預覽採用AMD 3D V-Cache技術的AMD第3代EPYC™處理器。此外，AMD揭露新一代“Zen 4”處理器核心的新資訊，並發表全新“Zen 4c”處理器核心，兩款處理器核心都將替未來的AMD伺服器處理器提供動力，擴展AMD在資料中心的領先產品。

AMD總裁暨執行長蘇姿丰博士表示，我們正處在高效能運算的大時代，帶動各界對更多運算力的需求，藉以運行各種服務與裝置，影響到日常生活的各個層面。AMD領先業界的產品陣容在資料中心市場累積強勁的發展動能，其中包括Meta採用AMD EPYC來運行其基礎架構，以及美國首部exascale等級超級電腦Frontier也將搭載EPYC與AMD Instinct處理器。此外，今天我們發表多款新產品，延續新一代EPYC處理器的動能，同時融入設計、領先優勢以及3D封裝技術等方面的創新，運用5奈米高效能製造技術，進一步擴展AMD在雲端、企業、以及HPC等領域的領先優勢。

Meta採用EPYC CPU

AMD宣布Meta為最新採用AMD EPYC CPU組建資料中心的超大規模雲端企業。AMD與Meta聯手打造開放式雲端級單插槽伺服器，運用第3代EPYC處理器提升效能與功耗效率。更多細節將在本週登場的Open Compute Global Summit大會分享。

先進封裝技術帶動資料中心效能

AMD預覽採用創新3D chiplet封裝技術在資料中心的成果，發表首款運用高效能3D晶粒堆疊技術打造的伺服器CPU。採用 AMD 3D V-Cache的AMD第3代EPYC處理器代號為“Milan-X”，象徵CPU設計與封裝技術跨出創新的一步，在各種技術運算工作負載帶來平均50%的效能提升註2。

採用AMD 3D V-Cache的第3代EPYC提供與第3代EPYC處理器相同的功能與特色，並透過BIOS升級提供立即運行（drop-in）的相容性，發揮簡單採用與效能增強的效益。

Microsoft Azure HPC虛擬機器搭載採用AMD 3D V-Cache的第3代EPYC，今天起提供個人預覽（Private Preview），並在未來數週全面公開上線。如欲瞭解效能與釋出時程的詳細資訊，請參閱此連結。

採用AMD 3D V-Cache的第3代EPYC CPU將於2022年第1季問市。思科、戴爾科技集團、聯想、HPE、美超微（Supermicro）等合作夥伴廠商計劃推出搭載新款處理器的伺服器解決方案。

為加速運算提供Exascale等級效能

AMD推出AMD Instinct MI200系列加速器。採用AMD CDNA™ 2架構打造的MI200系列是全球最先進的加速器註3，為各種HPC工作負載提供高達4.9倍的尖峰效能提升註4，並針對尖端AI訓練提供1.2倍的混合精度尖峰效能提升，協助促成HPC與AI的匯流。

AMD Instinct MI200系列加速器搭載於橡樹嶺國家實驗室的Frontier超級電腦，其HPC與AI功能將協助研究人員與科學家加快科研與探索的腳步。

為尖端效能而生的“Zen 4” 為資料中心挹注動力

AMD揭示代號“Genoa” 與“Bergamo”新一代AMD EPYC處理器的全新細節。

“Genoa”預計預計將成為全球效能最高的通用型運算處理器，擁有多達96個高效能 “Zen 4”核心，基於優化的5奈米製程技術，並將支援DDR5與PCIe® 5等新一代記憶體與I/O技術。此外，“Genoa”將支援CXL，為各種資料中心應用提供各種記憶體擴充功能。“Genoa”將如期在2022年生產問市。

“Bergamo”是一款高核心數CPU，專為雲端原生應用量身打造，擁有128個高效能 “Zen 4c”核心。AMD著手針對雲端原生運算開發優化“Zen 4c”核心，調整核心設計以因應密度的要求，並提升功耗效率，以實現更高的核心數以及每插槽效能。“Bergamo”除了支援與“Genoa”相同的軟體與安全功能，並與“Genoa”維持插槽相容性，目前正按進度預計在2023年上半年出貨。

如欲了解更多產品訊息，請至此連結觀看完整影片。

註1：全球最快資料中心GPU是AMD Instinct™ MI250X。計算是由AMD實驗室於2021年9月15日執行，受測的AMD Instinct™ MI250X (128GB HBM2e OAM 模組) 加速器在1,700 MHz尖峰升頻引擎時脈下測得95.7 TFLOPS峰值理論倍精度(FP64 Matrix)、47.9 TFLOPS 峰值理論倍精度(FP64)、95.7 TFLOPS 峰值理論單精度矩陣 (FP32 Matrix)、47.9 TFLOPS峰值理論單精度(FP32)、383.0 TFLOPS峰值理論半精度(FP16)、以及383.0 TFLOPS 峰值理論Bfloat16格式精準度(BF16)浮點運算效能。計算是由AMD效能實驗室於2020年9月18日執行，受測對象為AMD Instinct™ MI100 (32GB HBM2 PCIe® 介面卡)加速器，1,502 MHz 峰值升壓引擎時脈下測得11.54 TFLOPS 峰值理論倍精度(FP64)、46.1 TFLOPS 峰值理論單精度矩陣(FP32)、23.1 TFLOPS峰值理論單精度(FP32)、184.6 TFLOPS峰值理論半精度(FP16)浮點運算效能。公布結果反映NVidia Ampere A100 (80GB) GPU加速器在升壓引擎時脈1410 MHz下測得19.5 TFLOPS 峰值倍精度tensor核心(FP64 Tensor Core)、9.7 TFLOPS峰值倍精度(FP64)、19.5 TFLOPS 峰值單精度 (FP32)、78 TFLOPS 峰值半精度(FP16)、312 TFLOPS 峰值半精度 (FP16 Tensor Flow)、39 TFLOPS 峰值Bfloat 16 (BF16)、312 TFLOPS 峰值Bfloat16格式精度 (BF16 Tensor Flow)的理論浮點運算效能。TF32資料格式不是IEEE協會的相容規格，這項比較沒有採用。https://www.nvidia.com/content/dam/…ter/nvidia-ampere-architecture-whitepaper.pdf, 第15頁表格1。

註2：MLNX-021R：AMD內部測試，於2021年9月27日執行，受測系統組態:2顆64核第3代EPYC 內嵌AMD 3D V-Cache (Milan-X) 快取，對比2顆64核AMD 3rd Gen EPYC 7763 CPU，採用最高測試跑分的累計平均值: 包括ANSYS® Fluent® 2021.1、ANSYS® CFX® 2021.R2、以及Altair Radioss 2021。實際測試結果可能有所差異。

註3：MI200-31：在2021年10月20日，AMD Instinct™ MI200系列加速器是 “資料中心最先進伺服器專用加速器(GPU)”，定義為唯一一款伺服器專用加速器採用先進6奈米製程並運用在伺服器的產品。AMD運用6奈米技術打造AMD Instinct MI200系列伺服器加速器。NVIDIA採用7奈米打造Nvidia Ampere A100 GPU。NVIDIA Ampere Architecture In-Depth | NVIDIA Developer Blog。

註4：MI200-02: 計算是由AMD效能實驗室於2021年9月15日執行，受測對象為AMD Instinct™ MI250X 加速器 (128GB HBM2e OAM 模組)，以1,700 MHz峰值升壓引擎時脈，測得95.7 TFLOPS峰值倍精度矩陣 (FP64 Matrix)理論浮點運算效能。公開的NVidia Ampere A100 (80GB) GPU 加速器量測數據為19.5 TFLOPS峰值倍精度 (FP64 Tensor Core)理論浮點運算效能。上述結果公布在官網：https://www.nvidia.com/content/dam/…ter/nvidia-ampere-architecture-whitepaper.pdf，文件第15頁表格1。