AMD 推出 Radeon Instinct 加速器, MI25、MI8、MI6

AMD推出Radeon Instinct加速器，全速航向直覺化運算的新時代，不久將向夥伴廠商出貨，強化各種深度學習與異質化高效能運算（HPC）解決方案。

在2016年12月首次對外亮相，全新GPU伺服器加速器系列包含Radeon Instinct™ MI25、Radeon Instinct™ MI8以及Radeon Instinct™ MI6，連同AMD的開源ROCm 1.6軟體平台，除了協助大幅提升效能與效率，更易於深度學習工作負載的執行，並同時加快深度學習的推論與訓練，加速推升機器智慧。

Radeon Instinct的最初三款加速器設計旨在支援廣泛的機器智慧應用：
Radeon Instinct™ MI25加速器採用「Vega」架構，運用14奈米FinFET製程，將成為全球最極致的訓練加速器，支援各種超大規模機器智慧與深度學習資料中心應用。MI25能在被動式散熱的單GPU伺服器介面卡上提供卓越的FP16與FP32效能註1，透過本身64個運算單元（4,096個串流處理器）提供24.6 TFLOPS浮點運算的FP16或12.3 TFLOPS浮點運算的FP32尖峰效能。憑藉16GB的超高頻寬HBM2 ECC GPU記憶體註2以及高達484 GB/s的記憶體頻寬，Radeon Instinct MI25針對超大規模平行處理應用進行優化，讓機器智慧與HPC等級系統工作負載能處理龐大的資料集。

Radeon Instinct™ MI8加速器運用高效能低功耗的「Fiji」GPU架構，這款微型HPC與推論加速器具備8.2 TFLOPS浮點運算的尖峰FP16／FP32效能，板卡的功耗不到175瓦，並搭載4GB的高頻寬記憶體（HBM），採用512位元記憶體介面。MI8適用於機器學習推論以及各種HPC應用領域。

Radeon Instinct™ MI6加速器基於廣受推崇的「Polaris」GPU架構，這款採用被動式散熱設計的推論加速器具備5.7 TFLOPS浮點運算的尖峰FP16／FP32效能，尖峰功耗僅150瓦，並以256位元記憶體介面搭載16 GB的超高速GDDR5 GPU記憶體。MI6是一款多用途加速器，適合用在HPC與機器學習推論，以及邊緣訓練等應用領域。

AMD開源解決方案為Radeon Instinct硬體挹注動能：
ROCm 1.6軟體平台預計於6月29日發布，不僅效能提升且支援MIOpen 1.0函式庫，兼具可擴充以及完全開源的特性，為新類別混合式超大規模與HPC等級系統工作負載提供高彈性且性能強大的異質化運算解決方案。ROCm內含開源的Linux®驅動程式，針對可擴充多重GPU運算進行優化，ROCm軟體平台能提供多種規劃模型、HIP CUDA轉換工具，以及透過異質運算編譯器（HCC）支援GPU加速。
開源MIOpen GPU加速函式庫現已和ROCm平台一起釋出，並支援各種機器智慧框架，包含Caffe、TensorFlow以及Torch。

AMD預計在2017年第3季開始向技術夥伴供應Radeon Instinct產品，讓他們開發各種深度學習與HPC解決方案，其中包括Boxx、Colfax、Exxact公司、技嘉、英業達以及美超微等廠商。

欲進一步了解更多資訊，請參閱 Radeon.com/Instinct 。