新訊

AMD Radeon Instinct MI60/MI50 Accelerators

“Written by Robinson Lo (Fangbing Lo)”

2:50~3:20 AMD Radeon Instinct M160/M150 Accelerators
主講 MI60、MI50之不同與參數對比
MI60 & MI50
AMD 發表 Radeon Instinct MI60與 MI50加速器,為全球首款 7nm製程資料中心 GPU,旨在滿足新一代深度學習、高效能運算、雲端運算以及渲染等應用所需的運算效能需求。研究人員、科學家以及開發者等運用 AMD Radeon Instinct加速器解決各種嚴峻與矚目的挑戰,包括大規模模擬、氣候變遷、計算生物學與疾病預防等


94.jpg

AMD_Radeon_Instinct_1.jpg

MI60 & MI50規格比較

98.jpg

MI60效能

99.jpg

AMD Radeon繪圖技術事業群工程部全球資深副總裁 David Wang表示,傳統 GPU架構限制了 IT管理者有效處理對現代雲端資料中心的工作負載進行龐大資料集的持續演進與分析需求。新款 AMD Radeon Instinct加速器結合世界級效能以及靈活架構,加上強大的軟體平台以及業界最頂尖的 ROCm開放軟體產業體系,不但提供業界需要的關鍵元件,也解決了現今與未來最艱鉅的雲端運算挑戰
MI60之 HBM2 Memory為 32G,而 MI50為 16G

95.jpg

AMD Radeon Instinct MI60與 MI50加速器擁有靈活的混合精度運算功能,搭載高效能運算單元,能夠處理更多工作負載類型,如各種 HPC與深度學習應用。全新 AMD Radeon Instinct MI60與 MI50加速器專為有效處理眾多工作負載類型而設計。其應用範圍涵蓋訓練複雜的神經網路,為資料中心與部門部署提供更高的浮點運算效能、效率以及各種新功能

96.jpg

AMD Radeon Instinct MI60與 MI50加速器提供高速的浮點運算效能以及高達 1 TB/s的超高速 HBM2(第2代高頻寬記憶體),也是首款支援新一代 PCIe 4.0互連技術的GPU,比其他x86 CPU到GPU互連技術快出高達 2倍,並配備AMD Infinity Fabric Link GPU互連技術,讓GPU對GPU的通訊比PCIe Gen 3快出高達 6倍

97.jpg

AMD同時宣佈推出用於加速運算的新版 ROCm 2.0開放軟體平台,支援新款加速器的各項結構功能,包括優化的深度學習作業(DLOPS)以及 AMD Infinity Fabric Link GPU互連技術。專為擴充設計的 ROCm讓客戶在開放環境中部署高效能且環保節能的異質化運算系統
我們看到了開源機器學習技術帶來的助益,也很高興看到AMD的支持。在 ROCm開放軟體平台的幫助下,TensorFlow用戶將能受益於 GPU加速技術以及更強大的開源機器學習產業體系
Radeon Open eCosystem(ROCm) ROCm 2.0開放運算平台將於 2018年底推出,高能效的異構計算系統的開發。除了支持新的Radeon Instinct加速器外,ROCm 2.0還為新的 DLOPS提供了更新的數學庫; 支持 64位 Linux操作系統,包括 CentOS,RHEL和 Ubuntu; 優化現有組件; 並支持最流行的深度學習框架的最新版本,包括 TensorFlow 1.11,PyTorch(Caffe2)等已經通過設備驅動程序,編譯器和支持工具的大量改進進行了更新。低級數學庫以及機器智能庫 MIOpen已經過優化,可以真正讓深度學習應用程序發聲
ROCm是一個支持 GPU的 HPC計算的開放式軟件平台。它是在開發人員的基礎上創建的,以適應未來的技術,包括機器學習和人工智能。作為一個開放平台,ROCm生態系統提供了豐富的現代編程語言基礎,旨在加速高性能,高能效的異構計算系統的開發
我們在 Linux生態系統中啟用了AMD的ROCm GPU,以便在 Linux發行版中輕鬆部署深度學習應用程序。
現在,主線內核支持 amdkfd設備驅動程序,並且該內核由其標準版本的所有主要發行版提供。現在我們還在 linux-next存儲庫中支持基於新 Vega架構的 MI60和 MI50。對於不使用最新內核的發行版,DKMS構建仍然是添加對 MI60和 MI50 GPU的支持的可行選項

146.jpg

AMD_Radeon_Instinct_2.jpg

AMD Radeon Instinct MI60與 MI50加速器的特色:


  • 優化深度學習作業:提供靈活的混合精度 FP16、FP32以及INT4/INT8運算功能,滿足瞬息萬變且不斷演化成長的工作負載需求,包括從訓練複雜的神經網路一直到對這些受訓網路執行的推導。

  • 全球最快雙精度 PCIe 2加速器:AMD Radeon Instinct MI60加速器是全球最快雙精度 PCIe 4.0加速器,提供高達 7.4 TFLOPS的尖峰 FP64效能 ,讓各產業的科學家與研究人員更有效率地處理各種 HPC應用,包括生命科學、能源、金融、汽車、航太、學術、政府機構以及國防等領域。AMD Radeon Instinct MI50提供高達 6.7 TFLOPS的 FP64尖峰效能,針對各種深度學習工作負載帶來一個高效率、高性價比的解決方案,同時能在虛擬桌面基礎架構(VDI)、桌面即服務(DaaS)以及各種雲端環境高度重複使用

  • 高達 6倍的資料傳輸速度:每個 GPU配置 2個Infinity Fabric Links,點對點傳輸頻寬高達 200 GB/s,比 PCIe 3.0快達 6倍,在巢式環形組態下支援 4個 GPU連結(在8 GPU的伺服器內配置 2個巢結構)

  • 超高速 HBM2記憶體:AMD Radeon Instinct MI60和 MI50分別提供 32GB及 16GB的 HBM2錯誤校正碼(ECC)記憶體,兩款 GPU提供全晶片 ECC與可靠、可用、可維護技術(RAS)。RAS可為超大規模HPC部署,提供更精準運算結果的關鍵技術

  • 支援安全虛擬化工作負載:AMD Mx GPU技術是業界唯一硬體式 GPU虛擬化解決方案,採用業界標準 SR-IOV(單根 I/O虛擬化)技術,使駭客難以從硬體層面發動攻擊,為虛擬雲端部署提供安全防護


更新 ROCm開放軟體平台
AMD同時發佈新版 ROCm開放軟體平台,設計旨在加速開發高效能且節省能源的異質化運算系統。除了支援新款 Radeon Instinct加速器,ROCm 2.0版本軟體還針對新 DLOPS更新數學函式庫,支援包括 CentOS、RHEL以及 Ubuntu在內的 64位元 Linux作業系統。ROCm也將現有元件優化,以及支援最新版本的熱門深度學習框架,包括 TensorFlow 1.11、 PyTorch(Caffe2)等。敬請參閱 ROCm 2.0軟體

供應時程
AMD Radeon Instinct MI60加速器預計在 2018年底開始向資料中心客戶出貨,Radeon Instinct MI50則預計在 2019年第1季季末前開始供應。ROCm 2.0開放軟體平台將於2018年底推出
▌延伸閱讀