處理器 「AMD Next Horizon」7nm產品技術創新直擊

本帖由 coolaler2018-11-07 發佈。版面名稱:新品資訊

瀏覽:3,331

By coolaler on 2018-11-07 ,03:48
  1. coolaler

    coolaler www.coolaler.com

    註冊:
    2003-09-17
    文章:
    52,030
    讚:
    320
    「AMD Next Horizon」7nm產品技術創新直擊
    [​IMG]



    「AMD Next Horizon」於 2018年11月6日在 San Francisco的早晨舉行,來自全球的媒體們在 11/5就已經抵達並陸續展開報到
    [​IMG]

    報到處設於 Grand Hyatt San Francisco的 B1樓層
    [​IMG]

    每位媒體代表都要先領取 Badge及會議流程表,當然也有神秘小禮物
    [​IMG]

    這一次 AMD送給媒體的神秘小禮物是來自美國新創公司「Tile」所設計的藍牙追蹤器
    [​IMG]

    這藍牙追蹤器可以透過手機找到所有綁上 tileSport的物品,通過 tileSport Pro能與智慧型手機連接,幫助你尋找任何遺失的物品,比如說鑰匙、錢包、電腦、相機等等
    tileSport PRO Sries包裝盒
    [​IMG]

    包裝盒背面
    [​IMG]

    照慣例 AMD會在開會的前一晚 (11/5)舉辦歡迎晚會,晚會上餐點、香檳、啤酒應有盡有
    [​IMG]

    [​IMG]

    就是要讓您吃飽飽的概念
    [​IMG]

    AMD Chief Marketing Mr. John Taylor並在歡迎晚會上現身致意,為晚會帶來了高潮
    [​IMG]

    11/6早上的 Session
    [​IMG]

    會場舞台巨型螢幕秀著今日的主題「AMD Next Horizon」
    [​IMG]

    在 11/6的 General Session中,首先登場的是 AMD的首席執行長 Dr.Lisa Su蘇姿丰博士
    [​IMG]

    蘇博士首先介紹 EPYC DATACENTER之願景
    [​IMG]

    Cisco的 運算系統總經理 Mr.KAUSTUBH DAS致詞
    [​IMG]



    以及之前發表過的 MI25
    [​IMG]

    和 Radeon Instinct ROCm Open source的成就
    [​IMG]

    Radeon Open eCosystem(ROCm) ROCm 2.0開放運算平台將於 2018年底推出,高能效的異構計算系統的開發。除了支持新的Radeon Instinct加速器外,ROCm 2.0還為新的 DLOPS提供了更新的數學庫; 支持 64位 Linux操作系統,包括 CentOS,RHEL和 Ubuntu; 優化現有組件; 並支持最流行的深度學習框架的最新版本,包括 TensorFlow 1.11,PyTorch(Caffe2)等已經通過設備驅動程序,編譯器和支持工具的大量改進進行了更新。低級數學庫以及機器智能庫 MIOpen已經過優化,可以真正讓深度學習應用程序發聲
    ROCm是一個支持 GPU的 HPC計算的開放式軟件平台。它是在開發人員的基礎上創建的,以適應未來的技術,包括機器學習和人工智能。作為一個開放平台,ROCm生態系統提供了豐富的現代編程語言基礎,旨在加速高性能,高能效的異構計算系統的開發
    我們在 Linux生態系統中啟用了AMD的ROCm GPU,以便在 Linux發行版中輕鬆部署深度學習應用程序。
    現在,主線內核支持 amdkfd設備驅動程序,並且該內核由其標準版本的所有主要發行版提供。現在我們還在 linux-next存儲庫中支持基於新 Vega架構的 MI60和 MI50。對於不使用最新內核的發行版,DKMS構建仍然是添加對 MI60和 MI50 GPU的支持的可行選項
    [​IMG]

    以及 Zen 2的優勢
    [​IMG]

    Zen 2採用的「Chiplet」能將核心的 I/O、DRAM、Infinity Fabric等控制功能獨立出核心晶片,使得 Zen 2 架構可擁有 8顆 7nm CPU Chiplet,以及一顆 14nm 獨立的 I/O晶片,以降低各處理晶片的延遲,提升處理器的運算效能
    [​IMG]

    DELL 資深副總裁 Me.Jim Leftwich致詞


    AMD Partner Testimonial VMWare V P Storage Products.Mr.Lee Caswell致詞


    接著 AMD總裁暨執行長蘇姿丰博士介紹 AWS的 Vice President Matt Garman出場,蘇博士與亞馬遜雲端運算服務(AWS)運算服務副總裁 Matt Garman宣布在 Amazon Elastic Compute Cloud(EC2)上推出 3款基於AMD EPYC處理器的實例(Instance),分別為 M5、R5和 T3。新款採用 EPYC的方案具有領先業界的核心密度和記憶體頻寬,可為通用和記憶體優化工作負載節省 10%的成本


    Dr.Su提到 AMD團隊非常開心能與雲端服務供應商排名第一的 AWS合作,我們也非常高興看到新款 Instance於今日上線,開始服務其客戶
    新款 Instance為 Amazon EC2記憶體優化與通用型方案的衍生版本。採用 AMD核心的 R5與 M5 Instance可透過AWS管理主控台(AWS Management Console)或 AWS命令列介面(AWS Command Line Interface)加以啟用,即日起在美國東部(俄亥俄州與維吉尼亞北部)、美國西部(奧勒岡州)、歐洲(愛爾蘭)以及亞太地區上線,其他地區不久後也會陸續推出
    基於 AMD核心的 T3 Instance將在數週後推出。採用 AMD核心的 R5與 M5 Instance推出 6種規格,配置高達 96個虛擬 CPU,記憶體最高達768GB。採用 AMD核心的 T3 Instance將推出 7種規格,配置高達 8個虛擬 CPU與 32GB記憶體。新款 Instance將推出隨需(On-Demand)、預留(Reserved)以及競標(Spot)等付款模式
    [​IMG]

    Dr.Su在大會上與亞馬遜雲端運算服務(Amazon Web Services;AWS)宣佈在 Amazon Elastic Compute Cloud(EC2)上推出首款基於AMD EPYC處理器的實例(Instance)
    AWS Instance系列中廣受歡迎的方案搭載新款 AMD EPYC處理器,擁有領先業界的核心密度與記憶體頻寬,為通用型與記憶體優化工作負載提供優異的每元效能。AMD EPYC處理器優異的核心密度為 M5與 T3 Instance客戶節省成本,針對網路與應用程式伺服器、企業應用程式後端伺服器、開發與測試環境,透過無縫移植的應用程式為客戶提供低價格的運算、記憶體與網路資源。對於 R5 Instance的客戶,AMD EPYC處理器在記憶體頻寬方面的優勢,極適合執行內存運算、資料探勘以及動態資料處理等作業
    [​IMG]

    AMD全球資深副總裁暨資料中心與嵌入式解決方案事業群總經理 Forrest Norrod表示,AMD EPYC配置於Amazon EC2 Instance上象徵著一項重大里程碑,反映出越來越多雲端服務供應商採用 AMD高效能 CPU
    AMD EPYC處理器的多核心、記憶體頻寬以及 I/O的強大組合,打造一個極具差異化的解決方案,不僅為客戶提供更低的總體擁有成本,也為終端使用者帶來更低的價格。AMD團隊非常開心能與雲端服務供應商翹楚 AWS合作,也非常高興看到新款 Instance上線,開始服務其客戶
    新款 Instance為 Amazon EC2記憶體優化與通用型方案的衍生版本。採用 AMD核心的 R5與 M5 Instance可透過 AWS管理主控台(AWS Management Console)或 AWS命令列介面(AWS Command Line Interface)加以啟用,即日起在美東(俄亥俄州與維吉尼亞北部)、美西(奧勒岡州)、歐洲(愛爾蘭)以及亞太地區上線,其他地區不久後也會陸續推出。基於 AMD核心的 T3 Instance將在數週後推出。採用 AMD核心的 R5與 M5 Instance推出 6種規格,配置高達96個虛擬CPU,高達768GB的記憶體。採用 AMD核心的 T3 Instance將推出7種規格,配置高達 8個虛擬 CPU與 32GB記憶體。新款 Instance將推出隨需(On-Demand)、預留(Reserved)以及競標(Spot)等付款模式
    接著由 AMD CTO & SVR Mark Papermaster出場介紹 7nm新產品 Zen 2
    [​IMG]

    Micro-OP Dispath
    單路 64C/128T的 EPYC 「Rome」頻寬為 256bit,為上一代的兩倍,跟 2Way Intel Xeon 8180M相比有更快之渲染效能
    [​IMG]

    Next Instruction Counter
    [​IMG]

    Zen 2架構能通過減少內存延遲來修復和改進內存控制器,並允許更好地支持更高頻率,更低延遲的內存
    考慮到消費級 PC已經能訪問快速內存,這對於服務器市場也很重要,服務器市場目前依賴於直接來自系統內存的更高頻寬訪問,Zen 2也將在 AVX上大幅提升性能
    [​IMG]

    由於 TSMC 7nm改進的架構設計,頻率速也將獲得巨大的提升,我們還可以透過 XFR 3得到更高的 Max Boost

    TSMC Industry Leading 7nm Process Node


    [​IMG]

    EPYC之核心架構
    [​IMG]

    在伺服器處理器方面 AMD自去年推出 EPYC處理器以來,已經有超過 50家業者採用,包括了微軟、百度等,而最近加入的則是 ORACLE
    AMD執行長蘇姿丰並親自展示了代號為「Rome」的 EPYC處理器,新一代的 EPYC 「Rome」處理器採用全新 Zen 2架構,並為 TSMC台積電代工之 7nm製程,核心數量將倍增到 64C/128T( 64核心 128執行緒),而緊接在後的還有另一款代號 Milan的 EPYC處理器,與 Rome同為都是 7nm,不過將是 Zen 3全新架構
    [​IMG]

    除了 7nm的「 Rome」EPYC 外,接著由 AMD的 Radeon Technology 首席副總裁 David Wang出場介紹新 7nm的 Vega GPU Instinct MI50/60
    [​IMG]

    David針對 Radeon GPU DATACENTER做深入淺出的探討
    [​IMG]

    AMD Radeon Instinct MI60、MI50加速器擁有靈活的混合精度運算功能,搭載高效能運算單元,能夠處理更多工作負載類型,如各種 HPC與深度學習應用。全新AMD Radeon Instinct用 MI60、MI50加速器專為有效處理眾多工作負載類型而設計。其應用範圍涵蓋訓練複雜的神經網路,為資料中心與部門部署提供更高的浮點運算效能、效率以及各種新功能
    [​IMG]

    David Wang並展示全世界第一台 7nm製程之 Radeon Instinct MI60
    [​IMG]



    MI60
    [​IMG]

    [​IMG]

    Radeon Instinct MI60、Radeon Instinct MI50,均為全世界首個 7nm Vega,擁有高性能的 FP64/FP32 PCI-E浮點性能、機器學習訓練和推理、記憶體和擴展性、唯一的硬體虛擬化、點到點的 ECC糾錯保護

    Bridge for 2
    [​IMG]

    Bridge For 4
    [​IMG]

    全世界首個 7nm GPUs的 MI60擁有更高的 Performance
    [​IMG]

    GPU架構介紹
    7nm Vega MI60核心整合了 132億個電晶體管,同等功耗下新核心性能提升超過 25%,而同等頻率下,新核心功耗降低 50%,內建 32GB HBM2記憶體,頻寬 1TB/s TDP 300W
    [​IMG]

    全世界首個 1TB/s 記憶體頻寬實現
    [​IMG]

    接著由 AMD全球資深副總裁暨資料中心與嵌入式解決方案事業群總經理 Forrest Norrod介紹 EPYC過去與未來的優勢
    [​IMG]

    [​IMG]

    [​IMG]

    AMD領先業界的 Zen 2 7nm產品和技術的創新,利用全球首款 7nm高性能 CPU和 GPU推動計算,遊戲和可視化技術的發展,EPYC DATACENTER的重要性及未來發展的規模,提供實現技術下一代所需的功能
    [​IMG]

    132億電晶體數量
    [​IMG]

    當大會進入尾聲,蘇博士再次登場自豪的展示全世界第一顆 7nm Zen 2 DATACENTER 64C/128T Sample
    [​IMG]



    AMD EPYC 「Rome 」有 8顆處理器 Die,1 顆 I/O Die經由 Infinity Fabric 2.0連接,8 顆處理器 Die為 TSMC 7nm製程,中間 I/O Die為 14nm 製程,7nm製程能將密度提升 2 倍,並在同樣性能下讓減半功耗,以提升 1.25 倍的效能
    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    展示完 7nm CPU之後,接著 Dr.Su對 2019-2020之 Road Map做預告
    [​IMG]

    7nm Zen 2 「Rome」2019量產,7nm+ Zen 3 「Milan」正在研發軌道上
    [​IMG]

    Zen 2除了能用在新款伺服器外,也向下相容於現有的 EPYC伺服器產品,而 MI60明年量產,Dr.Su最後與全球資深副總裁暨資料中心與嵌入式解決方案事業群總經理 Forrest Norrod共同介紹 7nm EPYC Performance Demo做 Ending
    [​IMG]

    上午的整個活動圓滿告一段落
    [​IMG]

    除了「AMD Next Horizon」的活動報導,其實 Dr.Lisa Su早先已宣布將在 2019 1月 9日上午 9:00親臨在 Las Vegas Venetian Palazzo舉辦的 *CES 2019中演講,主題是重新定義可視化和計算技術,加速高性能計算的採用,並為新計算技術的各種應用提供視角,從而解決世界上最棘手的挑戰到遊戲,娛樂和虛擬現實的未來,並有可能重新定義現代生活
    畢竟想象力包含了一切,想像力比知識更重要。知識是有限的,但想像力卻包含了一切。——愛因斯坦(Albert Einstein)這一切都在預告在不久的將來我們就會見到 7nm 「NAVI」及7nm Ryzen 3000 Series的到來
    [​IMG]

    遊戲和可視化技術是一個關鍵領域,AMD計劃為有價值遊戲品牌顯卡的遊戲玩家推出全新陣容
    [​IMG]

    “在正在不斷擴大的數字世界中,AMD正在改變計算的未來,並為 350億美元的遊戲產業帶來革命”
    [​IMG]

    Navi將作為 Polaris的繼任者並針對高端市場,並在 2020年之前進展到 7nm +,除此之外,預計 Navi將擁有車載 AI人工智慧,而 7nm+的架構將比 7nm架構更先進,代號為 Arcturus,並且繼續以 Radeon命名,例如Radeon RX 680 或 Radeon RX 780
    Dr.Su的 CES主題演講更多細節將在未來幾週內公佈,有興趣的讀者可參照 CES Keynote

    *CES是全球規模最大,最具影響力的技術盛會,共有4,500家參展商,展出面積達 275萬平方英尺。根據官方統計,2018年的活動吸引了 182,198名與會者,其中包括創紀錄的 63,784名國際與會者。該節目提供了最新的變革技術,如5G連接,人工智能,增強和虛擬現實,智能家居,智能城市,體育和機器智能,以及 2019年的新領域,包括旅遊和彈性

    11/6下午Breakout Sessions介紹
    1:05~1:35 AMD ROCm Open ExoSystem Platform
    AMD CPU & GPU之深度學習運用
    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]


    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    1:40~2:10 AMD EPYC in The Datacenter
    AMD EMPLDYFE Scott Aulor & Saniel Bounds
    單插槽之 「Rome」效能演示
    [​IMG]

    [​IMG]


    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    左邊的機器是 2 way Skylake 運算時間是 30.4s
    中間的機器是 Single Roma 運算時間是 27.6s
    右邊機器是 Naples 28.1s

    在 4K方面的成績
    左邊的機器是 2 way Skylake 運算時間是 30.5s
    中間的機器是 Single Roma 運算時間是 27.7s
    右邊機器是 Naples 運算時間 28.2s也比 2Way Skylake快

    2:15~2:45 Graphic Roundable
    David Wang
    [​IMG]

    David說明了 MI60、MI50之不同處在於 MI60之 HBM Memory為32G,而 MI50為 16G,兩者差異不大,其性能功耗的比較著重於 Graphic、、Gaming、Compute的效能
    [​IMG]

    [​IMG]

    2:50~3:20 AMD Radeon Instinct M160/M150 Accelerators
    主講 MI60、MI50之不同與參數對比
    MI60 & MI50
    [​IMG]

    MI60之 HBM2 Memory為 32G,而 MI50為 16G
    [​IMG]

    [​IMG]

    [​IMG]

    MI60 & MI50規格比較
    [​IMG]

    MI60效能
    [​IMG]

    3:25~3:55 AMD Enterprise Software-Radeon PRO
    Andrej Zdtavkovic Corporate VP Software Development主持
    Tadeon PRO軟體驅動程式的應用、研發、與重要性
    及 Machine Learning & Ray Tracing
    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    [​IMG]

    AMD的光線追蹤 Ray Tracing
    [​IMG]

    [​IMG]

    QA Consultants第三方對AMD及友商的評比
    [​IMG]

    4:00~4:30 Demos
    CPU之深度學習 Demo
    [​IMG]

    MI25、MI60、MI50 Performance Demo
    [​IMG]

    Image Classification
    [​IMG]

    Machine Learning Demo
    [​IMG]


    [​IMG]

    Powering The Cloud
    [​IMG]

    HPE Demo
    [​IMG]

    Server Portfolio
    [​IMG]

    one Socket Server
    [​IMG]

    Dell PowerEdge R4615
    [​IMG]


    [​IMG]

    DATACENTER MODERNIZATION
    [​IMG]

    3Way Server
    [​IMG]

    GIGABYTE H261-Z60
    [​IMG]


    [​IMG]

    高效能浮點運算 Demo
    [​IMG]

    [​IMG]

    安全開機之概念演示
    [​IMG]

    Advanced Secueity
    [​IMG]


    [​IMG]

    Video Axtivity Detection
    [​IMG]


    [​IMG]

    BOXX GX8P
    [​IMG]


    [​IMG]

    AMAX ServMax P47v2
    [​IMG]

    隨文附上 AMD 新聞稿
    今日在舊金山舉行的 AMD Next Horizon活動中,我們與見證了 AMD在資料中心領導地位上的重要里程碑。活動中,AMD高階主管分享了 AMD的高效能運算和繪圖資料中心產品陣容,在規模達290億美元的資料中心市場中日益茁壯
    全球首款 7奈米資料中心 GPU,旨在滿足新一代深度學習、高效能運算、雲端運算以及渲染等應用所需的運算效能需求。研究人員、科學家以及開發者等將能夠運用AMD Radeon Instinct加速器解決各種嚴峻與矚目的挑戰,包括大規模模擬、氣候變遷、計算生物學以及疾病預防等
    AMD Radeon繪圖技術事業群工程部全球資深副總裁David Wang表示,傳統 GPU架構限制了 IT管理者有效解決處理對現代雲端資料中心的工作負載進行龐大資料集的持續演進與分析需求。新款 AMD Radeon Instinct加速器結合世界級效能以及靈活架構,加上強大的軟體平台以及業界最頂尖的 ROCm開放軟體產業體系,不但提供業界需要的關鍵元件,也解決了現今與未來最艱鉅的雲端運算挑戰
    AMD Radeon Instinct MI60與 MI50加速器擁有靈活的混合精度運算功能,其動能來自於能讓這些加速器處理更多工作負載類型的高效能運算單元,如各種HPC與深度學習應用。新款 AMD Radeon Instinct MI60與MI50加速器專為有效處理眾多類型的工作負載而設計。其應用範圍涵蓋訓練複雜的神經網路,及為資料中心與部門部署提供更高的浮點運算效能、效率以及各種新功能
    AMD Radeon Instinct MI60與 MI50加速器提供了超快的浮點運算效能以及高達 1 TB/s的超高速HBM2(第2代高頻寬記憶體),也是第一批支援新一代 PCIe 4.0互連技術的GPU,比其他 x86 CPU到 GPU互連技術快出高達2倍註3,並配備 AMD Infinity Fabric Link GPU互連技術,讓 GPU對 GPU的通訊比 PCIe Gen 3快出高達 6倍
    AMD同時宣佈推出用於加速運算的新版 ROCm開放軟體平台,支援新款加速器的各項結構功能,包括優化的深度學習作業(DLOPS)、以及AMD Infinity Fabric Link GPU互連技術。專為擴充設計的 ROCm讓客戶在開放環境中部署高效能且環保節能的異質化運算系統
    Google TensorFlow工程部總監 Rajat Monga表示,Google相信開放性資源對每位使用者都有好處。其公司看見了開源機器學習技術帶來的助益,也很高興看到 AMD的支持。在 ROCm開放軟體平台的幫助下,TensorFlow用戶將能受益於 GPU加速技術以及更強大的開源機器學習產業體系
    AMD Radeon Instinct MI60與 MI50加速器的特色:
    • 優化深度學習作業:提供靈活的混合精度 FP16、FP32、以及 INT4/INT8運算功能,滿足瞬息萬變且不斷演化成長的工作負載需求,包括從訓練複雜的神經網路一直到對這些受訓網路執行的推導
    • 全球最快雙精度 PCIe 2加速器
    AMD Radeon Instinct MI60加速器是全球最快雙精度PCIe 4.0加速器,提供高達 7.4 TFLOPS的尖峰FP64 效能,讓各產業的科學家與研究人員更有效率地處理各種 HPC應用,其中包括生命科學、能源、金融、汽車、航太、學術、政府機構、以及國防等領域
    AMD Radeon Instinct MI50除了提供高達 6.7 TFLOPS的 FP64尖峰效能,還針對各種深度學習工作負載帶來一個高效率、高性價比的解決方案,而且能在虛擬桌面基礎架構(VDI)、桌面即服務(DaaS)以及各種雲端環境高度重複使用。
    • 高達 6倍的資料傳輸速度:每個GPU配置 2個 Infinity Fabric Links,提供比 PCIe 3.0快達6倍,高達200 GB/s的點對點傳輸頻寬,在巢式環形組態下讓可連結GPU數達到4個(在8 GPU的伺服器內配置2個巢結構)
    • 超高速 HBM2記憶體:AMD Radeon Instinct MI60和 MI50分別提供32GB及16GB的HBM2錯誤校正碼(ECC)記憶體
    兩款 GPU提供全晶片 ECC與可靠、可用、可維護註7技術(RAS)。RAS可為超大規模 HPC部署,提供更精準運算結果的關鍵技術
    • 支援安全虛擬化工作負載:AMD MxGPU技術是業界唯一硬體式 GPU虛擬化解決方案,採用業界標準SR-IOV(單根I/O虛擬化)技術,使駭客難以從硬體層面發動攻擊,為虛擬雲端部署提供安全防護
    更新 ROCm開放軟體平台
    AMD今日同時宣布新版 ROCm開放軟體平台,設計旨在加快開發高效能且節省能源的異質化運算系統。除了支援新款Radeon Instinct加速器,2.0版 ROCm軟體還針對新DLOPS更新數學函式庫,支援包括CentOS、RHEL、以及Ubuntu在內的 64位元 Linux作業系統。ROCm也將現有元件優化,以及支援最新版本的熱門深度學習框架,包括TensorFlow 1.11、 PyTorch(Caffe2)等敬請參閱ROCm 2.0軟體。
    供應時程
    AMD Radeon Instinct MI60加速器預計在 2018年底開始向資料中心客戶出貨,Radeon Instinct™ MI50則預計在 2019年第 1季季末前開始供應
    ROCm 2.0開放軟體平台將於2018年底推出
     
    已獲得 Li777 的點讚。

評論

本帖由 coolaler2018-11-07 發佈。版面名稱:新品資訊

分享此頁面