顯示卡 NVIDIA 發布 Pascal 旗艦 Tesla P100 顯卡

soothepain

full loading
已加入
9/17/03
訊息
20,735
互動分數
1,915
點數
113
網站
www.coolaler.com
NVIDIA 在 GTC 大會上正式發布了 Pascal 顯卡的旗艦 Tesla P100,
雖然今年1月份的CES展會上 NVIDIA 發布的 Drive PX2 自動駕駛平台使用的也是 Pascal 顯卡,
但當時的發布只是象徵性,現在才是首次曝光 GP100 顯卡,擁有3584個CUDA核心,153億個晶體管,
16GB HBM2記憶體,核心頻率高達1328MHz,浮點性能10.6TFLOPS。

nvidia_tesla_p100_1.jpg


Pascal 顯卡有些規格與爆料相符,不過很多內容也是出乎意外的,
可以確定的內容是16nm FinFET、16GB HBM 2 、4096bit頻寬以及支援NVLink總線等,
不過 GP100 的CUDA核心數比之前曝光的要少很多,只有3584個,
比目前 GM200 核心的3072個沒高出多少,不過 GP100 的雙精度CUDA單元暴增,而且核心時脈高,
基本時脈就有1328MHz,Boost為1480MHz,比很多Maxwell顯卡的超頻頻率都要高。

nvidia_tesla_p100_2.jpg



GP100核心規格
nvidia_tesla_p100_3.jpg


GP100 核心主要是為高效能計算而生的,雖然3584個CUDA核心相比目前 GM200 的3072個提升不多,
但在FP64雙精度單元上,GP100 核心總計擁有1792個CUDA核心,相當於FP32單精度的1/2,
相比之下 GM200 只有96個,所以其FP64雙精度性能高達5.3TFOPS,
而 GM200 核心只有0.213TFLOPS,GK110 核心也只有1.68TFLOPS,絕對是碾壓之姿。

GP100 第二點變化是升級了記憶體架構,從之前的GDDR5變成了HBM 2,
從圖片上看也是堆棧了4顆HBM 2,等效頻寬4096bit,不過時脈1.4Gbps而非HBM 2應有的2Gbps,
因此帶寬只有720GB/s,並沒有達到之前所說的TB/s級別,
只不過720GB/s的帶寬已經遠遠超過了之前 GM200 / GK110 核心的240-288GB/s帶寬了。

GP100 核心更讓人驚訝的地方是核心頻率,Pascal 使用了更先進的16nm FinFET(之前說高效能的16nm Plus),
新製程帶來的好處不僅是功耗和發熱降低,核心時脈也大幅提升了,
之前 GK100 / GM200 這樣的大核心 GPU 頻率通常在1GHz內,
甚至為了控制功耗還會降低到500-700MHz左右,但 GP100 基礎時脈就有1328MHz,Boost 1480MHz。


GP100核心架構
核心架構方面,GP100核心總計使用了56組SM單元,28組TPC單元,
依然是每組SM單元64個CUDA核心,因此總計3584個CUDA核心,
但不同以往的是這次的雙精度單元回來了,每組SM單元中還有32個FP64雙精度單元。

GP100核心的SM單元架構
nvidia_tesla_p100_4.png



除了CUDA單元數量增加,GP100為了適應高性能計算還大幅增加了快取及寄存器大小,
L2從GM200的3072KB增加到了4096KB,每組SM單元的寄存器文件大小還是256KB,
但總數從6144KB增加到了14336KB。

GP100核心架構示意圖
nvidia_tesla_p100_5.png



GP100 還有一個重要技術就是NVLink總線,其帶寬遠高於PCI-E總線,不過這個更偏向HPC領域,
對消費級市場影響最大的可能就是在NVLink總線支援下,8-Way SLI 顯卡互聯也是可能的。

以上是 GP100 核心的一些簡要資訊,GP100 顯卡主要面向專業領域,
對應的消費級產品應該是 GTX Titan X 的接任,但目前還沒有什麼消息,即便有這價格也可想而知的驚人。
至於主流市場的 GP104 核心則要等到今年6月的電腦展。

nvidia_tesla_p100_6.jpg


nvidia_tesla_p100_7.jpg


nvidia_tesla_p100_8.jpg






來源:http://www.expreview.com/46481.html
 

firezen42

一般般會員
已加入
4/5/14
訊息
74
互動分數
0
點數
6
希望快點有TITAN X的接班人出現,急不可待了 ;nq;
 

mingting

榮譽會員
已加入
1/31/12
訊息
2,519
互動分數
58
點數
48
GP100 基礎時脈就有1328MHz,Boost 1480MHz...
這也太驚人了...:eek:
 

dogkoon

進階會員
已加入
10/25/03
訊息
1,580
互動分數
21
點數
38
這種架構讓我想起卡式的Pentium II跟初代的AMD Athlon
 

cisco2012

榮譽會員
已加入
7/20/10
訊息
1,009
互動分數
14
點數
38
NVIDIA 的 DGX-1 是專為深度學習應用打造的超級電腦
 

fatesky2007

一般般會員
已加入
9/10/15
訊息
91
互動分數
2
點數
8
我想這是現在市場需要的科技衝擊

研發與進步的腳步越來越緩慢,讓人慢慢感覺沒有再進步了

畢竟當技術高達一定的程度以後,人們會發現每前進一步都舉步維艱,以Intel的進步幅度最為明顯

顯示卡工藝卡在28nm太久了,這次的提升所帶來的衝擊很明顯是市場需要的

雖然也可以視為理所當然的,但製程進步所帶來的效能提升,還是我們消費者所樂見的

以上一些對於數據的推估應該都是帕斯卡架構所能做到的,但NV不會一次性地釋出

畢竟我認為可能16nm也要戰個三個世代吧,NV不可能只賺這帕斯卡一代,還要幫未來鋪路

現在我總感覺科技廠賣的不是技術,而是占卜未來,或者說是分析未來趨勢

這種大前提,這種保守,我想也是所有科技產業未來最艱難的經營問題

至於16nm的帕斯卡目前釋放出的誠意,總結的看起來應該是夠的

讓NV藏個幾手,這樣帕斯卡以後的架構才不會讓消費者改覺到升級無感

不過面對1920*1080解析度的這個部分,顯示卡應該已經開始效能過剩了

看來遊戲廠商又要開發出更吃運算效能的遊戲特效了
 

金大帥

不是會員
已加入
1/29/16
訊息
1,092
互動分數
29
點數
48
娘子~快跟牛魔王出來看上帝....
光基頻就打趴目前9成的卡了....神啊~~~~~~
不過8WAY SLI是要幹麻?有板子用嗎?外接來連?有事?
它的PCB板是不是有比現在的厚一點?(我不是把強化背板也看入喔)
期待測試結果,5W一張卡的時代....
 
最後編輯:
▌延伸閱讀