今天 NVIDIA 在日本 GTC 大會上宣布了一款 Turing 架構的新卡— Tesla T4,有2560個CUDA核心,集成320個 Tensor Core 核心,FP32浮點性能8.1TFLOPS,INT4浮點性能最高260TFLOPS,更神奇的是這款顯卡只有75W TDP,在規模比 RTX 2070 顯卡還高的情況下 TDP 功耗低得多。

這次發布的 Tesla T4 顯卡主要面向 AI 應用,使用了 PCIe 插槽,被動散熱設計,外觀風格跟 RTX 8000 及 RTX 2080 Ti 顯卡又是另一種風格了,看圖片更有金屬質感。

雖然 Tesla 系列的專業卡跟普通消費者關係不大,不過 Tesla T4 的意義在於它不同於現有的幾款圖靈顯卡,CUDA 核心數為2560個,高於 RTX 2070 顯卡的2304個,低於 RTX 2080 顯卡的2944個,考慮到後兩款顯卡使用的分別是 TU104、TU106 核心,Tesla T4 顯卡很可能是基於完整版 TU106 核心的,集成了320個 Tensor 核心,但沒有提到 RT Core。

性能方面,Tesla T4 的FP32浮點性能8.1 TFLOPS,FP16性能65TFLOPS,INT8、IN4性能分別是130、260TFLOPS。
記憶體方面,Tesla T4 配備了16GB GDDR6,但是官方的給出的帶寬又只有320GB/s,如果是256bit,那麼320GB/s對應的頻率就是10Gbps,頻率明顯比 GDDR6 要低,所以這個卡可能位寬有所降低,或是使用比較低頻率的 GDDR6。
最神奇的是 Tesla T4 TDP 功耗只有75W,在 CUDA 核心數比 RTX 2070 顯卡2304個 CUDA 核心更多的情況下,TDP 功耗低了100W,通常這意味著 GPU 核心頻率大降,但8.1TFLOPS的性能又不太可能比 RTX 2070 低,種種規格數字看來這款計算卡核心有點不太尋常。
來源:http://www.expreview.com/64103.html

這次發布的 Tesla T4 顯卡主要面向 AI 應用,使用了 PCIe 插槽,被動散熱設計,外觀風格跟 RTX 8000 及 RTX 2080 Ti 顯卡又是另一種風格了,看圖片更有金屬質感。

雖然 Tesla 系列的專業卡跟普通消費者關係不大,不過 Tesla T4 的意義在於它不同於現有的幾款圖靈顯卡,CUDA 核心數為2560個,高於 RTX 2070 顯卡的2304個,低於 RTX 2080 顯卡的2944個,考慮到後兩款顯卡使用的分別是 TU104、TU106 核心,Tesla T4 顯卡很可能是基於完整版 TU106 核心的,集成了320個 Tensor 核心,但沒有提到 RT Core。

性能方面,Tesla T4 的FP32浮點性能8.1 TFLOPS,FP16性能65TFLOPS,INT8、IN4性能分別是130、260TFLOPS。
記憶體方面,Tesla T4 配備了16GB GDDR6,但是官方的給出的帶寬又只有320GB/s,如果是256bit,那麼320GB/s對應的頻率就是10Gbps,頻率明顯比 GDDR6 要低,所以這個卡可能位寬有所降低,或是使用比較低頻率的 GDDR6。
最神奇的是 Tesla T4 TDP 功耗只有75W,在 CUDA 核心數比 RTX 2070 顯卡2304個 CUDA 核心更多的情況下,TDP 功耗低了100W,通常這意味著 GPU 核心頻率大降,但8.1TFLOPS的性能又不太可能比 RTX 2070 低,種種規格數字看來這款計算卡核心有點不太尋常。
來源:http://www.expreview.com/64103.html