在 GTC 2022 前夕就已有許多關於 NVIDIA 新一代 Hopper 架構的資訊被曝光,這或許跟先前被駭有關。
洩露的圖片顯示 NVIDIA GH100 支援最多6個高頻寬記憶體堆棧,仍然為單片結構,不過目前不能確定其具體的規格。或許像傳言的那樣,GH202 才會採用多晶片模組設計(MCM)和 CoWoS 先進封裝。
NVIDIA 將推出多款基於 GH100 的產品,包括用於 DGX 主板的 SXM 外形 H100 計算卡、DGX H100 工作站、DGX H100 SuperPod 以及 PCIe 接口的 H100 計算卡。
GH100 採用台積電 5nm 製程製造,將有 48MB L2 快取,相比 Ampere 架構 GA100 的 40MB 要多一些,也是 AMD Instinct MI250 16MB 的三倍。不過相比 Ada Lovelace 架構的旗艦 AD102 的 96MB 還要少一半。
傳聞 GH100 配置了8組 GPC,每個 GPC 配備了9組 TPC,每個 TPC 裡有兩組 SM,若每組 SM 的 CUDA 核心配比數量是沒有變,這意味著共有144組 SM 和 18432 個 CUDA 核心。而8組 GPC 中僅有1組具有 3D 引擎。雖然 GH100 配置了144組 SM,但應該不會全部啟用,預計可能閹割15%到20%的 SM 單元。
來源
洩露的圖片顯示 NVIDIA GH100 支援最多6個高頻寬記憶體堆棧,仍然為單片結構,不過目前不能確定其具體的規格。或許像傳言的那樣,GH202 才會採用多晶片模組設計(MCM)和 CoWoS 先進封裝。
NVIDIA 將推出多款基於 GH100 的產品,包括用於 DGX 主板的 SXM 外形 H100 計算卡、DGX H100 工作站、DGX H100 SuperPod 以及 PCIe 接口的 H100 計算卡。
GH100 採用台積電 5nm 製程製造,將有 48MB L2 快取,相比 Ampere 架構 GA100 的 40MB 要多一些,也是 AMD Instinct MI250 16MB 的三倍。不過相比 Ada Lovelace 架構的旗艦 AD102 的 96MB 還要少一半。
傳聞 GH100 配置了8組 GPC,每個 GPC 配備了9組 TPC,每個 TPC 裡有兩組 SM,若每組 SM 的 CUDA 核心配比數量是沒有變,這意味著共有144組 SM 和 18432 個 CUDA 核心。而8組 GPC 中僅有1組具有 3D 引擎。雖然 GH100 配置了144組 SM,但應該不會全部啟用,預計可能閹割15%到20%的 SM 單元。
來源