AMD R9 390X、R9 390即將發佈,最為受到關注的就是所使用的HBM堆棧式記憶體(High Bandwidth Memory)。
最近AMD官方給出了詳細介紹,包括使用的原因以及技術特點。
正所謂師出有名,AMD首先解答了為什麼要採用新的記憶體技術。
目前主流顯卡所採用的記憶體都是GDDR5,
但AMD認為GDDR5很快就會遇到阻礙GPU性能提升的“拐點”,
這種記憶體晶片的尺寸已經無法再縮小,
更強的GPU也需要更大容量、更高帶寬的記憶體,這時候就需要“堆料”。
以R9 290X為例,GPU核心周圍總共有16顆GDDR5晶片,
再加上VRM電壓調節模塊相應也要增大規模,佔據了大量空間,
此外功耗也在上升,帶來的性能提升幅度也逐漸下滑,
說GDDR5記憶體目前正在進入功耗/性能曲線的低效區域也不為過。
AMD表示他們早在7年前就已經預料到這種狀況,並且開始研發解決方案。
在歷史上,晶片廠商會選擇更先進的晶片製程或者在晶片中集成功能來解決這個問題。
目前有3個解決問題的思路,一個是SoC晶片集成,一個是外部接口,還有一個是中介層。
其中外部接口就是當前的形式,繼續提升GDDR5速度的效果已經不甚理想了。
SoC也並非理想的途徑,因為受到尺寸和成本的限制,
但考慮到性能、功耗、尺寸等因素上的需求,最終選擇了折中的辦法——中介層。
AMD攜手ASE、Amkor和UMC聯合研發了首個可大批量生產的中介層解決方案,
也就是即將發布的R9 390X/R9 390所採用的HBM記憶體的存在形式。
這種方案靈活度也挺大的,一方面可以讓記憶體盡可能地接近邏輯核心,
以獲得極大的總線位寬和效率、簡化通信和時脈,還允許集成不同的技術,
未來的新記憶體技術也能集成到中介層上。
接下來再講一下為此而打造的HBM記憶體。
HBM是一種超低功耗內存晶片,具有超寬總線位寬,首個完整規範以及原型由AMD聯手SK Hynix定制和研發。
這種顯存由若干層高帶寬內存Die垂直堆棧,
各Die與最底層的邏輯Die均通過TSV穿透矽通孔和μbumps微凸點技術直接互連
(沒錯,每一層都通過若干個通道直通邏輯Die,而不與其他Die通信)
再通過同樣的技術,經中介層與GPU通信。未來HBM推廣到CPU或者SoC芯片上,也是同樣的結構。
GDDR5雖然頻率普遍已經達到了1750MHz(實際7000MHz以上),
每個封裝位寬為32-bit,帶寬為28GB/s,每瓦帶寬實測10.66GB/s。
而第一代HBM頻率最高只有500MHz(實際工作頻率1000MHz),
但是每個封裝的總線位寬高達1024-bit,帶寬超過100GB/s,
電壓低至1.3V,每瓦帶寬超過35GB/s,實測功耗降低50%以上。
再考慮到空間佔用問題,1GB GDDR5需要4顆晶片,
而HBM只要一顆7mm×5mm的小晶片,單位容量表面積減少94%,
而且因為HBM是和邏輯核心集成在同一塊基板上,可以節省更多的空間。
雖然PPT上說的只是邏輯核心+記憶體佔據的PCB面積,
並非整張顯卡PCB的面積,不過可以預見最終顯卡也可以做得很短。
簡單總結一下,採用中介層技術的第一代HBM記憶體,
最重要的是它擁有遠超DDR4、GDDR5或者LPDDR4的高帶寬和性能,
能耗比也高很多,此外由於單位容量表面積縮小94%、加上邏輯核心縮小50%以上,
採用這種記憶體的旗艦顯卡也可以做成“網卡”了。
來源:http://www.expreview.com/40618.html
最近AMD官方給出了詳細介紹,包括使用的原因以及技術特點。
正所謂師出有名,AMD首先解答了為什麼要採用新的記憶體技術。
目前主流顯卡所採用的記憶體都是GDDR5,
但AMD認為GDDR5很快就會遇到阻礙GPU性能提升的“拐點”,
這種記憶體晶片的尺寸已經無法再縮小,
更強的GPU也需要更大容量、更高帶寬的記憶體,這時候就需要“堆料”。
以R9 290X為例,GPU核心周圍總共有16顆GDDR5晶片,
再加上VRM電壓調節模塊相應也要增大規模,佔據了大量空間,
此外功耗也在上升,帶來的性能提升幅度也逐漸下滑,
說GDDR5記憶體目前正在進入功耗/性能曲線的低效區域也不為過。
AMD表示他們早在7年前就已經預料到這種狀況,並且開始研發解決方案。
在歷史上,晶片廠商會選擇更先進的晶片製程或者在晶片中集成功能來解決這個問題。
目前有3個解決問題的思路,一個是SoC晶片集成,一個是外部接口,還有一個是中介層。
其中外部接口就是當前的形式,繼續提升GDDR5速度的效果已經不甚理想了。
SoC也並非理想的途徑,因為受到尺寸和成本的限制,
但考慮到性能、功耗、尺寸等因素上的需求,最終選擇了折中的辦法——中介層。
AMD攜手ASE、Amkor和UMC聯合研發了首個可大批量生產的中介層解決方案,
也就是即將發布的R9 390X/R9 390所採用的HBM記憶體的存在形式。
這種方案靈活度也挺大的,一方面可以讓記憶體盡可能地接近邏輯核心,
以獲得極大的總線位寬和效率、簡化通信和時脈,還允許集成不同的技術,
未來的新記憶體技術也能集成到中介層上。
接下來再講一下為此而打造的HBM記憶體。
HBM是一種超低功耗內存晶片,具有超寬總線位寬,首個完整規範以及原型由AMD聯手SK Hynix定制和研發。
這種顯存由若干層高帶寬內存Die垂直堆棧,
各Die與最底層的邏輯Die均通過TSV穿透矽通孔和μbumps微凸點技術直接互連
(沒錯,每一層都通過若干個通道直通邏輯Die,而不與其他Die通信)
再通過同樣的技術,經中介層與GPU通信。未來HBM推廣到CPU或者SoC芯片上,也是同樣的結構。
GDDR5雖然頻率普遍已經達到了1750MHz(實際7000MHz以上),
每個封裝位寬為32-bit,帶寬為28GB/s,每瓦帶寬實測10.66GB/s。
而第一代HBM頻率最高只有500MHz(實際工作頻率1000MHz),
但是每個封裝的總線位寬高達1024-bit,帶寬超過100GB/s,
電壓低至1.3V,每瓦帶寬超過35GB/s,實測功耗降低50%以上。
再考慮到空間佔用問題,1GB GDDR5需要4顆晶片,
而HBM只要一顆7mm×5mm的小晶片,單位容量表面積減少94%,
而且因為HBM是和邏輯核心集成在同一塊基板上,可以節省更多的空間。
雖然PPT上說的只是邏輯核心+記憶體佔據的PCB面積,
並非整張顯卡PCB的面積,不過可以預見最終顯卡也可以做得很短。
簡單總結一下,採用中介層技術的第一代HBM記憶體,
最重要的是它擁有遠超DDR4、GDDR5或者LPDDR4的高帶寬和性能,
能耗比也高很多,此外由於單位容量表面積縮小94%、加上邏輯核心縮小50%以上,
採用這種記憶體的旗艦顯卡也可以做成“網卡”了。
來源:http://www.expreview.com/40618.html
最後編輯: