其實Radeon HD 6970與Radeon HD 6950的定位,並不是如大家所想的那般直接對上GeForce GTX 580或GeForce GTX570,而是用價位來卡進這兩張顯示卡的價格區間,像是Radeon HD 6970是399~429美金,而Radeon HD 6950則是329~349美金,這比GeForce GTX 580與570的定價來說是便宜的許多。
Radeon HD 6900算是這幾代以來,在架構上改變最大的一次。在架構圖上可以看到Radeon HD 6900系列已經拆成兩大塊,而AMD則是稱之為Dual graphics englines,但在Radeon HD 6800與Radeon HD 5800系列時也已經是兩大塊,只是上面的執行單元某些還是共用,不像此次Radeon HD 6900分的那麼清楚。此外,在Tessellator方面,AMD稱之為第八代架構了,並且比過去的Radeon HD 5870還高出三倍的效能,當然啦~以經驗來判斷,這個部的效能可能要驅動程式再多出幾次之後才會慢慢拉高,畢竟在架構上從5 VLIW轉成4 VLIW還得要較調一些地方。
Radeon HD 6900系列分別有兩種型號,分別是Radeon HD 6970與Radeon HD 6950,差別就在於Stream Processor的數量與核心時脈等等規格。
以Radeon HD 6970的架構來說,在圖中可以看到兩大塊、佔去最大面積的執行單元,這就是Cayman核心裡的Stream Processor(SP),左右兩邊各有12組SIMD,所以Radeon HD 6970一共有24組SIMD。
原本,在每一組的SIMD裡頭,一共有16個5D計算單元(VILW),所以在Radeon HD 6870版本上一共有:「14 x 16 x 5D」,也就是1120個SP。但是,現在Radeon HD 6970改成4D的架構之後,則是變成了:「24 x 16 x 4D」,一共是1536個SP。
改成4D之後,每一個1D要計算的東西都變平等了(相同的整數、浮點執行能力),而原本過去5D中的SFU的工作,則由4D來進行計算了,這樣一來除了省了核心面積,還可以增加SIMD的利率。不過,現在變成SFU的工作量都跑到這剩餘的4D上,不過,最多也只佔掉四分之三的 issue slots(發射、接收的指令數目),這樣的設計AMD認為是優於過去的VLIW 5架構,並且還提升了10%的面積性能比,還可以簡化排程與register的管理。
這4D架構中,在FP的每一個周期下可以執行:
4個32 bit FMA、MAD、MUL或ADD。
2個64 bit的ADD。
1個64 bit FMA或MUL
1個Special Function
至於在Integer的每一個周期下可以執行:
4個24 bit的MAD、MUL或ADD。
4個32 bit的ADD或bitwise ops。
1個32 bit的MAD或MUL。
1個64 bit的ADD。
另外,在架構上也稍微改變的地方還有Render Back-Ends。像是合併寫入動作、合併寫入指令,16 bit的integer(unorm/snorm)速度提升2倍、32 bit FP(單/雙精度)操作速度提升2~4倍。但是Z/Stencil與ROP的數量並沒有改變,一樣與前幾代的RV870與Barts核心數量都一樣都是八組(共128個Z/Stencil),32個Color ROP。
在GPU增強的部分,還有Asynchronous dispatch(非等時指令發送,多重kernel、Fermi早已實作啦~),也就是可以同時執行多個kernel,每個kernel 都有自己的虛擬位址,有記憶體保護功能等等,這就是比較強的地方了。另外,至於兩組雙向的DMA引擎,可以有更快的系統記憶體讀取與寫入,其他像是合併shader指令、直接存取Local Data Share、改進流程控制與更快的每秒雙精度指令 (1/4 SP rate)都是在優化GPGPU能力。
另外,筆者覺得最厲害的是,AMD把功耗控制器直接做進核心裡了(AMD CPU Team應該功不可沒),其實在過去不管AMD或NVIDIA,都有在功耗做了一些設計,但這次AMD直接整合一顆功耗控制器則可以控制的更「精細」,而且還支援AMD OverDrive工具,到時候再來看看是不是能直接像CPU一樣玩加壓超頻了。
Radeon HD 6970圖解
從圖片上來看應該看不出來它有多大吧?
看看金手指的比例,可以感覺的出來它有多長嗎?
放一支筆,有沒有更清楚它有多大張?
在橋接器邊,現在還多了一個小開關,它的用途是.....,請往下看。
8 pin + 6 pin的電源接頭。
超多個影像連接埠,多到我懶的打字出來了。
把散熱器拆開吧~
看看拆下鐵蓋的背面~
在mini DisplayPort 1.2與HDMI 1.4a的接頭上都有抗干擾的遮蔽設計。
用的是VOLTERRA的VT1157SF電源控制晶片。
使用Hynix的GDDR5記憶體顆粒。
CL1108 Multi-Phase Power Inductors排感,這輸出電感是給GPU用。(用排感就是讓PCB省下很多空間,科科~)
沒有打上ENG工程樣品的字樣,這貨很足?
電源輸入,過濾從Power傳來的電流。
這次在Radeon HD 6970顯示卡上,AMD還提供了回復BIOS的功能。也就是說,當這個小開關撥動到「1」的時候,使用者可以自行更新、設定BIOS,倘若BIOS的設定或刷入失敗,讓顯示卡無法正確啟動時,就可以把開關調到「2」以回復原廠預設。
裸卡再來一張。
看完了以上圖片的介紹,現在總該來一點測試了。筆者這次拿來當Radeon HD 6970對手的顯示卡,就是日前剛推出不久的GeForce GTX 580,但要注意的是,這兩張顯示卡的價格有「頗大的差距」,這次的測試單純就是觀察兩邊陣營的單核心的效能,不然拿現在市場上的17000元的產品去壓13000元的產品怎麼行?(Radeon HD 6970 NT$12,000~13,000($399~$429)、Radeon HD 6950 NT$10,000~11,000($329~$349))
Platform
Motherboard:GA-EX58-DS4(Intel X58 + ICH10R Chipset)
Processor:Intel Core i7-920(8M Cache,2.66 GHz,4.80 GT/s QPI)
Memory:Kingston HyperX DDR3 1066 8-8-8-20 1T(KHX16000D3T1K3/3GX)
Hard Drive:OCZ Z-DRIVER 256GB
Power Supply:Silver Stone SST-ST1000
Display:SAMSUNG 2443BWX
OS:Windows 7 Ultimate(32bit)
這次Cayman核心的推出,就筆者個人感覺算是從R600以來改變最大的一次,過去只有DirectX推出新版本時才會出現這種情況,但這次Cayman的推出就筆者個人感覺像是單核心又有雙核心,但從同樣角度來看Fermi不就單核心中又有四核心了?這點就由大家去想吧~
另外,雖然說GeForce GTX 580贏了Radeon HD 6970有20%,但是別忘了NVIDIA可是靠著520mm2的Die size去拚的,而Radeon HD 6970只有389mm2,所以Fermi贏Cayman 20%的效能,但Die size Fermi卻比Cayman大了33%,以成本面來說這個不太好看,而且別忘了Cayman還只是初步推出的核心,日後在效能上還有一定的提升空間,而Fermi也已經推出一段時間了,該拉的效能也都拉了,至於最後是如何呢?看起來還是看消費者吧~
另外,接下來就等Fermi雙核心版來跟Radeon HD 5970挑戰囉~但是更具成本優勢的Cayman也在準備雙核心版,大概明年初我們又可以再看一次雙核大戰了!
Radeon HD 6900算是這幾代以來,在架構上改變最大的一次。在架構圖上可以看到Radeon HD 6900系列已經拆成兩大塊,而AMD則是稱之為Dual graphics englines,但在Radeon HD 6800與Radeon HD 5800系列時也已經是兩大塊,只是上面的執行單元某些還是共用,不像此次Radeon HD 6900分的那麼清楚。此外,在Tessellator方面,AMD稱之為第八代架構了,並且比過去的Radeon HD 5870還高出三倍的效能,當然啦~以經驗來判斷,這個部的效能可能要驅動程式再多出幾次之後才會慢慢拉高,畢竟在架構上從5 VLIW轉成4 VLIW還得要較調一些地方。
Radeon HD 6900系列分別有兩種型號,分別是Radeon HD 6970與Radeon HD 6950,差別就在於Stream Processor的數量與核心時脈等等規格。
以Radeon HD 6970的架構來說,在圖中可以看到兩大塊、佔去最大面積的執行單元,這就是Cayman核心裡的Stream Processor(SP),左右兩邊各有12組SIMD,所以Radeon HD 6970一共有24組SIMD。
原本,在每一組的SIMD裡頭,一共有16個5D計算單元(VILW),所以在Radeon HD 6870版本上一共有:「14 x 16 x 5D」,也就是1120個SP。但是,現在Radeon HD 6970改成4D的架構之後,則是變成了:「24 x 16 x 4D」,一共是1536個SP。
改成4D之後,每一個1D要計算的東西都變平等了(相同的整數、浮點執行能力),而原本過去5D中的SFU的工作,則由4D來進行計算了,這樣一來除了省了核心面積,還可以增加SIMD的利率。不過,現在變成SFU的工作量都跑到這剩餘的4D上,不過,最多也只佔掉四分之三的 issue slots(發射、接收的指令數目),這樣的設計AMD認為是優於過去的VLIW 5架構,並且還提升了10%的面積性能比,還可以簡化排程與register的管理。
這4D架構中,在FP的每一個周期下可以執行:
4個32 bit FMA、MAD、MUL或ADD。
2個64 bit的ADD。
1個64 bit FMA或MUL
1個Special Function
至於在Integer的每一個周期下可以執行:
4個24 bit的MAD、MUL或ADD。
4個32 bit的ADD或bitwise ops。
1個32 bit的MAD或MUL。
1個64 bit的ADD。
另外,在架構上也稍微改變的地方還有Render Back-Ends。像是合併寫入動作、合併寫入指令,16 bit的integer(unorm/snorm)速度提升2倍、32 bit FP(單/雙精度)操作速度提升2~4倍。但是Z/Stencil與ROP的數量並沒有改變,一樣與前幾代的RV870與Barts核心數量都一樣都是八組(共128個Z/Stencil),32個Color ROP。
在GPU增強的部分,還有Asynchronous dispatch(非等時指令發送,多重kernel、Fermi早已實作啦~),也就是可以同時執行多個kernel,每個kernel 都有自己的虛擬位址,有記憶體保護功能等等,這就是比較強的地方了。另外,至於兩組雙向的DMA引擎,可以有更快的系統記憶體讀取與寫入,其他像是合併shader指令、直接存取Local Data Share、改進流程控制與更快的每秒雙精度指令 (1/4 SP rate)都是在優化GPGPU能力。
另外,筆者覺得最厲害的是,AMD把功耗控制器直接做進核心裡了(AMD CPU Team應該功不可沒),其實在過去不管AMD或NVIDIA,都有在功耗做了一些設計,但這次AMD直接整合一顆功耗控制器則可以控制的更「精細」,而且還支援AMD OverDrive工具,到時候再來看看是不是能直接像CPU一樣玩加壓超頻了。
Radeon HD 6970圖解
從圖片上來看應該看不出來它有多大吧?
看看金手指的比例,可以感覺的出來它有多長嗎?
放一支筆,有沒有更清楚它有多大張?
在橋接器邊,現在還多了一個小開關,它的用途是.....,請往下看。
8 pin + 6 pin的電源接頭。
超多個影像連接埠,多到我懶的打字出來了。
把散熱器拆開吧~
看看拆下鐵蓋的背面~
在mini DisplayPort 1.2與HDMI 1.4a的接頭上都有抗干擾的遮蔽設計。
用的是VOLTERRA的VT1157SF電源控制晶片。
使用Hynix的GDDR5記憶體顆粒。
CL1108 Multi-Phase Power Inductors排感,這輸出電感是給GPU用。(用排感就是讓PCB省下很多空間,科科~)
沒有打上ENG工程樣品的字樣,這貨很足?
電源輸入,過濾從Power傳來的電流。
這次在Radeon HD 6970顯示卡上,AMD還提供了回復BIOS的功能。也就是說,當這個小開關撥動到「1」的時候,使用者可以自行更新、設定BIOS,倘若BIOS的設定或刷入失敗,讓顯示卡無法正確啟動時,就可以把開關調到「2」以回復原廠預設。
裸卡再來一張。
看完了以上圖片的介紹,現在總該來一點測試了。筆者這次拿來當Radeon HD 6970對手的顯示卡,就是日前剛推出不久的GeForce GTX 580,但要注意的是,這兩張顯示卡的價格有「頗大的差距」,這次的測試單純就是觀察兩邊陣營的單核心的效能,不然拿現在市場上的17000元的產品去壓13000元的產品怎麼行?(Radeon HD 6970 NT$12,000~13,000($399~$429)、Radeon HD 6950 NT$10,000~11,000($329~$349))
Platform
Motherboard:GA-EX58-DS4(Intel X58 + ICH10R Chipset)
Processor:Intel Core i7-920(8M Cache,2.66 GHz,4.80 GT/s QPI)
Memory:Kingston HyperX DDR3 1066 8-8-8-20 1T(KHX16000D3T1K3/3GX)
Hard Drive:OCZ Z-DRIVER 256GB
Power Supply:Silver Stone SST-ST1000
Display:SAMSUNG 2443BWX
OS:Windows 7 Ultimate(32bit)
這次Cayman核心的推出,就筆者個人感覺算是從R600以來改變最大的一次,過去只有DirectX推出新版本時才會出現這種情況,但這次Cayman的推出就筆者個人感覺像是單核心又有雙核心,但從同樣角度來看Fermi不就單核心中又有四核心了?這點就由大家去想吧~
另外,雖然說GeForce GTX 580贏了Radeon HD 6970有20%,但是別忘了NVIDIA可是靠著520mm2的Die size去拚的,而Radeon HD 6970只有389mm2,所以Fermi贏Cayman 20%的效能,但Die size Fermi卻比Cayman大了33%,以成本面來說這個不太好看,而且別忘了Cayman還只是初步推出的核心,日後在效能上還有一定的提升空間,而Fermi也已經推出一段時間了,該拉的效能也都拉了,至於最後是如何呢?看起來還是看消費者吧~
另外,接下來就等Fermi雙核心版來跟Radeon HD 5970挑戰囉~但是更具成本優勢的Cayman也在準備雙核心版,大概明年初我們又可以再看一次雙核大戰了!