- 已加入
- 8/7/11
- 訊息
- 1,112
- 互動分數
- 1
- 點數
- 36
配備
CPU: FX-8120 4.2Ghz 1.248v
MB: GIGABYTE 970A-UD3 F5
RAM: PATRIOT 1600 9-9-9-24 4G*4 1.65v
HDD: Seagate ST1000DM003 1T 64M
VGA: FirePro V4800 1G GDDR5
COOLER: CORSAIR H60 Liquid
POWER: ThermalTake Smart M450W
CASE: SilverStone PS05B-T 12cm*1
FAN: Enermax 900rpm 12cm*3
OS:Windows7 Ultimate SP1 x64
With 4 Fix Patch
室溫約33度 什麼都沒開
身為一個喜歡AMD的平凡人,剛好正逢推土機降價,跑出該有的C/P值,因此心癢難耐下,小弟入手了新的平台,把推土機開入庫,順便也分享一點設定感想
(補充一下 AM3+的CPU是940根針腳 Socket有942孔 而AM3的CPU是938根針腳 Socket有941孔 大多AM3的MB都要靠換Socket並更新BIOS才能駕駛推土機 只有少部分光更新BIOS就能吃)
推土機採用了32nm的SOI(Silicon On Insulator絕緣體上的矽電晶體)和HKMG(高介電係數金屬閘極)技術 或許是工藝與架構都還不成熟的關係 導致高功耗成為其最大罩門 雖然運作起來滿涼快就是了
先回顧一下自K8後的歷史(命名跳過9與13),K10是Phenom第一代,K10.5是PhenomII,而K11是K8/K10低功耗版,K12是Llano APU,K14是Bobcat低功耗APU,代號Zambezi的Bulldozer架構則為K15(Family 15h),是基於Cluster Multithreading(CMT簇式多執行緒)、核心面積315mm*2、12億電晶體的處理器(前代Thuban 6核 面積364mm*2 電晶體約9億4千萬個),相較於之前採用Chip MultiProcessors(CMP晶體多核)的設計,或Intel HyperThreading特有的Simutaneous Multithreading(SMT同步多執行緒),採用CMT的目標是為了在晶體管數量與多執行緒運作效率取得更佳平衡,當然這也需要更好的分配能力與軟體支援
講到其包含4個模塊(Module)的架構,單一模塊是由兩組整數單元(Integer Unit)與以具備4條管線的排程器(Scheduler)所構成,一個整數單元被辨別為一個物理核心,佔模塊面積百分之12、核心面積的百分之5,此外模塊內還擁有具獨立排程器的彈性浮點單元(Flex Floating Point),可由兩組128位元FMAC組成一組256位元浮點運算(只是還是比不過Sandy Bridge的原生單一256位元),快取的部分,每個模塊擁有4Way 16K*2 Data(資料)+2Way64K Instruction(指令) L1+16Way 2M L2,4個模塊共享64Way 8M L3快取,關於核心的其他部分,還有2組72Bit組成的144Bit 原生DDR3-1866 IMC(內建在CPU的記憶體控制器),核心內除了上述元件之外,還有4條16Bit HT接收與發射匯流排及北橋模塊、IO控制等
(PhenomII x6所有核心擁有2Way 64K*6 Data(資料)+2Way64K*6 Instruction(指令) L1+16Way 512K*2 L2,並共享48Way 6M L3快取)
提到這顆處理器的編號 第一行是 FD8120FRW8KGU 第二行是 FA 1151PGN 第三行是 9B29164A20938
先看第一行 F表示FX系列 D是Desktop桌上型 FR為125w(WM為95w) W表示AM3+ 8是8執行緒 K為8M L3快取 GU代表B2步進
第二行 FA表示推土機(DA是Llano) 1151是2011年第51週生產製造(應該是今年年初) PGN是流水號 第三行則是同盒子條碼
8+2相供電 前置19Pin USB3.0接口 970+SB950的平價好板
Seagate 單碟1TB 快取64M的 SATA3 HDD
CORSAIR H60 12cm風扇最大聲只有30分貝 卻有74cFM的風量 而且AMD MB使用原廠背板與扣具即可 不用拆MB 用手轉一轉就OK囉 安裝超容易
ThermalTake Smart 450W 銅牌 模組化 14cm靜音風扇 單路12v 34A(408W)
SilverStone PS05B-T 全黑化 免螺絲扣具 前置19Pin USB3.0 可裝5組風扇(小弟是裝兩進兩出)
先說明,Vid(預設電壓)越高,同時脈超頻所需電壓不一定越高,因此Vid高低不一定代表體質好壞,像小弟這顆8120,雖然預設電壓(Turbo未作用時)達1.31v(一般125w是1.25v,95w是1.175v,不過加壓超頻極限時脈兩個差不多),但還是有辦法降壓超4.2Ghz跑1.248v,而關於推土機的超頻,受益於32nm,同時脈溫度與所需電壓比45nm E0步進的Thuban或C3 Deneb核心又更降低了,不過須注意新加入的APM(Application Manager),它是當TDP或溫度超過規範時,會降低倍頻(8120降到14x,8150降到16.5x為止)的技術,當開啟時,就會因時脈降低而無法跑出真實的效能,在BIOS未加入開關它的選項前,只能透過先在OverDrive中啟用再禁用turbo、或以PSCheck鎖定P0狀態(把除了P0之外其它的P-State全部禁用)來關閉APM(不然第三種方法 就依處理器不同,先降倍頻到前面所述14or16.5x,再拉外頻上去),所以想一勞永逸的話,建議更新一下BIOS來得到關閉APM的選項,至於功耗,還是有所謂的熱牆,當電壓超過某個臨界點,溫度與耗電量就會暴增,此時再加壓提升時脈就會變得舉步維艱,不管如何加壓就是很難上去,而一般考量到P/W值(效能功耗比)與溫度,要長期穩用的話不建議把電壓超過1.4v,因為那樣會讓耗電量誇張的上升,比較建議不加或小加壓輕鬆跑,以下是能跑測試並長時間穩用的B2核心時脈/電壓圖(不見得每顆都相同,視體質而定,若要燒機,可能要依情況再加個一兩格),降壓1.12~1.16v 3.6Ghz,1.248~1.264v 4.2Ghz,不加壓1.284~1.312v 4.3Ghz
要超頻的話,主機板建議找有6+2或8+2相供電,散熱器若不加壓約TX3就足矣,小加壓約買千元等級塔扇如212+即可,大多能壓在5、60度,除非想加大壓,否則並不需要花2、3千攻頂買高階空冷
CPU NB(內建在處理器的記憶體控制器)不加壓(1.2v)約24~2500Mhz,空冷1.3v約2600Mhz,不過光預設值(2200Mhz)的記憶體讀寫已有超過PhenomII x6 跑28~3000Mhz的頻寬了,這次推土機的HT匯流排速率可以>CPU NB,但與前代一樣提升HT的效果對效能的增長微乎其微,不如提升CPU NB來的明顯
倍頻21 外頻200Mhz、PCI-E Clock固定100Mhz、HT選16bit最大頻寬、預設11x(2200Mhz 等效4400Mt/s)到13x(2600Mhz 等效5200Mt/s)都可以、NB不加壓選12x(2400Mhz)、記憶體視體質與容量調整(2條可跑1866以上,Command Time可設1T 而四條一般會被限制在1600 2T,所以小弟維持時脈 只調時序 從原本1.5v 9-11-10-27調到1.65v 9-9-9-24 而ganged與unganged兩種雙通道模式效能差異不大)、CPU電壓設1.262v 雖然Load Line防掉壓有開到Extreme 但待機都在會在1.216~1.232v間跳動 全速也只會跑1.248v、C1E C6 CNQ等節能可關閉 減少電壓大幅波動以提升穩定度、APM也要記得關
從Benchmark的結果來看,4.2Ghz時,1M1T單核單執行緒約有Sandy Bridge 3Ghz,Phenom II 3.4Ghz的效能,1個1M2T的模塊接近同時脈、1.5核心的PhenomII,或Sandy Bridge 3.4Ghz 1C2T,而4M8T約落在Sandy Bridge 3.4Ghz 4C8T與4.2Ghz的 4C4T或PhenomII X6 3.8Ghz(推土機有測溫偏低的問題,待機與全速大約要再加個10度C會比較準)
分析推土機同時脈單核效能較K10.5降低的原因(約8成實力)
1.管線拉長 雖然更容易提升時脈 但這也導致單位時脈的效能變差
2.IPC(Instruction Per Clock cycle每一時脈週期可執行指令數)降低 讓單個整數運算單元處理能力降低
3.L1快取容量太小,使命中率下降 原先K10.5每一顆核心有64K Data(資料)+64K Instruction(指令) L1,6核心就有768K的L1
,而堆土機單一模塊擁有16K*2 Data(資料)+64K Instruction(指令) L1,4個模塊也就只有96*4=384K的L1快取
4.雖然加大了L3快取 卻也間接增長傳輸延遲
綜合上述原因 才讓推土機同時脈效能只能到達略贏K8的水準
而至於為何同時脈4M8T推土機多工只有接近PhenomII 6C6T的能力
除了單核效能降低外,問題還出在ALU(Arithmetic Logic Unit算術邏輯單元)的多寡
推土機單一整數單元的ALU從K10.5的3個減少為2個 因此由兩個整數單元組成的單一模塊只有4個ALU
4個模塊也就只有(2*2)*4=16個ALU 自然少於(1*3)*6=18個ALU的PhenomII 6C6T了
所以推土機一開始就應該當成強化版的4核心來宣傳 而不該一直說是首個8核心 以至於讓人說8核只能打平6核
相信在安裝修正更新後 於CineBench 11.5中 從原本的8C8T變為4C8T 或許就可說明其定位 不過整體也算滿夠用了呀^^
較前代產品所具備的優勢
1.記憶體控制器改良讓讀取從PhenomII x6的9GB/s提升到13GB/s 寫入也有進步 對高時脈(如2000Mhz+)掌握度更好
2.新的AVX與AES、XOP與FMA4(Fused Multiply Add融合乘加) 也補足了SSSE3,SSE 4.1、4.2 指令集
3.在能充分運用多核資源的場合 如影音編碼轉檔、渲染、處理壓縮檔、多媒體、加密等多工重負載有其長處
4.新的製程讓溫度與電壓又進一步降低 若都超到空冷緊繃 推土機對上6核飛龍4.2Ghz能略勝一籌(當然這是靠4.8Ghz的時脈硬堆出來的)
5.9系列MB的IOMMU讓虛擬化的IO(Input/Output輸入輸出)效能更好 配上CPU具備的Virtualization更如魚得水
使用感想,還算安靜低溫 也很易裝 運作穩定且順暢 小弟心滿意足了 最後希望這台機子能陪伴小弟長長久久到許多年以後
並且感謝大家的鑑賞 如有缺漏或錯誤敬請用力補充指正 期盼不盡 小弟的三言兩語 閒話家常大概就是這樣囉~:)
CPU: FX-8120 4.2Ghz 1.248v
MB: GIGABYTE 970A-UD3 F5
RAM: PATRIOT 1600 9-9-9-24 4G*4 1.65v
HDD: Seagate ST1000DM003 1T 64M
VGA: FirePro V4800 1G GDDR5
COOLER: CORSAIR H60 Liquid
POWER: ThermalTake Smart M450W
CASE: SilverStone PS05B-T 12cm*1
FAN: Enermax 900rpm 12cm*3
OS:Windows7 Ultimate SP1 x64
With 4 Fix Patch
室溫約33度 什麼都沒開
身為一個喜歡AMD的平凡人,剛好正逢推土機降價,跑出該有的C/P值,因此心癢難耐下,小弟入手了新的平台,把推土機開入庫,順便也分享一點設定感想
(補充一下 AM3+的CPU是940根針腳 Socket有942孔 而AM3的CPU是938根針腳 Socket有941孔 大多AM3的MB都要靠換Socket並更新BIOS才能駕駛推土機 只有少部分光更新BIOS就能吃)
推土機採用了32nm的SOI(Silicon On Insulator絕緣體上的矽電晶體)和HKMG(高介電係數金屬閘極)技術 或許是工藝與架構都還不成熟的關係 導致高功耗成為其最大罩門 雖然運作起來滿涼快就是了
先回顧一下自K8後的歷史(命名跳過9與13),K10是Phenom第一代,K10.5是PhenomII,而K11是K8/K10低功耗版,K12是Llano APU,K14是Bobcat低功耗APU,代號Zambezi的Bulldozer架構則為K15(Family 15h),是基於Cluster Multithreading(CMT簇式多執行緒)、核心面積315mm*2、12億電晶體的處理器(前代Thuban 6核 面積364mm*2 電晶體約9億4千萬個),相較於之前採用Chip MultiProcessors(CMP晶體多核)的設計,或Intel HyperThreading特有的Simutaneous Multithreading(SMT同步多執行緒),採用CMT的目標是為了在晶體管數量與多執行緒運作效率取得更佳平衡,當然這也需要更好的分配能力與軟體支援
講到其包含4個模塊(Module)的架構,單一模塊是由兩組整數單元(Integer Unit)與以具備4條管線的排程器(Scheduler)所構成,一個整數單元被辨別為一個物理核心,佔模塊面積百分之12、核心面積的百分之5,此外模塊內還擁有具獨立排程器的彈性浮點單元(Flex Floating Point),可由兩組128位元FMAC組成一組256位元浮點運算(只是還是比不過Sandy Bridge的原生單一256位元),快取的部分,每個模塊擁有4Way 16K*2 Data(資料)+2Way64K Instruction(指令) L1+16Way 2M L2,4個模塊共享64Way 8M L3快取,關於核心的其他部分,還有2組72Bit組成的144Bit 原生DDR3-1866 IMC(內建在CPU的記憶體控制器),核心內除了上述元件之外,還有4條16Bit HT接收與發射匯流排及北橋模塊、IO控制等
(PhenomII x6所有核心擁有2Way 64K*6 Data(資料)+2Way64K*6 Instruction(指令) L1+16Way 512K*2 L2,並共享48Way 6M L3快取)
提到這顆處理器的編號 第一行是 FD8120FRW8KGU 第二行是 FA 1151PGN 第三行是 9B29164A20938
先看第一行 F表示FX系列 D是Desktop桌上型 FR為125w(WM為95w) W表示AM3+ 8是8執行緒 K為8M L3快取 GU代表B2步進
第二行 FA表示推土機(DA是Llano) 1151是2011年第51週生產製造(應該是今年年初) PGN是流水號 第三行則是同盒子條碼
8+2相供電 前置19Pin USB3.0接口 970+SB950的平價好板
Seagate 單碟1TB 快取64M的 SATA3 HDD
CORSAIR H60 12cm風扇最大聲只有30分貝 卻有74cFM的風量 而且AMD MB使用原廠背板與扣具即可 不用拆MB 用手轉一轉就OK囉 安裝超容易
ThermalTake Smart 450W 銅牌 模組化 14cm靜音風扇 單路12v 34A(408W)
SilverStone PS05B-T 全黑化 免螺絲扣具 前置19Pin USB3.0 可裝5組風扇(小弟是裝兩進兩出)
先說明,Vid(預設電壓)越高,同時脈超頻所需電壓不一定越高,因此Vid高低不一定代表體質好壞,像小弟這顆8120,雖然預設電壓(Turbo未作用時)達1.31v(一般125w是1.25v,95w是1.175v,不過加壓超頻極限時脈兩個差不多),但還是有辦法降壓超4.2Ghz跑1.248v,而關於推土機的超頻,受益於32nm,同時脈溫度與所需電壓比45nm E0步進的Thuban或C3 Deneb核心又更降低了,不過須注意新加入的APM(Application Manager),它是當TDP或溫度超過規範時,會降低倍頻(8120降到14x,8150降到16.5x為止)的技術,當開啟時,就會因時脈降低而無法跑出真實的效能,在BIOS未加入開關它的選項前,只能透過先在OverDrive中啟用再禁用turbo、或以PSCheck鎖定P0狀態(把除了P0之外其它的P-State全部禁用)來關閉APM(不然第三種方法 就依處理器不同,先降倍頻到前面所述14or16.5x,再拉外頻上去),所以想一勞永逸的話,建議更新一下BIOS來得到關閉APM的選項,至於功耗,還是有所謂的熱牆,當電壓超過某個臨界點,溫度與耗電量就會暴增,此時再加壓提升時脈就會變得舉步維艱,不管如何加壓就是很難上去,而一般考量到P/W值(效能功耗比)與溫度,要長期穩用的話不建議把電壓超過1.4v,因為那樣會讓耗電量誇張的上升,比較建議不加或小加壓輕鬆跑,以下是能跑測試並長時間穩用的B2核心時脈/電壓圖(不見得每顆都相同,視體質而定,若要燒機,可能要依情況再加個一兩格),降壓1.12~1.16v 3.6Ghz,1.248~1.264v 4.2Ghz,不加壓1.284~1.312v 4.3Ghz
要超頻的話,主機板建議找有6+2或8+2相供電,散熱器若不加壓約TX3就足矣,小加壓約買千元等級塔扇如212+即可,大多能壓在5、60度,除非想加大壓,否則並不需要花2、3千攻頂買高階空冷
CPU NB(內建在處理器的記憶體控制器)不加壓(1.2v)約24~2500Mhz,空冷1.3v約2600Mhz,不過光預設值(2200Mhz)的記憶體讀寫已有超過PhenomII x6 跑28~3000Mhz的頻寬了,這次推土機的HT匯流排速率可以>CPU NB,但與前代一樣提升HT的效果對效能的增長微乎其微,不如提升CPU NB來的明顯
倍頻21 外頻200Mhz、PCI-E Clock固定100Mhz、HT選16bit最大頻寬、預設11x(2200Mhz 等效4400Mt/s)到13x(2600Mhz 等效5200Mt/s)都可以、NB不加壓選12x(2400Mhz)、記憶體視體質與容量調整(2條可跑1866以上,Command Time可設1T 而四條一般會被限制在1600 2T,所以小弟維持時脈 只調時序 從原本1.5v 9-11-10-27調到1.65v 9-9-9-24 而ganged與unganged兩種雙通道模式效能差異不大)、CPU電壓設1.262v 雖然Load Line防掉壓有開到Extreme 但待機都在會在1.216~1.232v間跳動 全速也只會跑1.248v、C1E C6 CNQ等節能可關閉 減少電壓大幅波動以提升穩定度、APM也要記得關
從Benchmark的結果來看,4.2Ghz時,1M1T單核單執行緒約有Sandy Bridge 3Ghz,Phenom II 3.4Ghz的效能,1個1M2T的模塊接近同時脈、1.5核心的PhenomII,或Sandy Bridge 3.4Ghz 1C2T,而4M8T約落在Sandy Bridge 3.4Ghz 4C8T與4.2Ghz的 4C4T或PhenomII X6 3.8Ghz(推土機有測溫偏低的問題,待機與全速大約要再加個10度C會比較準)
分析推土機同時脈單核效能較K10.5降低的原因(約8成實力)
1.管線拉長 雖然更容易提升時脈 但這也導致單位時脈的效能變差
2.IPC(Instruction Per Clock cycle每一時脈週期可執行指令數)降低 讓單個整數運算單元處理能力降低
3.L1快取容量太小,使命中率下降 原先K10.5每一顆核心有64K Data(資料)+64K Instruction(指令) L1,6核心就有768K的L1
,而堆土機單一模塊擁有16K*2 Data(資料)+64K Instruction(指令) L1,4個模塊也就只有96*4=384K的L1快取
4.雖然加大了L3快取 卻也間接增長傳輸延遲
綜合上述原因 才讓推土機同時脈效能只能到達略贏K8的水準
而至於為何同時脈4M8T推土機多工只有接近PhenomII 6C6T的能力
除了單核效能降低外,問題還出在ALU(Arithmetic Logic Unit算術邏輯單元)的多寡
推土機單一整數單元的ALU從K10.5的3個減少為2個 因此由兩個整數單元組成的單一模塊只有4個ALU
4個模塊也就只有(2*2)*4=16個ALU 自然少於(1*3)*6=18個ALU的PhenomII 6C6T了
所以推土機一開始就應該當成強化版的4核心來宣傳 而不該一直說是首個8核心 以至於讓人說8核只能打平6核
相信在安裝修正更新後 於CineBench 11.5中 從原本的8C8T變為4C8T 或許就可說明其定位 不過整體也算滿夠用了呀^^
較前代產品所具備的優勢
1.記憶體控制器改良讓讀取從PhenomII x6的9GB/s提升到13GB/s 寫入也有進步 對高時脈(如2000Mhz+)掌握度更好
2.新的AVX與AES、XOP與FMA4(Fused Multiply Add融合乘加) 也補足了SSSE3,SSE 4.1、4.2 指令集
3.在能充分運用多核資源的場合 如影音編碼轉檔、渲染、處理壓縮檔、多媒體、加密等多工重負載有其長處
4.新的製程讓溫度與電壓又進一步降低 若都超到空冷緊繃 推土機對上6核飛龍4.2Ghz能略勝一籌(當然這是靠4.8Ghz的時脈硬堆出來的)
5.9系列MB的IOMMU讓虛擬化的IO(Input/Output輸入輸出)效能更好 配上CPU具備的Virtualization更如魚得水
使用感想,還算安靜低溫 也很易裝 運作穩定且順暢 小弟心滿意足了 最後希望這台機子能陪伴小弟長長久久到許多年以後
並且感謝大家的鑑賞 如有缺漏或錯誤敬請用力補充指正 期盼不盡 小弟的三言兩語 閒話家常大概就是這樣囉~:)