處理器 核心怪獸-四路32核心、64執行緒的非凡體驗

ack001

CROWNELECTRONICS 散熱風扇業務
已加入
5/10/12
訊息
2,978
互動分數
8
點數
38
處理器核心數量不斷增加,已經大大超出了普通消費需求,但在大興企業伺服器、資料中心,核心數量永遠是不夠的,四路系統正是為此而來。AnandTech近日通過遠端桌面,體驗了SuperMicro的一台四路伺服器“X9QR7-TF+”,配備了四顆Intel Xeon E5-4650L,搭配金士頓128GB DDR3-1600 ECC記憶體、Windows Server 2012 Standard作業系統。

該處理器基於Sandy Bridge-EP,32nm工藝,8核心16執行緒,三級緩存20MB,原始主頻2.6GHz,睿頻加速最高3.1GHz,QPI總線速度8GT/s,熱設計功耗115W。四路,那就是32個核心、64個執行緒。

在整個E4600系列中,它屬於高端節能型。各方面規格都是完整的,僅僅是主頻略低了一些。在它上下分別是E5-4650 2.7-3.3GHz/130W、E5-4640 2.4-2.8GHz/95W,它們也是該系列中唯一的三款8核心。

順帶一提,這貨的價格高達3616美元(散裝),和E5-4650一樣是該系列中最昂貴的。四顆,那就將近1.5萬美元。


i141874_1.jpg


64個執行緒要全部利用起來是很困難的。Windows Server 2008 R2/2012都能全部識別出來,但是軟體就不一定了,很多都只能認出一半,也就是32個,不得不手動設定核心數量,只是並非所有軟體都可以這樣做。

Xilisoft、3DPM都只能利用自己自動識別出來的執行緒數量,手動設為64個也無用;CineBench也識別不全,還好可以手動指定;POV Ray就比較好了,直接找到64個。

另外即便是強大如AnandTech,能測試到這種多路伺服器的機會也不多,因此參與對比的伺服器平臺只有兩套雙路系統

一是Xeon E5-2690,同樣是Sandy Bridge-EP家族的但屬於雙路產品,同為32nm工藝、8核心16執行緒、20MB三級緩存,頻率2.9-3.8GHz,熱設計功耗135W,散裝價格2057美元,雙路就是4000多。

二是Xeon X5690,來自於更老的Westmere-EP家族,32nm工藝,6核心12執行緒,12MB三級緩存,頻率3.46-3.73GHz,熱設計功耗130W,散裝售價1663美元。

這倆都是各自家族中的頂尖型號,頻率高,功耗也高。

其它參與對比的都是消費級處理器了,從最新的Core i7-4770K到古老的Core 2 Duo E6700、從頂級的Core i7-3930K到入門級的Celeron G465,很多很多。

同時為了讓大多數人能夠看懂,測試專案沒有選擇非常專業的伺服器應用,而是一些比較常見的桌面測試項目。

3DPM粒子模擬

使用六種演算法計算特定數量粒子的運動步驟,計算每種演算法的速度,最後匯總成一個分數,非常貼近真實的科學計算,而不是純粹的基準跑分,而且在粒子模擬之間的並行性非常好,能夠更好地利用大量核心。

i141875_2.png


單執行緒

i141877_3.png

多執行緒​


4650L因為主頻偏低,單執行緒中很吃虧,只有中流水準,但是憑藉更多核心,多執行緒中表現很好,僅次於2690×2。

WinRAR檔案壓縮

測試了兩個版本,3.93已經能夠較好地利用多核心多執行緒,4.2則做得好得多。

i141878_4.png

WinRAR3.93

i141879_5.png

WinRAR4.20​

WinRAR其實是非常依賴記憶體頻寬的,偏偏這套四路系統只有DDR3-1600,成績自然不如人家DDR3-2133/2400。

FastStone Image Viewer 4.2圖片流覽

一個看圖軟體,僅支援單執行緒。測試中將163MB 170張不同圖片全部轉成640×480 GIF。

i141881_6.png

果然要看架構,看頻率,多路不佔便宜。

Xilisoft Video Converter 7視訊轉換

將30段1080p 30秒鐘的視訊轉換成iPod H.264格式,僅用CPU而不用GPU加速。

i141882_7.png

多路系統徹底牛逼了,6-7秒鐘就瞬間完成!但因為軟體限制,它只能利用最多32個執行緒,33段視頻正好略微超出了它的承受能力,因此Sandy Bridge-EP相比於前一代Westemere-EP沒什麼進步。

POV Ray 3.7光線追蹤渲染

一個純粹的渲染器,是考驗處理器性能、主機板穩定性的好東西。


i141883_8.png

64個執行緒得到了淋漓盡致的發揮,比32執行緒、主頻更高的2690×2快了超過40%,比24執行緒、主頻更更高的X5690×2快了幾乎一倍!

x264 HD Benchmark視訊轉換

這個不用多介紹了,很常見的測試項目。

i141884_9.png


i141885_10.png

4650L×4表現一般,主要是x264的記憶體管理和非一致性記憶體訪問問題,QPI匯流排上的複雜記憶體訪問影響了性能。

Explicit Finite Difference顯式有限差分網格求解

這個一般人可能沒聽說過,我們也不多介紹了,只要知道它是一個計算密集型的項目就可以了。

i141886_11.png

2D

i141887_12.png

3D​

很奇怪吧,四路系統居然在計算密集型任務中一敗塗地,還不如Athlon X2 555。這其實說明了代碼的針對性編寫有多麼重要,使其適

應多路系統是非常艱巨的。

Implicit Finite Difference隱式有限差分網格求解

i141888_13.png









資料來源~
 

strikeangel

一般般會員
已加入
7/13/08
訊息
191
互動分數
0
點數
16
真是強大的演算能力阿,不過能夠好好壓榨硬體能力的軟體一般人也很少在用阿:PPP:
 

arthur0905

榮譽會員
已加入
12/22/11
訊息
3,628
互動分數
6
點數
38
效能確實讓人眼睛一亮
不論是單核還是多核效能都能讓人會心一笑;nq;
不過整体組合價不愧是四路32核64執行緒的箇中翹楚;x;
一般玩家只能遠觀而不可褻玩焉;ng;
 

roy655234

普通會員
已加入
6/15/08
訊息
465
互動分數
3
點數
18
突然想到翡璃月兄的電腦...
 

wdcj

一般般會員
已加入
5/20/12
訊息
140
互動分數
0
點數
0
雖然這台Server超強,但也不是每個軟體都能明顯測出差異性,所以也無需太羨慕,夠用就好。
 

翡璃月

榮譽會員
已加入
3/11/08
訊息
2,673
互動分數
21
點數
38
網站
bbs.hsq-rip.org
嘎... x264 benchmark 我記得只吃的到1顆CPU而已
然後 謝謝關心 -.- ... 記憶體還沒賣出去前 沒辦法4路阿...
 

ccbxeon

榮譽會員
已加入
10/27/10
訊息
7,164
互動分數
8
點數
0
果然很Server..;rr;

硬體衝得很快但軟體有點跟不上;em44;
 

ga66728

我愛APU
已加入
10/10/06
訊息
2,263
互動分數
0
點數
36
四路系統居然在計算密集型任務中一敗塗地,還不如Athlon X2 555
這完全都不意外
在桌機上 說INTEL單核心多好 AMD4模塊8核心的單核心為什麼這麼弱的時候?
反觀
成也風雲 敗也風雲
拿這個用來堵I迷的嘴-一大樂事
 

cisco2012

榮譽會員
已加入
7/20/10
訊息
1,009
互動分數
14
點數
38
各位觀眾!
這因該是為了要虛擬而誕生的 超級server 了吧!

只測試母體的速度! 許多軟體! 已經無法完全百分百相容! 許說據因該是看看就好!!

虛擬主機 當母體! 才是他的任務!!
 

cabtvccr

一般般會員
已加入
3/27/09
訊息
69
互動分數
0
點數
6
感謝ack001大大提供新品資訊!!!
 
▌延伸閱讀