Opteron1210 VS E6300 OC 2.8G 工程運算partII

blizzardkk2

一般般會員
已加入
2/2/07
訊息
88
互動分數
0
點數
0
延續上一篇不太完整的試驗
http://forum.coolaler.com/showthread.php?t=146074&highlight=opteron+1210+210

這次以同樣2.8G 時脈下作比較

AMD平台: opteron 1210 1.8G OC 2.8G (312x9-1.35V)(極限約3G-1.45V)
PQI DDRII667 2G*4 (4-4-4-12)
技嘉M57SLI-S4
WD-80G IDE

INTEL平台: E6300 1.8G OC 2.8G (400x7-1.26V ) (極限未知=.= 3G-1.32V)
A-DATA DDRII800 1G*2 (5-5-5-15)
技嘉965P-DS4
WD-80G SATA

同樣先來個開胃菜 單super pi 1M
opteron 1210 2.8G
391366414_013ea74836_o.png


E6300 2.8G
391383439_b4d380f6d5_o.png


效能大約差了50%
是否因E6300的共用2M快取佔盡優勢?
此時的opteron也尚未能發揮Hypertransport 3.0

接著再試試號稱業界最強的熱流模擬軟體CFX
(傳聞全世界有超過十萬個工程師使用,國內就小弟所知華碩與鴻海也使用這套)
由於小弟的intel平台上記憶體只有2G..為了不超過容量限制...
以100萬個網格分別做單一運算與雙單一運算(並非平行運算)
其實CFX有支援平行運算,並且在效率上相當不錯
但由於此實驗中網格對稱性不佳,切割作平行運算時會出現錯誤
因此以二個單一運算來取代平行,不客觀之處請多包含

Opteron 1210 單一CFX運算
(紅色框內分別為整數integer 與浮點real所佔有的資料大小)
391390842_aeb127943e_o.png


網格總數

391429125_838b0b78cf_o.png


請注意綠色框中為疊代次數,紅色框為計算累計時間
(括號內才是當次運算時間結果,括號外為歷史疊代記錄與時間總合)
只要收斂無太大變化...之前的疊代結果並不影響當次計算時間
而所有參數與邊界設定皆為相同
唯有總疊代次數在兩平台上不同,但根據經驗並不影響計算時間
opteron 10次疊代時間966秒
391409801_f18e948331_o.png




接著E6300

391383441_f608f7826f_o.png

391383443_b7fba6bd33_o.png




E6300 10次疊代時間825秒
391383444_c25e5ba4f9_o.png





Opteron1210 966秒
比 E6300 825秒 慢了141秒 (約17%)
比起super pi 落後50%似乎有相當大的差異
接續是雙CFX運算
 
最後編輯:

blizzardkk2

一般般會員
已加入
2/2/07
訊息
88
互動分數
0
點數
0
小弟認為
E6300 共用2MB快取在單一程式執行時並無雙核心搶快取的情況
但如果是兩個程式皆大量存取資料時呢? 共用的快取到底該提供哪一核心為優先?

而opteron分別配制1M快取則不易發生上述情況
此論點並不代表共用快取時效率較差
而純粹只是猜測...共用快取時..遇到多個程式分別由雙核心大量資料存取...此優勢會消失?
但AM2 opteron所謂的hypertransport 3.0何狀況下該發生作用呢?
由於CFX在運算時直接將資料全部存入記憶體中再由CPU做運算,不再回存到硬碟
直到所有疊代收斂至設定值才會回存入硬碟
在此之前只有CPU與記憶體之間的溝通...
此時AMD於CPU內置記憶體控制器是否真的達到最佳的效益?
小弟是學熱傳的...也不清楚
但是之前參考過的測試中大概可了解到
同時脈下的conroe與opteron在FPU上差異至少有30%~50%
而這次CFX計算中浮點大約佔了60%...在總計算時間上理應贏過opteron 15~30%

接著看看雙CFX運算結果
Opteron 1210 與 E6300 網格資料皆取相同
391387261_659a5ef10a_o.png


391406975_5a7bec711e_o.png



Opteron 1210初始迴圈疊代

391387262_7583413590_o.png


E6300 初始迴圈疊代

391406976_b811dd3cff_o.png


E6300在初始疊代上(1~2)比1210快了約5~8秒
與單一CFX運算上差距已經縮短了10秒


opteron 1210 10次疊代總時間1050秒

391387264_8e9e18ea86_o.png



E6300 10次疊代總時間998秒

391406977_a07ce7fd9c_o.png



雙CFX運算結果
E6300 10次疊代總時間998秒
比opteron 1210 10次疊代總時間1050秒快了52秒 (約5.2%)
 
最後編輯:

wongin

穿丁字褲的橘子
已加入
4/17/05
訊息
787
互動分數
0
點數
0
年齡
41
網站
造訪網站
很棒的文章~謝謝分享~
研究中..
會再來個3g比拼嗎?
 

blizzardkk2

一般般會員
已加入
2/2/07
訊息
88
互動分數
0
點數
0
總結一下
Super pi E6300 20秒 比 opteron 30秒 快了10秒 (50%)
單一CFX運算 E6300 825秒 比 opteron 996秒 快了141秒 (17%)
雙CFX運算 E6300 998秒 比opteron 1050秒 快了52秒 (約5.2%)

記憶體時脈上E6300為DDRII800 優於 opteron的DDRII624
時序上是opteron平台上較優 ...由於受限於主機版因此作此調整
但opteron平台上以8G 對intel平台的2G ram或許會惹來爭議
但是以我的經驗...只要未使用到虛擬記憶體皆不影響計算結果
在雙CFX高負載時intel平台上尚有4xxMB ram可用...因此來判斷
小弟只是認為同時脈下 opteron的表現已經相當精采 挾持高記憶體頻寬能與conroe拉近距離
雖然在眾多測試軟體上不見得看得到差異
但是扣除FPU與超頻時脈上與conroe的差距...其它部份可說完全不輸給conroe
以舊架構的cpu而言已屬難得...
希望AMD即早順利導入65nm與四核新架構...後續仍大有作為的
 

blizzardkk2

一般般會員
已加入
2/2/07
訊息
88
互動分數
0
點數
0
很棒的文章~謝謝分享~
研究中..
會再來個3g比拼嗎?

^^超過3G以後可能intel是一面倒的獲勝囉
我發現超過2.4G之後opteron的效能與時脈關係已經逐漸脫離線性了
反而控肉在3G時還不見此現象
這或許也是重度超頻玩家都一面倒向intel的原因吧
我寫完這篇測試就打算回家過年了
我倒是滿期待將來四核與八核的對決
 

ciwui007

進階會員
已加入
8/4/05
訊息
388
互動分數
0
點數
16
很精采的測試!感謝大大的分享!
 

mouse329

進階會員
已加入
3/6/04
訊息
715
互動分數
0
點數
16
實用的測試
回文給樓主鼓勵
 

cobure

榮譽會員
已加入
6/13/04
訊息
1,383
互動分數
0
點數
36
年齡
44
恩恩~~很實用的一篇測試
畢竟使用科學運算的還是有大有人在(苦命的工程師及研究生......)
相當直得參考
我也是還想知道對於Matlab or Spice等等一些科學上使用的軟體
不知道有沒有其他大大可以分享一下心得呢?
 

MoDT

玩電腦的人
已加入
7/23/06
訊息
3,164
互動分數
0
點數
0
如果可以用更多工程用軟體測試

相信可以更全面更客觀

畢竟真正在用的人才知道哪一個才是心中最理想的

感謝大大用心的測試分享:)
 
▌延伸閱讀