Opteron1210 VS E6300 OC 2.8G 工程運算partII

睡覺的貓 · 2/16/07

小弟提出一點小看法
您要不要試試看NASTRAN或FEMLAB?
同樣都有內建熱流模擬
相信您會聽到一大堆的逼逼聲
CFX不會進行倍精度的浮點收歛
您這測試後面的誤差項
應該會因為使用倍精度的浮點運算
使超頻後的誤差加大
另,超頻之後,對於匯流排和快取
有時會發生"靈異事件"
您可以用SPEC再試試看
小弟自己在跑su2cor,PAW與FEMLAB是沒膽量超頻
因為心臟不夠大怕看到過大的誤差項
不是要打筆戰
只是身為同在跑模擬的人想分享一下心得

blizzardkk2 · 2/16/07

睡覺的貓說：
小弟提出一點小看法
您要不要試試看NASTRAN或FEMLAB?
同樣都有內建熱流模擬
相信您會聽到一大堆的逼逼聲
CFX不會進行倍精度的浮點收歛
您這測試後面的誤差項
應該會因為使用倍精度的浮點運算
使超頻後的誤差加大
另,超頻之後,對於匯流排和快取
有時會發生"靈異事件"
您可以用SPEC再試試看
小弟自己在跑su2cor,PAW與FEMLAB是沒膽量超頻
因為心臟不夠大怕...

小弟不才...其實我對CFX內部運算的過程並不完全了解...從詢問學長的經驗是
CFX的誤差項並不是來自於超頻的結果...而是設定的timescale,physical timescale 或是timefactor
依照經驗是...同樣的初始值,在相同的timescale下,同樣的迴圈數會得到相同的結果喔
除非是沒有給定初始條件...這時CFX會自動選擇初始值...才會有不同的收斂結果
而且CFX其實並不如一些測試軟體如sp2004來的嚴苛
因為經由長時間不同平台的測試結果..幾乎是可說穩定的
(不論是超頻或是不超頻皆可在同樣的迴圈數下收斂至設定的RMS)
小弟這次測試其實並非完全客觀...因為兩個同樣的model並非在相同的疊代數下去跑
但是我觀查這些誤差影響的結果..除非是在發散之前幾個迴圈才會出現計算時間異常
否則在一般情況下幾乎都是十分接近的
您說這些軟體我還沒碰過呢...如果您過年期間有時間的話 ...可否介紹一下它們的用途呢?
我想CFX也只能測浮點跟整數運算與記憶體頻寬的影響
對於其它應用軟體或許無法提供任何有力的參考數據
也滿期待其它版友也一起來分享你們的測試
不再讓CPU只是跑跑super pi

未來有機會的話..我也會嘗試使用CFX內建的平行運算來測試^^
或許等Q6400上市小弟會去敗一顆來測看看...

睡覺的貓 · 2/16/07

其實CFX並沒有針對一般的PC版本推出精度調整
(用C說就是選擇浮點位數)
這只有大主機在用的版本才有
若您有興趣
直接用驢子抓一套FEMLAB
模擬觀察超頻和不超頻
小弟覺得對於使用到矩陣去儲存浮點值的軟體
超頻之後
有些項會發生原本是收斂
結果卻發散掉的情形
其實這在Hennessy的白算盤有簡單提到von neuman當年有論証過
大矩陣面對來不及算的結局
不過,您特別用CFX展示AMD和INTEL的較勁
還是要給您鼓鼓掌
因為這也揭示了內建記憶體控制器所產生的好與壞

kuma · 2/16/07

blizzardkk2 說：
延續上一篇不太完整的試驗
http://forum.coolaler.com/showthread.php?t=146074&highlight=opteron+1210+210

這次以同樣2.8G 時脈下作比較

AMD平台: opteron 1210 1.8G OC 2.8G (312x9-1.35V)(極限約3G-1.45V)
PQI DDRII667...

blizzardkk2 說：
小弟認為
E6300 共用2MB快取在單一程式執行時並無雙核心搶快取的情況
但如果是兩個程式皆大量存取資料時呢? 共用的快取到底該提供哪一核心為優先?

而opteron分別配制1M快取則不易發生上述情況
此論點並不代表共用快取時效率較差
而純粹只是猜測...共用快取時..遇到多個程式分別由雙核心大量資料存取...此優勢會消失?
但AM2 opteron所謂的hypertransport 3.0...

您測試的amd系統有支援hypertransport 3.0

reon749 · 2/17/07

控肉有一些運算單元的寬度都是K8的兩倍....
K8一個Cycle只能做一個,控肉可以做兩個,所以SUPERPI這種最單純的計算更可以看出來運算單元寬度的差異,比如說SSE和LOAD 這兩個單元都是
控肉再加上對L2快取加強..所以SUPERPI這種東西可以大幅提升
新K8核心我個人是相當看好,至少和控肉平起平做應該不是問題
不過一切還是靜待新消息^^

睡覺的貓 · 2/17/07

SUPERPI並不把運算的數值存入矩陣型態的倍精度stack中
而是直接以TXT檔型態送入硬碟中
但是一般跑模擬的軟體都會以矩陣處理數值matrix
因為都必須牽連到網格分配
所以SUPERPI的運算時間減少
並不能代表他在跑模擬就同樣順心
但是這種事情輪不到小弟在紙上模擬
會去開發這些simulation soft的公司自會做評估與討論

hodala · 2/17/07

Opteron應該還是會輸,不過應該不會輸這麼多

因為你的Opteron平台設定很怪異,DDR2只有跑DDR2-624 2T而以耶 ???
而且HTT時脈也調低的太離譜了吧
Conroe平台你是跑DDR2-800,K8平台對記憶體頻寬蠻敏感的

真的要準的話,DDR2也都要跑DDR2-800,K8平台上還可以開1T(不會有問題)

睡覺的貓 · 2/17/07

??
那Conroe要不要調4-4-4-12?
敏感是指啥?
網格化模擬時?
還是單指SUPERPI?
記憶體頻寬的考量不是只有1T或2T吧?
這種測試要雞蛋挑骨頭可太多了
回歸工程運算的本質:何時把結果算出來比較重要吧

hodala · 2/17/07

睡覺的貓說：
??
那Conroe要不要調4-4-4-12?
敏感是指啥?
網格化模擬時?
還是單指SUPERPI?
記憶體頻寬的考量不是只有1T或2T吧?
這種測試要雞蛋挑骨頭可太多了
回歸工程運算的本質:何時把結果算出來比較重要吧

DDR2-800跟DDR2-624的差異性太大,這是重點,不會看不出來吧
DRAM timing設定要一樣,這是很基本的出發點吧

睡覺的貓 · 2/17/07

既然Timing要一樣
影響存取速度的CL值好像也要一樣吧?
畢竟單一網格運算後的結果回存影響
不是看匯流排頻寬大小
小弟也不是啥高高手
只是個念和電子電機科系無關的研究生
小弟只是跑cluster的經驗多些
若您覺得小弟回的不好,有失禮貌
小弟在此致歉
讓這篇文章回歸原本討論的工程運算吧

搜尋

Opteron1210 VS E6300 OC 2.8G 工程運算partII

睡覺的貓

進階會員

blizzardkk2

一般般會員

睡覺的貓

進階會員

kuma

進階會員

reon749

高級會員

睡覺的貓

進階會員

hodala

進階會員

睡覺的貓

進階會員

hodala

進階會員

睡覺的貓

進階會員

相關的主題