Epox 8NPAJ +加上爛散步龍2800+

chinjim

榮譽會員
已加入
10/31/03
訊息
1,102
互動分數
0
點數
0
映兒兄
這是我用我的愛機所跑出來的成績,跑是跑下面那一段程式碼
您可以試試看

h=rand(5000,5000);
t=cputime;
h1=inv(h);
cputime-t

matlab1.GIF



居然還要跑130秒左右 :QQQ: ,學校的P4 3.2G 我在找機會偷偷的試試看


再補一張 ATHLON 1G的
matlab2.GIF
 

chinjim

榮譽會員
已加入
10/31/03
訊息
1,102
互動分數
0
點數
0
matlab3.GIF

這是P4 3.2G的成績

matlab4.GIF

這是SP 2400+的成績(並沒有超頻)

我不得不承認在5000*5000的大矩陣下,P4的雙通道狠狠的巴了單通道的SP(754)與SP(462)
一個大巴掌,我必須承認在大矩陣的運算上,我壓錯寶了 :(


PS:
1.這個測試對於SSE3絕對沒有關連,因為P4 是CG版本,不可能有SSE3
2.754的K8我想也是差不多的結果,除非記憶體可以跑同步(這裡是指超頻),要不然在大矩陣的運算中,記憶體的傳輸效率真的非常的重要。在不超頻的狀態下雙通道的P4可以輕鬆贏過單通道的K8與SP
 

alience

進階會員
已加入
9/18/03
訊息
291
互動分數
0
點數
16
k8 3500+未超
117秒,看來P4在這種case底下相當快
會不會因為都是整數的關係??
我比較常用的case如下
clear all
t=cputime;
for L=0:999
for i=0:999
B(i+1,L+1)=exp(-j*2*pi*i*L/1000);
end
end

C=inv(B);
cputime-t
用k8 3500+跑要26秒
程式中常常會有類似的東西去做運算
即使把矩陣加大到3000x3000
P4還是慘敗
不知道您要不要試試看
 

chinjim

榮譽會員
已加入
10/31/03
訊息
1,102
互動分數
0
點數
0
映兒兄
rand是產生所有元素都是小於1的隨機矩陣
我想應該不是整數的問題,不過您的程式我會嘗試一下
不過結果可能要明天嘍!因為該死的學長出現了 :PPP:不趕快把論文趕好
,還是給我摸魚,我還要用他的影像擷取卡咧 ;mtu;

不過您可以試試看,將cputime 放在inv前面一行看看
搞不好有不同的結果
 

alience

進階會員
已加入
9/18/03
訊息
291
互動分數
0
點數
16
Originally posted by chinjim@May 19 2005, 12:54 PM
映兒兄
rand是產生所有元素都是小於1的隨機矩陣
我想應該不是整數的問題,不過您的程式我會嘗試一下
不過結果可能要明天嘍!因為該死的學長出現了 :PPP:不趕快把論文趕好
,還是給我摸魚,我還要用他的影像擷取卡咧 ;mtu;

不過您可以試試看,將cputime 放在inv前面一行看看
搞不好有不同的結果
sorry我說錯啦
應該是實數和虛數的差別才對
用randn取出來的全部都是實數沒錯吧
因為我的程式若是取到5000x5000要跑一段時間
所以都簡化成1000x1000來作測試
你的randn(1000,1000)取inv的確P4 3.2EG跑贏k8 3500+
但是當矩陣內的數值都是虛數來取inv時
結果就反過來了,k8 3500+比P4 3.2EG快上不少
而且在取矩陣的時候k8比P4要來的快@@..沒仔細驗證到底快多少就是了
給你參考一下
我不知道你模擬的環境如何
不過在我的通訊系統中大都是虛數運算就是了
另外跑相同的inv case(只算inv time)
matlab7比matlab 6.5快30%以上
 

alience

進階會員
已加入
9/18/03
訊息
291
互動分數
0
點數
16
Originally posted by alience@May 19 2005, 09:31 PM
sorry我說錯啦
應該是實數和虛數的差別才對
用randn取出來的全部都是實數沒錯吧
因為我的程式若是取到5000x5000要跑一段時間
所以都簡化成1000x1000來作測試
你的randn(1000,1000)取inv的確P4 3.2EG跑贏k8 3500+
但是當矩陣內的數值都是虛數來取inv時
結果就反過來了,k8 3500+比P4 3.2EG快上不少
而且在取矩陣的時候k8比P4要來的快@@..沒仔細驗證到底快多少就是了
給你參考一下
我不知道你模擬的環境如何
不過在我的通訊系統中大都是虛數運算就是了
另外跑相同的inv case(只算inv time)
matlab7比matlab 6.5快30%以上
嘿嘿..再來比較一下P4 2.4g northwood好了
看來northwood同時脈底下取inv實數矩陣竟比k8還快一點點
取inv虛數矩陣則比k8小慢5%
還有可輕鬆看出northwood的inv性能比prescott來的強
但是在fft虛數矩陣的表現下
k8比同時脈的northwood快2.5倍..恐怖的差距
在fft運算時prescott就比northwood強了
不過還是輸k8很多
另外最花時間的其實是取那些矩陣值
而且在這部份P4會慢k8非常多
所以在跑整個case時P4花的時間往往要比k8來的多很多
就拿我之前post的那inv矩陣來說好了
P4 2.4g光取inv比k8 3500+快了0.1秒(3.2 :3.3)
但是跑整個case時k8比P4快一倍不止(k8 24秒,P4 54秒)
 

chinjim

榮譽會員
已加入
10/31/03
訊息
1,102
互動分數
0
點數
0
Originally posted by alience@May 19 2005, 11:00 PM
嘿嘿..再來比較一下P4 2.4g northwood好了
看來northwood同時脈底下取inv實數矩陣竟比k8還快一點點
取inv虛數矩陣則比k8小慢5%
還有可輕鬆看出northwood的inv性能比prescott來的強
但是在fft虛數矩陣的表現下
k8比同時脈的northwood快2.5倍..恐怖的差距
在fft運算時prescott就比northwood強了
不過還是輸k8很多
另外最花時間的其實是取那些矩陣值
而且在這部份P4會慢k8非常多
所以在跑整個case時P4花的時間往往要比k8來的多很多
就拿我之前post的那inv矩陣來說好了
P4 2.4g光取inv比k8 3500+快了0.1秒(3.2 :3.3)
但是跑整個case時k8比P4快一倍不止(k8 24秒,P4 54秒)
抱歉!!老闆突然叫我去台北出差

所以我沒有去做嘗試,映兒兄!RAND取的都是實數沒有錯
之前我是模擬機構方面的測試,是K7/K8大勝P4沒有錯
因為裡面用到極多的極座標,也就是一堆的虛數,不過令我吃驚的是
居然P4在取實數矩陣的反矩陣居然快K7/K8這麼多,這真的讓我很吃驚
之前我還以為是因為雙通道的問題,結果映兒兄的 3500+也被P4打敗
這也證明跟雙通道沒有太大的關係,為什麼P4會大勝,這真的很值得探討。
說到迴圈的問題,P4真的有點給他頓頓的沒有錯,不過MATLAB重要的是
可以向量化,這誰勝誰負,那天真的要來驗證一下!!

不過另類思考一下,如果P4真的在實數方面如此強悍的話,那一般的商業軟體
(指OFFICE 之類的軟體,非ANSYS等軟體),那P4真的是一個好的選擇,
這也搞不好是PCMARK 2004之類的軟體,P4大勝的原因
 

alience

進階會員
已加入
9/18/03
訊息
291
互動分數
0
點數
16
Originally posted by chinjim+May 20 2005, 12:45 PM--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE (chinjim @ May 20 2005, 12:45 PM)</td></tr><tr><td id='QUOTE'> <!--QuoteBegin-alience@May 19 2005, 11:00 PM
嘿嘿..再來比較一下P4 2.4g northwood好了
看來northwood同時脈底下取inv實數矩陣竟比k8還快一點點
取inv虛數矩陣則比k8小慢5%
還有可輕鬆看出northwood的inv性能比prescott來的強
但是在fft虛數矩陣的表現下
k8比同時脈的northwood快2.5倍..恐怖的差距
在fft運算時prescott就比northwood強了
不過還是輸k8很多
另外最花時間的其實是取那些矩陣值
而且在這部份P4會慢k8非常多
所以在跑整個case時P4花的時間往往要比k8來的多很多
就拿我之前post的那inv矩陣來說好了
P4 2.4g光取inv比k8 3500+快了0.1秒(3.2 :3.3)
但是跑整個case時k8比P4快一倍不止(k8 24秒,P4 54秒)
抱歉!!老闆突然叫我去台北出差

所以我沒有去做嘗試,映兒兄!RAND取的都是實數沒有錯
之前我是模擬機構方面的測試,是K7/K8大勝P4沒有錯
因為裡面用到極多的極座標,也就是一堆的虛數,不過令我吃驚的是
居然P4在取實數矩陣的反矩陣居然快K7/K8這麼多,這真的讓我很吃驚
之前我還以為是因為雙通道的問題,結果映兒兄的 3500+也被P4打敗
這也證明跟雙通道沒有太大的關係,為什麼P4會大勝,這真的很值得探討。
說到迴圈的問題,P4真的有點給他頓頓的沒有錯,不過MATLAB重要的是
可以向量化,這誰勝誰負,那天真的要來驗證一下!!

不過另類思考一下,如果P4真的在實數方面如此強悍的話,那一般的商業軟體
(指OFFICE 之類的軟體,非ANSYS等軟體),那P4真的是一個好的選擇,
這也搞不好是PCMARK 2004之類的軟體,P4大勝的原因 [/b][/quote]
其實結果有點讓我訝異
我原本以為P4最擅長的FFT或是DCT等東西會勝過k8
沒想到k8狠狠的贏過P4
可是inv卻只能跟同時脈P4差不多@@
不知道是不是指令中的問題@@
至於商用軟體我本身認知不是很深
但就winstone(office系列,3D rendering)的數據看來P4佔不到上風
但是這些綜合測試軟體數據我一向不看,因為沒有物理意義
坦白說了就是benchmark廠商想讓誰贏誰就贏
跟實際應用差距很大
像是P4跑sysmark,pcmark,sisoft sandra根本無敵
sysmark2002開始根本就在搞鬼,把sysmark2001中AMD贏的filter全部拿掉
(2001中AMD贏的較P4多)
然後用剩下的filter在sysmark2002中重複跑
像這樣的作弊方法也只有benchmark用的出來,所以那些數據根本就是給P4抬轎用
但是在real world應用上P4卻沒幾個軟體能佔到優勢
由此可見這些benchmark的弊端
 

chinjim

榮譽會員
已加入
10/31/03
訊息
1,102
互動分數
0
點數
0
Originally posted by alience@May 20 2005, 01:25 PM

其實結果有點讓我訝異
我原本以為P4最擅長的FFT或是DCT等東西會勝過k8
沒想到k8狠狠的贏過P4
可是inv卻只能跟同時脈P4差不多@@
不知道是不是指令中的問題@@
至於商用軟體我本身認知不是很深
但就winstone(office系列,3D rendering)的數據看來P4佔不到上風
但是這些綜合測試軟體數據我一向不看,因為沒有物理意義
坦白說了就是benchmark廠商想讓誰贏誰就贏
跟實際應用差距很大
像是P4跑sysmark,pcmark,sisoft sandra根本無敵
sysmark2002開始根本就在搞鬼,把sysmark2001中AMD贏的filter全部拿掉
(2001中AMD贏的較P4多)
然後用剩下的filter在sysmark2002中重複跑
像這樣的作弊方法也只有benchmark用的出來,所以那些數據根本就是給P4抬轎用
但是在real world應用上P4卻沒幾個軟體能佔到優勢
由此可見這些benchmark的弊端
在FFT方面我想我會再做一次測試看看,我應該會使用FFT2來做測試
用2維的FFT比較刺激啦 :PPP:,不過這次我應該會用實數和虛數一起
來比較,這次的結果我有點給他難過,居然在INV實數方面,P4居然贏K8
真是有點難過和震驚 。MAYA rendering K7 3200+ 可以跑贏 P4 3.0G沒有問題
render 一張740*480的圖,3200+大概1分30秒,3.0G卻要將近3分鐘
這是我在我女友的公司玩得結果,不過不能貼圖真的很可惜 :co:
 

alience

進階會員
已加入
9/18/03
訊息
291
互動分數
0
點數
16
Originally posted by chinjim+May 20 2005, 01:45 PM--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE (chinjim @ May 20 2005, 01:45 PM)</td></tr><tr><td id='QUOTE'> <!--QuoteBegin-alience@May 20 2005, 01:25 PM

其實結果有點讓我訝異
我原本以為P4最擅長的FFT或是DCT等東西會勝過k8
沒想到k8狠狠的贏過P4
可是inv卻只能跟同時脈P4差不多@@
不知道是不是指令中的問題@@
至於商用軟體我本身認知不是很深
但就winstone(office系列,3D rendering)的數據看來P4佔不到上風
但是這些綜合測試軟體數據我一向不看,因為沒有物理意義
坦白說了就是benchmark廠商想讓誰贏誰就贏
跟實際應用差距很大
像是P4跑sysmark,pcmark,sisoft sandra根本無敵
sysmark2002開始根本就在搞鬼,把sysmark2001中AMD贏的filter全部拿掉
(2001中AMD贏的較P4多)
然後用剩下的filter在sysmark2002中重複跑
像這樣的作弊方法也只有benchmark用的出來,所以那些數據根本就是給P4抬轎用
但是在real world應用上P4卻沒幾個軟體能佔到優勢
由此可見這些benchmark的弊端
在FFT方面我想我會再做一次測試看看,我應該會使用FFT2來做測試
用2維的FFT比較刺激啦 :PPP:,不過這次我應該會用實數和虛數一起
來比較,這次的結果我有點給他難過,居然在INV實數方面,P4居然贏K8
真是有點難過和震驚 。MAYA rendering K7 3200+ 可以跑贏 P4 3.0G沒有問題
render 一張740*480的圖,3200+大概1分30秒,3.0G卻要將近3分鐘
這是我在我女友的公司玩得結果,不過不能貼圖真的很可惜 :co: [/b][/quote]
其實小弟覺得inv這指令在matlab7版中有對P4優化
拿prescott3.2g來跟k8 2.2g比好了
在6.5中隊虛數矩陣取inv成績是半斤八兩
可是到7中P4就領先了
至於fft比較沒什麼差異就是了
 
▌延伸閱讀