sorry我說錯啦Originally posted by chinjim@May 19 2005, 12:54 PM
映兒兄
rand是產生所有元素都是小於1的隨機矩陣
我想應該不是整數的問題,不過您的程式我會嘗試一下
不過結果可能要明天嘍!因為該死的學長出現了 :PPP:不趕快把論文趕好
,還是給我摸魚,我還要用他的影像擷取卡咧 ;mtu;
不過您可以試試看,將cputime 放在inv前面一行看看
搞不好有不同的結果
嘿嘿..再來比較一下P4 2.4g northwood好了Originally posted by alience@May 19 2005, 09:31 PM
sorry我說錯啦
應該是實數和虛數的差別才對
用randn取出來的全部都是實數沒錯吧
因為我的程式若是取到5000x5000要跑一段時間
所以都簡化成1000x1000來作測試
你的randn(1000,1000)取inv的確P4 3.2EG跑贏k8 3500+
但是當矩陣內的數值都是虛數來取inv時
結果就反過來了,k8 3500+比P4 3.2EG快上不少
而且在取矩陣的時候k8比P4要來的快@@..沒仔細驗證到底快多少就是了
給你參考一下
我不知道你模擬的環境如何
不過在我的通訊系統中大都是虛數運算就是了
另外跑相同的inv case(只算inv time)
matlab7比matlab 6.5快30%以上
抱歉!!老闆突然叫我去台北出差Originally posted by alience@May 19 2005, 11:00 PM
嘿嘿..再來比較一下P4 2.4g northwood好了
看來northwood同時脈底下取inv實數矩陣竟比k8還快一點點
取inv虛數矩陣則比k8小慢5%
還有可輕鬆看出northwood的inv性能比prescott來的強
但是在fft虛數矩陣的表現下
k8比同時脈的northwood快2.5倍..恐怖的差距
在fft運算時prescott就比northwood強了
不過還是輸k8很多
另外最花時間的其實是取那些矩陣值
而且在這部份P4會慢k8非常多
所以在跑整個case時P4花的時間往往要比k8來的多很多
就拿我之前post的那inv矩陣來說好了
P4 2.4g光取inv比k8 3500+快了0.1秒(3.2 :3.3)
但是跑整個case時k8比P4快一倍不止(k8 24秒,P4 54秒)
抱歉!!老闆突然叫我去台北出差Originally posted by chinjim+May 20 2005, 12:45 PM--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE (chinjim @ May 20 2005, 12:45 PM)</td></tr><tr><td id='QUOTE'> <!--QuoteBegin-alience@May 19 2005, 11:00 PM
嘿嘿..再來比較一下P4 2.4g northwood好了
看來northwood同時脈底下取inv實數矩陣竟比k8還快一點點
取inv虛數矩陣則比k8小慢5%
還有可輕鬆看出northwood的inv性能比prescott來的強
但是在fft虛數矩陣的表現下
k8比同時脈的northwood快2.5倍..恐怖的差距
在fft運算時prescott就比northwood強了
不過還是輸k8很多
另外最花時間的其實是取那些矩陣值
而且在這部份P4會慢k8非常多
所以在跑整個case時P4花的時間往往要比k8來的多很多
就拿我之前post的那inv矩陣來說好了
P4 2.4g光取inv比k8 3500+快了0.1秒(3.2 :3.3)
但是跑整個case時k8比P4快一倍不止(k8 24秒,P4 54秒)
在FFT方面我想我會再做一次測試看看,我應該會使用FFT2來做測試Originally posted by alience@May 20 2005, 01:25 PM
其實結果有點讓我訝異
我原本以為P4最擅長的FFT或是DCT等東西會勝過k8
沒想到k8狠狠的贏過P4
可是inv卻只能跟同時脈P4差不多@@
不知道是不是指令中的問題@@
至於商用軟體我本身認知不是很深
但就winstone(office系列,3D rendering)的數據看來P4佔不到上風
但是這些綜合測試軟體數據我一向不看,因為沒有物理意義
坦白說了就是benchmark廠商想讓誰贏誰就贏
跟實際應用差距很大
像是P4跑sysmark,pcmark,sisoft sandra根本無敵
sysmark2002開始根本就在搞鬼,把sysmark2001中AMD贏的filter全部拿掉
(2001中AMD贏的較P4多)
然後用剩下的filter在sysmark2002中重複跑
像這樣的作弊方法也只有benchmark用的出來,所以那些數據根本就是給P4抬轎用
但是在real world應用上P4卻沒幾個軟體能佔到優勢
由此可見這些benchmark的弊端
在FFT方面我想我會再做一次測試看看,我應該會使用FFT2來做測試Originally posted by chinjim+May 20 2005, 01:45 PM--></div><table border='0' align='center' width='95%' cellpadding='3' cellspacing='1'><tr><td>QUOTE (chinjim @ May 20 2005, 01:45 PM)</td></tr><tr><td id='QUOTE'> <!--QuoteBegin-alience@May 20 2005, 01:25 PM
其實結果有點讓我訝異
我原本以為P4最擅長的FFT或是DCT等東西會勝過k8
沒想到k8狠狠的贏過P4
可是inv卻只能跟同時脈P4差不多@@
不知道是不是指令中的問題@@
至於商用軟體我本身認知不是很深
但就winstone(office系列,3D rendering)的數據看來P4佔不到上風
但是這些綜合測試軟體數據我一向不看,因為沒有物理意義
坦白說了就是benchmark廠商想讓誰贏誰就贏
跟實際應用差距很大
像是P4跑sysmark,pcmark,sisoft sandra根本無敵
sysmark2002開始根本就在搞鬼,把sysmark2001中AMD贏的filter全部拿掉
(2001中AMD贏的較P4多)
然後用剩下的filter在sysmark2002中重複跑
像這樣的作弊方法也只有benchmark用的出來,所以那些數據根本就是給P4抬轎用
但是在real world應用上P4卻沒幾個軟體能佔到優勢
由此可見這些benchmark的弊端