Merom T7400 VS Yonah T2600

goldie

初級會員
已加入
6/4/05
訊息
17
互動分數
0
點數
0
Sander 說:
你忘了差異最大的部份
Merom/Conroe有四個decoder...

=恕刞=

哈哈^^" 謝謝你講得讓我更清楚了,又學了一課!@@ :D

我的拋磚效果不錯 ;em25; …
 

goldie

初級會員
已加入
6/4/05
訊息
17
互動分數
0
點數
0
Sander 說:
16-way associative 256-bit寬的Shared L2 Cache可不是做假的啊
我只能說...Intel你的SRAM技術真的比AMD強好多!

沒錯!! Agree...
好像 P!!!, K7 時代時...
L2 技術差別就已經是這樣 (只差在現在因雙核心而多加 Share L2 技術)

那時 K7 C/P 值雖高
但我已注意到 AMD 的 L2 Cache 沒 Intel P!!! 的 L2 Cache 之 Bus Width 為 256-bits (還是 128-bit 忘了,請高人指點一下 ;em03; ) 來的猛
這是很少人發現的地方

結論一: Intel 的 L2 Cache 技術不是蓋的 (用K8的人注意一下,CPU-Z 第二頁有顯示 L2 的 Bus Width: 128-bits)

我還發現那時候「圖拉丁」核心的 L2 Cache 還支援了少見的「ECC」功能
(偵錯並自我回復之功能)

結論二:Intel 的 P6 架構真是活超久了,雖然之前被 P4 的 NetBurst 架構「假性的」壓下去,結果現在呢? Intel 又捨棄 NetBurst 回頭從 P-M: Banias → Dothan → Yonah → Merom 一路持續發展上來
 

kool

☆ Share Moment ☆
已加入
2/19/04
訊息
5,079
互動分數
0
點數
0
網站
www.flickr.com
tingting 說:
好東西啊!不知開賣沒有

C大測的是ES版而已...

要買到大概年中後了,I大哥的說法是第三季發表 ;0a155537;
 

coolaler

FANGBING LO (Robinson Lo)
已加入
9/17/03
訊息
53,151
互動分數
635
點數
113
位置
Taichung
網站
www.coolaler.com
kool 說:
C大測的是ES版而已...

要買到大概年中後了,I大哥的說法是第三季發表 ;0a155537;
筆電廠都準備好了
就等Intel點頭 ;)
 

sxs112.tw

榮譽會員
已加入
9/18/03
訊息
4,835
互動分數
0
點數
36
年齡
40
goldie 說:
那麼 Merom = Yonah + EM64 + 2倍L2 + Macro Ops Fusion + 直接L1跟另一顆L1傳輸 + 更高的L2核心頻寬 + 頻寬更寬的 SSE2/SSE3 指令集 (提升到 128-bit)+ 2個FPU + SSE4?(聽說有新增幾個指令集,但未正式命名)

撇開兩倍L2跟新增64位元支援不說…
單就對於現今 32 位元的電腦來說
我注意到了 Merom 有2個重點:
  1. 頻寬更寬的 SSE2/SSE3 指令集 (提升到 128-bit)
  2. Cache 傳輸能力的增強 (直接L1-L1傳輸 + 更高的L2核心頻寬)

因為現今大都人都還在 Win32 作業系統,灌 x64 版的XP、2003 Server 的不多
而且就算是用 64-bit 作業系統,但目前軟體大多數還是 32-bit
32-bit 的軟體雖然可以在 Windows x64 上跑,但是就會無法“完全”發揮出 64 位元應有的效能
所以 EM64 功能目前無法提升多少爽度 XDDD

而 Merom Added SSE4 所新增的指令個人也不多
反而目前常見軟體還在對行之有年的 SSE2 跟 SSE3 指令集優化的較多
所以...加大 SSE2/SSE3 的頻寬所帶來的效能提升
是顯住的 (因為有此指令集支援的軟體較多,光是支援到 SSE3 的軟體就不多了,何況是剛出的 SSE4)
Cache 的性能提升,我想也是顯著的!
不管是 Win32 或 x64 都會有所性能提升
必竟是 Cache 是純硬體方面的東西。執行任何程序,一定會用到 (廢話 ^^|||)
(不像指令集 MMX、SSE、SSE2、SSE3,得軟體有支援,才會被用到)
(其實老實講,很多小軟體、辦公軟體,其實都只用到 X86 的基本指令集,啥米 MMX、SSE 都沒用到)

----
以上,是我個人認為同時脈下, Meron 會比前一代的 Yonah 性能更強的「主要原兇」 XD ;em03;

有講錯的地方,歡迎指正 :D

「Merom New Instruction(MNI)」這個東西應該還是會稱為SSE4吧.....雖然現在Intel不承認...
 

coolaler

FANGBING LO (Robinson Lo)
已加入
9/17/03
訊息
53,151
互動分數
635
點數
113
位置
Taichung
網站
www.coolaler.com
coolaler 說:
7600GT退下,換7900GTX上場 (No mod):PPP:
3DMark01 999fps again :D futuremark

4.JPG


3d01_1.gif

記憶體參數調緊一些,3DMark01進步了180分

3d01_2.gif
 

itany

一般般會員
已加入
4/20/06
訊息
56
互動分數
0
點數
0
您說的沒有錯,我是在Mainland。
如果就是看不到的話,那我就不必反復刷新了。 ;oq;
微軟的輸入法很好,很容易輸入傳統漢字,呵呵。不然我只能使用簡化漢字了
 

itany

一般般會員
已加入
4/20/06
訊息
56
互動分數
0
點數
0
goldie 說:
那麼 Merom = Yonah + EM64 + 2倍L2 + Macro Ops Fusion + 直接L1跟另一顆L1傳輸 + 更高的L2核心頻寬 + 頻寬更寬的 SSE2/SSE3 指令集 (提升到 128-bit)+ 2個FPU + SSE4?(聽說有新增幾個指令集,但未正式命名)

撇開兩倍L2跟新增64位元支援不說…
單就對於現今 32 位元的電腦來說
我注意到了 Merom 有2個重點:
  1. 頻寬更寬的 SSE2/SSE3 指令集 (提升到 128-bit)
  2. Cache 傳輸能力的增強 (直接L1-L1傳輸 + 更高的L2核心頻寬)

因為現今大都人都還在 Win32 作業系統,灌 x64 版的XP、2003 Server 的不多
而且就算是用 64-bit 作業系統,但目前軟體大多數還是 32-bit
32-bit 的軟體雖然可以在 Windows x64 上跑,但是就會無法“完全”發揮出 64 位元應有的效能
所以 EM64 功能目前無法提升多少爽度 XDDD

而 Merom Added SSE4 所新增的指令個人也不多
反而目前常見軟體還在對行之有年的 SSE2 跟 SSE3 指令集優化的較多
所以...加大 SSE2/SSE3 的頻寬所帶來的效能提升
是顯住的 (因為有此指令集支援的軟體較多,光是支援到 SSE3 的軟體就不多了,何況是剛出的 SSE4)
Cache 的性能提升,我想也是顯著的!
不管是 Win32 或 x64 都會有所性能提升
必竟是 Cache 是純硬體方面的東西。執行任何程序,一定會用到 (廢話 ^^|||)
(不像指令集 MMX、SSE、SSE2、SSE3,得軟體有支援,才會被用到)
(其實老實講,很多小軟體、辦公軟體,其實都只用到 X86 的基本指令集,啥米 MMX、SSE 都沒用到)

----
以上,是我個人認為同時脈下, Meron 會比前一代的 Yonah 性能更強的「主要原兇」 XD ;em03;

有講錯的地方,歡迎指正 :D

我想對您說的補充一下。
首先是執行單元。Yonah有兩個整數單元(ALU),而且都是32bit,Merom有三個64bit ALU。Merom和Yonah都是具有2個浮點單元(FPU),然而Merom的是128bit,Yonah是64bit,以此Merom可以同時計算4個64bit浮點運算。Merom具有三個128bit SSE單元,而Yonah具有兩個64bit單元,因此Merom可以同一個時鐘周期計算3個128bit SSE,而Yonah將兩個單元共用計算1個128bit SSE。因此,Yonah是不能支持64bit的。而且Merom的執行單元比較前者豐富的很多。
其次是Cache的帶寬。Merom的L2是通過256bit與内核相連接的,而Yonah是128bit,相同時鐘下快一倍。Merom L2是16way,而Yonah是8way,命中率會同時提高。而且,Merom的L1預取器每個核心比較Yonah增加了一個,L1更加有效能。
還有必須指出的是内存訪問技術Merom也有比較大的改進。它可以更加靈活的安排内存的讀取,(其中涉及到歧義消除,比較複雜),使得内存的數據可以儘早的調入到Cache�面,使得CPU不需要等待相對緩慢的内存而浪費大量的時間。
最後,Merom每周期可以處理4條指令,而Yonah是3條。Merom可以看到更多的micro-ops(經過處理的指令),可以安排更佳的執行。

由此,Merom相對Yonah更快是必然的。現在的測試數據我認爲還比較薄保守。Merom的結構實際上个更適合64bit運行,在32bit環境下,很多處理的資源都被浪費了。如果使用64bit Win Vista/2003(事實上64bit Win XP 就是 2003)和64bit軟件,性能會有較大提升。另外就是軟件的優化。現在Intel Compiler是爲了Netburst運行的更快,而損害了Yonah/Merom的速度。等到Merom及其兄弟上市之後,Intel就會轉向新架構的優化,這時速度還會有一定的提升。

我使用的稱謂是簡化漢字翻譯下的稱謂,希望您能理解。 ;em03;
 

itany

一般般會員
已加入
4/20/06
訊息
56
互動分數
0
點數
0
goldie 說:
沒錯!! Agree...
好像 P!!!, K7 時代時...
L2 技術差別就已經是這樣 (只差在現在因雙核心而多加 Share L2 技術)

那時 K7 C/P 值雖高
但我已注意到 AMD 的 L2 Cache 沒 Intel P!!! 的 L2 Cache 之 Bus Width 為 256-bits (還是 128-bit 忘了,請高人指點一下 ;em03; ) 來的猛
這是很少人發現的地方

結論一: Intel 的 L2 Cache 技術不是蓋的 (用K8的人注意一下,CPU-Z 第二頁有顯示 L2 的 Bus Width: 128-bits)

我還發現那時候「圖拉丁」核心的 L2 Cache 還支援了少見的「ECC」功能
(偵錯並自我回復之功能)

結論二:Intel 的 P6 架構真是活超久了,雖然之前被 P4 的 NetBurst 架構「假性的」壓下去,結果現在呢? Intel 又捨棄 NetBurst 回頭從 P-M: Banias → Dothan → Yonah → Merom 一路持續發展上來

我贊同您的結論和觀點
如果我沒有記錯,P M (含Yonah)L2都是128bit寬度,而P4是256bit。但是,考慮到P4的L1太小,L2應該做的快一些。
而且,AMD的K7/K8有重要的缺陷。雖然K8是3組ALU,比較Yonah多了1組,但是K8在讀入操作數的時候發動的比Yonah要晚得多,以至於不能及時地把數據讀入L1,使得ALU得不到數據而閒置!同時,如果内存延遲(latency)較大,如DDR2,那麽ALU延遲的就更多,以至於帶來災難性的後果!這就是AM2平臺性能沒什麽提升的重要原因! ;tongue;
 

wantcoco

進階會員
已加入
8/5/04
訊息
173
互動分數
0
點數
0
恩恩,詳細的測試、精闢的見解!
不過小弟愚頓,不能完全理解XD......但Merom比K8,那個好是知道的。
 
▌延伸閱讀