AMD的Zen架構搞了很多年了,目前對該架構所知甚少,此前只知道AMD會放棄“推土機”那樣的CMT模塊多核,回歸傳統的SMT同步多線程
另外,在快取的部分也有了重大的變化,Zen架構中每個核心搭配512KB L2,而4個核心將組成一個單元,共享8MB L3快取,與Intel的處理器設計類似。
所以Zen架構中AMD的快取容量看起來小了,但改為包含式快取(inclusive cache),也就是說L1中的數據可以跟L2中的數據共享,這跟Intel的處理器快取設計是一樣的。
不僅如此,AMD的FP單元具備很高的彈性,之前推土機架構中2個128bit浮點單元可以合併執行256bit指令,Zen架構的2個256bit單元理論上可以執行512bit指令,達到Intel Skylake處理器的水平。
推土機/打樁機/壓路機/挖掘機系列的FP單元並不叫很高的彈性,而是權宜過渡的設計,要執行256-bit operand的AVX指令,本來就該有256-bit的AVX單元,但是AMD推土機/打樁機/壓路機/挖掘機系列不具備256-bit的AVX單元,而是指令解碼單元會把1個256-bit的AVX指令解碼成兩個128-bit的內部指令,再給兩個128-bit的單元去執行。
Intel早在2011年的Sandy Bridge,就已經提供兩組256-bit AVX單元了,兩倍於AMD推土機/打樁機/壓路機/挖掘機系列的AVX執行能力.....
http://techreport.com/review/19514/...ture-revealed/2
Bulldozer's 128-bit FMAC units will work together on 256-bit vectors, effectively producing a single 256-bit vector operation per cycle. Intel's Sandy Bridge, due early in 2011, will have two 256-bit vector units capable of producing a 256-bit multiply and a 256-bit add in a single cycle, double Bulldozer's AVX peak.