完整的SSE4(Streaming SIMD Extensions 4,流式单指令多数据流扩张)指令集共包含54条指令,其中的47条指令已在45nm的Core 2上实现,称为SSE 4.1。
SSE 4.1指令进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体应用上的性能,主要针对向量绘图运算、3D游戏加速、视频编码加速及协同处理的加速。英特尔說SSE4指令在45纳米Penryn核心额外提供了2个不同的32位向量整数乘法运算支持,并且在此基础上还引入了8位无符号最小值和最大值以及16位、32位有符号和无符号的运算,能够有效地改善编译器编译效率,同时提高向量化整数和单精度运算地能力。另外,SSE4.1还改良了插入、提取、寻找、离散、跨步负载及存储等动作,保证了向量运算地专一化。
SSE4.1还加入了6条浮点型运算指令,支援单、双精度地浮点运算及浮点产生操作。其中IEEE 754指令可实现立即转换运算路径模式,大大减少延迟,保证数据运算通道的畅通。而这些改变,对于进行3D游戏和相关的图形制作是具有相当深远的意义。除此之外,SSE4.1指令集还加入了串流式负载指令,可提高图形帧缓冲区的读取数据频宽,理论上可获取完整的缓存行,即单次性读取64位而非原来的8位 ,并可保持在临时缓冲区内让指令最多带来8倍的读取频宽效能提升。对于图形处理器与中央处理器之间的数据共享起到重要作用。
SSE4.1指令集指令集主要是针对图形及视频编码方面进行了优化,特别是引入了8位无符号最小值和最大值以及16位、32位有符号和无符号的运算,能够有效地改善编译器编译效率,大大减少视频解码处理的时间。所以顺着这个思路,编辑决定把集成有SSE4.1指令集的Penryn核心与传统的处理器进行视频解码速度的对比,由此可以直观的分析出性能提升的幅度。
SSE4.1指令集讓多媒体处理能力得到最大70%的提升。SSE4加入了6条浮点型点积运算指令,支持单精度、双精度浮点运算及浮点产生操作,且IEEE 754指令 (Nearest, -Inf, +Inf, and Truncate) 可立即转换其路径模式,大大减少延误,这些改变会对游戏及 3D 内容制作应用有重要意义。此外,SSE4加入串流式负载指令,可提高以图形帧缓冲区的读取数据频宽,理论上可获取完整的快取缓存行,即每次读取64Bit而非8Bit,并可保持在临时缓冲区内,让指令最多可带来8倍的读取频宽效能提升,对于视讯处理、成像以及图形处理器与中央处理器之间的共享数据应用,有着明显的效能提升。
SSE4指令集让45nm Penryn处理器增加了2个不同的32Bit向量整数乘法运算单元,并加入8位无符号(Unsigned)最小值及最大值运算,以及16Bit及32Bit有符号 (Signed) 运算。在面对支持SSE4指令集的软件时,可以有效的改善编译器效率及提高向量化整数及单精度代码的运算能力。同时,SSE4改良插入、提取、寻找、离散、跨步负载及存储等动作,令向量运算进一步专门。
作为在指令集方面的最大改进,SSE 4.1增加了47条指令,着重改善多媒体方面的性能,而据英特尔官方人士称,在SSE 4.1指令集的测试中,使用最新的Divx编码压缩视频,即使相比更高主频的酷睿处理器,Penryn核心处理器依舊领先105%以上。为了测试SSE 4.1指令集的实际效能,采用支持SSE 4.1指令集的Divx 6.8编码器,以VirtualDub为平台,压缩一部1080P的影片,测试SSE 4.1指令集带来的改进。
但是测试结果可以说非常不理想,在开启了SSE 4.1支持之后,压缩时间从104分钟增长为123分钟,反而延长了18.27%。看来即使是最新的Divx,对于SSE 4.1的支持依旧不太理想。SSE 4.1指令集带来的改进,只能是期待真正支持
酷睿2四核处理器45nm,其优点在于进一步的压缩了处理器线路与晶体管的尺寸,紧凑的方式会使处理器在游戏、高清视频等方面实现更高的性能表现,同时也让CPU功耗更低,这更加适合用户进行影音娱乐,因为在看高清电影时,不仅需要处理能力更流畅,也更喜欢电脑运行更安静,相比上一代酷睿2处理器,45nm酷睿2四核处理器在获得40%性能提升的同时也把功耗降低了40%,这让酷睿2四核电脑更加适合高清娱乐,同时更低的功耗,也让厂商可以把家用电脑做的更小、更时尚,噪音也更小,寿命也更长。
相比普通双核电脑,酷睿2四核电脑的性能翻倍,功耗却控制的更低,那么是否意味着,它的成本也翻倍呢?实际上并非如此,由于45纳米技术的不断成熟,酷睿2四核CPU的售价已经不再非常高,甚至有的酷睿2四核CPU与双核CPU持平,譬如酷睿2双核E8000系列和四核Q8000系列的价格差距就相当小,使得众多PC厂商纷纷推出酷睿2四核台式机。而从市售产品情况来看,酷睿2四核的分布非常广泛,有4000元以内的低价机型,也有5000元左右的主流娱乐机型,更有价格8000元甚至万元的高端机型,而且性价比表现都非常不俗,对于消费者而言,则可以根据个人实际应用需要,买到一款适合自己的酷睿2四核电脑。
酷睿2 E8200(45nm,LGA775,2.66GHz,外频333MHz,倍频8,前端1333MHz,L2=6MB)Wolfdale核心架构,由4.1亿个晶体管组成,相比之前65nm的2.91亿个晶体管有了很大的提升,其支持MMX、SSE、SSE2、SSE3、SSSE3、SSE4.1多媒体指令集,具备EM64T 64位运算指令集、EIST节能技术。由于采用45nm工艺,拉高了节能和静音超频能力。
酷睿2 Q9300(45nm,LGA775,2.5GHz,外频333MHz,倍频8,前端1333MHz,L2=6MB)核心属于Yorkfield,P35主板都可支持。目前Q9300和其他9系列产品相比,在二级缓存上是有所缩减的。Q9450、Q9550拥有12MB的二级缓存,而Q9300只具备6MB的二级缓存,整整缺少了一半,这可能是Intel有意屏蔽了Wolfdale二级缓存后的结果,配合全新的倍频模式,Intel能够将产品的定位更加精确化,甚至每20美元的间隔都将出现一款Intel的产品。而其他的主要参数,Q9300和9系列产品都是完全一样的。
和Q6600参数相比,Q9300有着明显的优势。在制造工艺上,Q9300(45nm),Q6600(65nm);前端部分Q9300(1333MT/s,快取6m),Q6600(1066MT/s,快取8m);晶体管数量上二者的差距也很大,兩者最大不同是Q9300增加了SSE4.1指令集。在具備新指令集的應用軟件中,Q9300能够表现得更加得心应手。
作为Q6600的取代者Q9300有着不争的优势:全新的工艺、前端從1066拉升1333、增加SSE4指令集、电源管理的完善以及处理器微架构的改变。Q9300的二级缓存雖然缩减為6MB,但性能实测并不影响Q9300的表现。
作为近年来在指令集方面的最大改进,SSE 4.1增加了47条指令,着重改善多媒体方面的性能,而据英特尔官方人士称,在SSE 4.1指令集的测试中,使用最新的Divx编码压缩视频,即使相比更高主频的酷睿处理器,Penryn核心处理器依旧可以领先105%以上。为了测试SSE 4.1指令集的实际效能,我们采用支持SSE 4.1指令集的Divx 6.8编码器,以VirtualDub为平台,压缩一部1080P的影片,测试SSE 4.1指令集带来的改进。
但是测试结果可以说非常不理想,在开启了SSE 4.1支持之后,压缩时间从104分钟增长为123分钟,反而延长了18.27%。看来即使是最新的Divx,对于SSE 4.1的支持依旧不太理想。SSE 4.1指令集带来的改进,只能是期待真正支持的软件发布,才能进行全面的测试。