还记得在2007年年中的时候,英特尔一举推出了采用Merom核心且接口为Socket P的Core 2 Duo处理器、965系列芯片组、4965AGN无线网络模块以及创新性的迅盘模块。这四大主要配件的推出彻底地将笔记本平台拉至了第四代,这也直接导致了从2007年6月份开始至今,“迅驰4”、“Santa Rosa”等这些名字几乎成为人们餐前饭后的家常话题。
当然对于半导体类产品来说,摩尔定律就是其发展方向,并且以现在的趋势来看半导体产品的发展速度也早已突破摩尔定律18个月为一个翻倍周期的“限制”。就在消费者没还未对迅驰4平台充分的进行品尝的同时,英特尔就更加快速的在2008年1月8日推出了迅驰平台的升级版。与早先代号为NAPA的迅驰3代平台升级后的代号相同,本次迅驰4平台的升级也同样被称为Santa Rosa Refresh。
不过与之前推出迅驰4平台时的万马千军不同,本次Santa Rosa Refresh平台的推出仅是对处理器部分进行了较大的调整,将原先采用65nm制程的Merom核心处理器直接升级到了采用45nm制程的Penryn核心处理器。
这也使2008年1月份的笔记本市场与一直被期待的代号为Montevina平台更近了一步。在晶体管数量上,45nm的双核心Penryn处理器在65nm Merom处理器2.93亿个的基础上提高到了4.1亿个。
这次英特尔借Santa Rosa Refresh平台带来了5款新处理器,分别以T8XXX与T9XXX来命名,其中还包括一款X9000顶级处理器。需要说明的是,由于芯片组并没有改变所以这次新近推出的5款处理器均同样采用了Socket P接口。也正是介于此,对于许多采用了965系列芯片组的旧平台来说,本次针对Santa Rosa Refresh平台完全可以达到平滑升级。
但据业内人士称:如果想要稳定的运行Penryn处理器,则需要给主板 额外添加一颗专用芯片。但至于这块芯片到底用在何处,目前并不明了。但编辑猜测该芯片应当与处理器供电有关。
这样的设定打破了当前迅驰4平台升级45nm Penryn的梦想。不过也不排除第三方厂商通过BIOS对处理器内部某些功能进行限制以达到平滑升级的目的。不过在评测的同时,编辑将一颗T7250处理器安装在Penryn的平台上,笔记本完全能够正常启动且运行相应的测试软件。
另外本次对处理器的提升比较明显的地方就是二级缓存部分的扩容。在发布的两款T8XXX处理器中,二级缓存被提升至了3MB;而T9XXX与X90003款处理器的二级缓存则为6MB。更大的二级缓存将为数据带来更多的预读机会从而有效的提升系统运行速度。
目前已推出采用Penryn核心处理器
|
型号
| 主频
| 二级缓存大小
| 前端总线频率
| 所属平台
|
Intel Core 2 Duo T8100 | 2.1GHz | 3MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo T8300 | 2.4GHz | 3MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo T9300 | 2.5GHz | 6MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo T9500 | 2.6GHz | 6MB | 800MHz | Santa Rosa Refresh |
Intel Core 2 Duo Extreme X9000 | 2.8GHz | 6MB | 800MHz | Santa Rosa Refresh |
拜45nm所赐,我们可以看到Penryn核心的处理器在内核面积上已经较Merom处理器有了相应的缩小,这在一定程度上给未来处理器的成本降低提供了可能。另外,我们也发现处理器背面的贴片元件也有所改变,最大的差别是两者陶瓷电容以及电阻的数量比例发生调换。
在2007年11月16日的时候,英特尔正式向业界推出了采用45nm制程的半导体成品。而本次新技术的全称为“英特尔45nm高K金属栅硅制程技术”,是半导体行业近40年来的重要创新。这一制程技术的创新,也令是英特尔TICK-TOCK产品发展战略更加向前迈进了一步。
在早先的半导体产品中,业界一向采用二氧化硅作为晶体管栅的主要介质。比较显著的是在原先65nm制程中,英特尔已经成功的将以二氧化硅作为主要介质的晶体管栅压缩到了仅有5个原子厚的1.2nm。在人们被这种近乎奇迹的先进技术所折服的同时,英特尔本身也在该方面遇到了问题,那就是过薄的二氧化硅栅介质导致了上层栅极漏电率的大幅度提升。实际上这也是传统的二氧化硅技术所遇到的“极限”。
被摩尔定律所“驱赶”的英特尔在新的45nm产品中引入了“High-K”技术。新技术采用了铬元素为主要材质,其较以往二氧化硅有着更好的绝缘性以控制来自于晶体管栅极的漏电。但是由于与原先晶体管介质完全不同,所以英特尔也拿出了相应的栅极材料增大了20%以上的源头至漏极驱动电流,同时不但将晶体管效能进行了提升还将源极至漏极之间的漏电率降低5倍之多。当然,对于这个具有丰功伟绩的材料,英特尔将其命名为“Metal Gate”,但并没有将其所使用的合金材料的具体细节进行公布。
High-k栅介质与Metal Gate栅极的引入能够使得晶体管漏电率较之传统材料降低10倍以上,与65nm制程工艺相比能够在相同耗能下提升20%的时钟频率亦或是在相同时钟频率下拥有更低的耗能。45nm晶片每秒钟能够进行约三千亿次的开关动作,在以铜与low-k材料搭配组成的内部连接线的作用下,晶片开关速度能够提升20%且耗电量降低30%
并非只有进程方面的提升,与Merom及前一代处理起比起来,Penryn处理器的变化是相当大的。而相对于抽象的材质变更来说,多媒体指令集以及功能方面的提升显得更加令人激动。需要说明的是,虽然英特尔给45nm的Penryn处理器加入了多项全新的设计并把它们统称为增强型酷睿微架构,但是与早先的Merom处理器相同,其仍旧属于酷睿家族的一员
·劳苦功高的SSE多媒体指令集
众所周知,在第一代多媒体指令集MMX被推出以来,几乎每隔几代处理器英特尔都会对其内置的多媒体指令集进行更新。而目前英特尔的第五代Streaming SIMD Extension 4(SSE4)指令集除扩展Intel 64位指令外,还新增对于影像编辑、视讯编码、三维渲染以及游戏应用等方面的指令,使得处理器的效能更进一步。
本次升级的第五代SSE4多媒体指令集将分为SSE4.1以及SSE4.2两个版本,而这次Santa Rosa Refresh平台所升级的Penryn处理器则使用了其中的SSE4.1指令集。更新后的SSE4.1多媒体指令集共增加了47条指令并且引入了两组不同的32-bit向量整数乘法运算单元能够对八位无符号最大值以及最小值运算提供支持。另外新加入的16-bit/32-bit有符号和无
符号运算支持,能够有效改善编译器执行效率并提升向量整数以及单精度代码的运算能力。

不仅如此新加入了6条浮点型点积运算指令的SSE4.1已经能够对单精度、双精度浮点运算及浮点产生操作提供支持,且额外的IEEE 754指令(包含Nearest、-Inf、+Inf、与Truncate) 也可以保证转换路径模式立即运行,在减少了系统延迟时间的同时也对3D应用给与了极大的便利。
得益于以往SSE多媒体指令集的优势,处理器在视频编码上也颇具优势。本次的SSE4.1多媒体指令集中增加的串流式负载指令,能够提高图形帧缓冲区的读取数据带宽,可以在理论上获得更加完整的缓存行并以64字节的数据线宽读取显卡帧缓冲区,相较以往的8字节架构有很大程度的速度提升。
·超级Shuffle同样功不可没
仅仅拥有新的多媒体指令集仍旧不够,Penryn处理器内置的超级Shuffle引擎和SSE指令集能够相互关联,使多媒体指令运算效率获得较大幅度的提升。

超级Shuffle引擎效果惊人
以往在处理128位宽度的字节、字以及Dword SSE数据时,处理器并不能将这些整合在单一周期内运行,必须将一个128位数据拆成2个64位进行处理器,当然再加上处理数据的时间则一共需要2个周期。但超级Shuffle引擎设计可以允许处理器在不经过软件部分改良的基础上将多种性质的128位SSE指令放在1个周期内完成。
·除法器更新配合二级缓存分组
·新一代Radix-16处理器赋予Penryn更快的速度
在拥有酷睿架构的一系列优点之外,新的45nm Penryn处理器进一步的改良了除法器的设计,对比早先的产品提升了约2倍左右的性能。新的除法器被称为“Radix-16”,对比以往的Radix-4或者Radix-2除法器,后者在单一周期内只能传递2bit数据,而新的快速Radix-16除法器则可以传递4bit数据。
也就意味着Penryn处理器能够达到单周期处理多达4个指令,并且14层流水线设计也提升分支预测的能力及准确性,分支预测的带宽提升至20byte (K8、Banias 为16byte,Netburst为4byte),令指令执行效率大大提高。新的Radix-16除法器在大幅改善宽位动态执行的效率的同时,也在加速浮点以及整数的除法运算速度,在针对科学计算、数学运算以及3D坐标的转换中有着较大程度的提高。
说到快速操作系统原语支持是指,当操作系统遇到临时阻碍、遮蔽中断指令且影响关键代码区段,或者是类似输入输出设备需要独占存取等情况的时候,处理器可以快速的中断遮蔽控制机能,清除以及重置中断,并快速进、出此状态模式,大幅改善该类型操作。基于此,Penryn可以快速执行XCHG、ADD、XADD、NEG、BTS、AND、CMPXCHG等锁定指令,以及快速存取读取时间印记计数器。英特尔称:快速操作系统原语支持技术可提高2倍的执行效率,对数据库服务器、交易处理服务器等应用有特别明显的性能提升。Intel经由强化微架构设计,缩短VT-x指令转换虚拟主机进入、离开时间,无须修改现有虚拟主机软件,就能增加25%~75%的执行效率。
小群组拥有大能力,Associativity技术大幅提高缓存命中率
对于处理器另一个重要的部分,相信很多资深的DIY玩家会选择其高速二级缓存。对于处理器来说,高速二级缓存是介于处理器与系统之间的一个缓冲区,处理器会对缓存内的数据进行预读以提高程序及指令的运行效率。新的45nm Penryn处理器在高速缓存上加入了一种“小群组”概念并称其为“Associativity”,该技术将高速缓存分割成多个区块。这样做的好处是可以加速数据读出以及写入,而不用在容量日趋增大的缓存中对数据进行查询。
由于这种小群组的个数跟快取失误率及额外的延迟时间有关,所以小群组的数量越多便能够降低数据覆盖的几率,减少快取失误几率从而提高命中率。相比以往的16路设计,Penryn处理器在此基础上增加到了24路,以目前Penryn处理器的二级缓存数量来看,理论上可以更加进一步的降低失误率。
需要说明的是,这种“Associativity”也是一柄双刃剑。处理器会因为缓存中小群组数量过多,会逐一的按照群组对数据进行查询,这样的后果就是延迟时间不但不会缩短,反而会变得更长。
另外在本次推出的5款Penryn处理器中并不是所有的型号都具备有24路Associativity技术,其中内置有3MB缓存的Core 2 Duo T8100与8300就只有12路Associativity,而二级缓存为6MB的T9300与9500才拥有24路组联。
·内存控制不能轻视 深度睡眠更加省电
·增强型Store Forwarding技术让处理器提前加载结果
Penryn处理器也在为进一步改善系统内存性能做出了不小的贡献。在早先Merom核心处理器只能做到内存访问的基础上,Penryn加入增强Store Forwarding功能。该项功能可以加速读取管线中超过8字节地址范围的储存结果。让处理器不必等待结果写入内存中就能提前加载储存结果,有效地降低延迟。
·C6深度睡眠 让笔记本电脑续航能力更长
功耗控制是针对移动平台处理器的一个较大问题。由于笔记本电脑等移动设备所装备的锂离子电池容量有限,所以一款能够对功耗有着完美控制的处理器就显得颇为必要。相比较以往,45nm的Penryn处理器加入了Enhanced Deeper Sleep C6模式与Enhanced Dynamic Acceleration Technology(增强型动态加速技术)。
“深度电源关闭技术”是一个全新的处理器空闲电源管理技术,可让处理器的功耗在空闲状态下核心电压大幅度降低,同时缓存中的数据会被转移并将其完全关闭。由于全新的休眠方式可以进一步降低处理器核心电压并关闭所有的缓存,所以能够为笔记本电脑带来更加显著的续航时
但事有利弊,处理器从节能到全速运行需要一个转换的时间,尽管这个时间还是相当短暂的,但依旧会成为对性能的一个影响因素。不过我们也有理由相信,对比更长的续航时间,些许的等待应该也是值得的。