强大的每瓦特性能:相比上代产品最高带来40%整体功耗降低
英特尔在14代酷睿桌面系列处理器上,史无前例的将处理器的主频推高至6.2GHz,在带来大幅度性能提升的同时,也使得整个处理器的性能功耗比以及工作状态的功耗变得糟糕了起来,部分处理器300W以上的瞬时功耗,给散热系统和供电系统都带来了巨大的压力,同时也影响了整体平台的性能表现。

在新的Arrow Lake上,英特尔彻底改变了依靠频率、功耗来提升性能的路线,重新将设计目标确立在大幅度降低整体功耗、大幅度提高处理器性能功耗比,同时保持优秀的游戏性能以及强悍的AI加速能力等。英特尔宣称,Arrow Lake系列处理器只需要上一代处理器一半的功耗就能够发挥出相同的性能。回顾历史的话,英特尔上一次带来如此巨大的性能功耗比提升,正是高频率的Pentium 4处理器落幕、创新的酷睿系列登场的时候,随后英特尔进入了长达十年的辉煌周期。这一次,我们也希望Arrow Lake开启英特尔新一轮的技术爆发和产品领先。

那么,英特尔是如何实现Arrow Lake整体功耗降低、性能功耗比提升的呢?英特尔在这里提到了3个关键的技术,那就是新的性能核心架构Lion Cove、新的能效核心Skymont以及全新的Foveros封装技术。当然,英特尔在处理器核心工艺方面也有极大的变革,新的处理器计算核心采用了TSMC N3B工艺,相比前代产品的intel 7工艺整体效能表现更为出色。这也是Arrow Lake重要的变化之一。
此外,Arrow Lake目前最高可以配置8个性能核心和16个能效核心,带来最多24个线程,整体多线程数量虽然变少,但是性能反而比上代产品提升最多15%。新的Xe-LGP也带来了新的AV1编解码功能,媒体性能也到了显著提升。
Skymont和Lion Cove的重大变革:强悍的CPU微架构
和面向移动设备的Lunar Lake有所不同的是,由于面向桌面的Arrow Lake在功耗、空间方面更为宽裕,因此其处理器架构系统设计也显得更为“大方”,比如更多的核心、更大的缓存、更强悍的IO模块等。当然,这一切的的“大方”,都离不开整个CPU微架构的提升。Arrow Lake采用CPU微架构代号分别是Skymont和Lion Cove,其中前者为能效核心,也就是E-Core的微架构,后者则是性能核心,也就是P-Core的微架构。

英特尔的数据显示,Skymont的微架构IPC相比上代Gracemont提升高达32%,已经基本和上代P-Core也就是Raptor Cove性能持平。而Arrow Lake的P-Core采用了全新的Lion Cove微架构,整体性能则相比Raptor Cove提升了高达9%。从这个角度来说,Arrow Lake看起来根本不像是“大小核心”架构,而更像是“大+超大”核心架构。
更具体一些来看。Skymont微架构的提升主要有以下几个方面:
一是分支预测部分大幅度拓宽,性能得到了显著提升。

二是指令解码部分采用了3个3宽度的解码器,整体实现了9宽度的解码(这也是目前解码宽度最宽的x86处理器微架构)。对应的Uop队列深度大幅度加强、并行度大幅度提升,整体解码性能也大幅度增加。
三是乱序执行部分的解码模块规模暴增,同时带来名为Dependency Breaking的新功能,大幅度降低了指令依赖性。

四是指令资源部分也大幅度加强。包括ROB队列、物理寄存器、针对不同指令的队列深度都带来了更大幅度的正面加强。写入缓存容量更为巨大,速度也更快。指令发送端口大幅度升级到26个。浮点部分则带来了4个128bit的FP/SIMD矢量单元,并且整体架构得到了重新设计和优化。
五是读取和加载部分,整体性能至少是上代1.5倍,存储地址生成单元直接翻倍,L2 TLB大幅度增加。
最后缓存部分,Skymont的4个核心共享4MB L2缓存,读取带宽翻倍。
通过上述所有的改进,Skymont带来了相比Gracemont高达32%的IPC提升,基本上赶上了上代P-Core的性能,令人震惊。
除了Skymont外,LionCove这个性能核心的变化也很大。主要有以下几点:

完全取消了超线程技术。英特尔经过评估后,认为目前的处理器核心数量已经足够多,取消超线程技术也是完全可行的。英特尔解释道,没有超线程技术的核心相比拥有并开启超线程技术的核心,能效比提升5%、单位面积性能提升-15%、PPA提升15%。面积更小、能效比更高,PPA更高,因此英特尔取消Lion Cove是可以理解的。

Lion Cove的前端采用更大前端预测块(Prediction block),是前代Raptor Cove对应结构的8倍。指令提取((Fetch Block)方面也增加到前代产品的2倍。解码宽度目前为8宽度。Uop的缓存、队列深度全部大幅度提升。
Lion Cove的乱序执行能力大幅度提升。INT和VEC现在可以分开调度,更为灵活、效率更高、能耗比更好。整个乱序执行的端口数量也大幅度提升,指令深度更深等。

Lion Cove的执行部分ALU、SIMD ALU以及FMA单元、除法单元等,都显著提升了数量和效能。
Lion Cove新加入了L0级别缓存,还优化了L1和L2缓存的容量、性能等。

能耗比方面。Lion Cove加入AISelf-Tuning Controller,这个功能主要使用神经网络来优化处理器微架构的温度收敛曲线,带来更为智能的温控同时也尽量降低对处理器性能的约束。Lion Cove的频率调节粒度大幅度精细化,为16.67MHz,带来了能耗比、性能管理更为精细化的操作,更有效的提升处理器的能耗比表现。
总的来说,Arrow Lake在LionCove和Skymont上的改进是显著的,带来了处理器整体能耗比的提升,非常值得期待和深入研究。
缓存、GPU和AI性能:Arrow Lake也带来了显著提升
接下来,我们看看除了CPU微架构之外,ArrowLake其他方面的变化。首先是缓存结构、共享设计方面的内容。
