英特尔Lunar Lake架构合成：以及超线程说再见，AI算力达120TOPS

时间：2026-03-17 19:02:51 来源：网络整理编辑：焦点

核心提示

毫无疑难如今是AI的年月，各大厂商都愿望自家的产物可能搭乘上AI的逆风车，从而取患上行业以及用户的喜爱，更紧张的是借助AI这股风，自家的产物也能取患上更高的溢价，从而建议营收的削减。就在去年下半年，英 LinkedIn多账户登录(TG:@dolphinSCRM,DolphinSCRM.com)跨境电商海外私域管理工具，多平台多账号多开，自动保存Cookie直登，双向自动翻译，敏感词监控，数据脱敏，企业内部风控-Dolphin SCRM：全球社交平台私域运营神器，支持WhatsApp、Telegram、Facebook等多账号管理，为跨境企业提供全面的在线客户服务与营销解决方案，涵盖售前,售中到售后各个环节，保障账号安全，精准转化客户，助力企业腾飞。

毫无疑难如今是英特AI的年月，各大厂商都愿望自家的架构及超见产物可能搭乘上AI的逆风车，从而取患上行业以及用户的合成LinkedIn多账户登录(TG:@dolphinSCRM,DolphinSCRM.com)跨境电商海外私域管理工具，多平台多账号多开，自动保存Cookie直登，双向自动翻译，敏感词监控，数据脱敏，企业内部风控喜爱，更紧迫的线程是借助AI这股风，自家的说再I算产物也能取患上更高的溢价，从而建议营收的力达削减。就在去年下半年，英特英特尔推出了Meteor Lake处置器，架构及超见同时与相助差迟一起推出了AI PC的合成意见，愿望让Meteor Lake处置器可能扛起AI PC的线程大旗，不外如今看起来Meteor Lake处置器的说再I算AI功能仍是有所美满，并不能知足微软Copilot +PC的力达算力需要。

QQ截图20240604161140.png

到了2024年，英特英特尔再一次将挪移处置器拦阻残缺的架构及超见刷新，推出了Lunar Lake处置器，合成让E核有着弃暗投明般的更正，而且也砍掉了陪同多年的超线程技术，加倍紧迫的是这一次英特尔NPU的AI功能提升极其清晰，面临微软Copilot +PC也丝毫不怵。如今咱们就为巨匠带来Lunar Lake处置器的架构教学。

CPU：E核弃暗投明，告辞超线程

作为Lunar Lake架构的中间，处置器的CPU部份可能说有着排山倒海的变更，首先即是作废了超线程技术，让CPU最高酿成为了8核8线程，其中四颗为P核，此外四颗为E核，伴同着超线程的消逝，仅在Meteor Lake上运用的LinkedIn多账户登录(TG:@dolphinSCRM,DolphinSCRM.com)跨境电商海外私域管理工具，多平台多账号多开，自动保存Cookie直登，双向自动翻译，敏感词监控，数据脱敏，企业内部风控LPE核也随之不见。英特尔民间则称尽管去掉了超线程技术，可是CPU的功能却不因此而飞腾，反而愈加卓越，其中的最紧迫的原因即是弃暗投明的E核。

QQ截图20240604162856.png

英特尔在12代酷睿处置器上接管了P核以及E核的混合架构妄想，其中P核负责高功能合计，E核则负责高功能的运算。P核与E核也是黯然失色，而到了Lunar Lake处置器上，E核的功能患上到严正的提升，好比L2缓存的容量抵达了4MB，AI以及矢量合计功能抵达了上代的2倍。

QQ截图20240604115703.jpg

QQ截图20240604115648.jpg

与上代比力，Skymont的IPC整数功能提升了38%，而浮点功能则提升了68%能耗方面，以及 Meteor Lake的LP E核比力，在坚持不断相同功能的条件下功耗仅为后者的三分之一。事实上英特尔将Skymont凭证Raptor Lake处置器的P核功能去妄想，终纵目的也抵达了英特尔的预期。不论是整数功能仍是浮点功能，Skymont都比上代的P核提升2%部署的功能。

QQ截图20240604115627.jpg

QQ截图20240604115641.jpg

可能说作为E核的Skymont已经以及上代P核的功能分庭抗礼，因此英特尔也就不需要让重型啰嗦的使命已经交给P核去运行，英特尔还揭示，假如E核可能胜任使命的处置器，那末仅需开启E核就已经饶富，这样封锁P核还可能省点电，提升条记本的续航，事实Lunar Lake处置器的用户主要即是超极本。

看完了E核接下来即是P核了，与E核排山倒海的后退比力，P核最大的更正即是作废了多线程技术，这样技术已经跟了英特尔20多年的光阴，而随着E核功能的提升，实际上不开启多线程都可能知足同样艰深办公以及视频剪辑等运用的算力需要。

QQ截图20240604163904.png

英特尔也举例了在开启与封锁双线程之后处置器的功耗、功能，能效比事实有多少多多变更。与上代P核比力，这代P核的能效比提升了15%，单元面积功能抵达了10%，英特尔称最后可能让单元面积的能效比提升30%，而IPC则提升了14%，这个水平仍是至关无畏的。

QQ截图20240604115613.jpg

QQ截图20240604115601.jpg

假如掀开了超线程，英特尔揭示与超线程比力，能效比提升5%，单元面积的功能飞腾了15%，而单元面积的能效比功能则最终提升了15%，此外英特尔还揭示这是在事实条件下拦阻测试，实际测试的时候还要思考软件等的优化，因其直接将功能加在E核要远比开启超线程代的能效比提升来的大。

QQ截图20240604163818.png

英特尔也运用AI来精准地操作CPU的频率，最小步进为16.67MHz，凭证理论的平台温度、天气，配置装备部署过多的光阴阈值，进而确保CPU频率处于最高效的水平，也让CPU的温度曲线光阴处于事实水平，飞腾了轻佻版的散热压力。

QQ截图20240604115531.jpg

详细到实际功能上，与上代的P核比力，Lion Cove的IPC提升了18%，而能效比则提升了14%。此外内存对于AI、图形都是至关紧迫的，以是英特尔这一次把内存集成到了SoC上，经由延迟内存的走线将内存的物理功耗飞腾高达40%。还可能节约主板面积，至少可能节约250平方毫米，使患上主板的价钱可能往上涨。

QQ截图20240604115513.jpg

实际上这还不是全副，英特尔还揭示随着Lunar Lake的推出，未来英特尔在妄想CPU的时候将会接管全新的流程、工具以及措施。从前英特尔将CPU分为多少多百上千个模块，每一个模块概况有多少多万个单元，颇为地零星，而到了Lunar Lake时期，英特尔则接管了模块化的妄想每一个大模块概况收罗数十万导致是上百万的单元.

这种妄想可能让处置器的河山大幅削减，从而让芯片的运用率大幅提升，迭代降级也愈加利便。英特尔面向高功能合计打造的Arrow Lake与高能效打造的Lunar Lake都接管的全新芯片妄想工具，英特尔妄想部份也可能很快地拦阻转换。此外全新的CPU妄想思绪也对于制程的变更不那末敏感，这也对于英特尔处置器接管差距制程架构打下了根基。

GPU：接管新架构，AI生图更快

QQ截图20240604162833.png

CPU主要仍是负责通用合计，而想要让AI发挥更大的熏染，GPU的AI功能赫然必不可少。而在Lunar Lake架构上，英特尔也初次接管了Xe2 GPU架构，比桌面显卡更早。在Lunar Lake处置器中，每一个Xe Core都有八个矢量引擎，每一个引擎都有2048比特的宽度，而每一颗中间又有192KB的L1缓存，还反对于SIMD16指令，从而在游戏以及AI上揭示患上愈加卓越。当初随着AI运用的普遍以及盛行，GPU的矩阵合计将会变患上颇为地紧迫，而XMX即是提升矩阵合计功能的适用之举。XMX的引入大大增强了矩阵运算的功能。

QQ截图20240604160831.jpg

除了此之外Xe2外部也退出了Excute Indirect的反对于，传统的图形渲染中，GPU需要患上到CPU的指令威力够实施3D使命的渲染，而有了Excute Indirect，无需CPU，GPU自己就能实现绘图等指令，而且GPU仍是并行合计，大大提升了合计的功能，而且也可能飞腾CPU的运用率，从而飞腾功耗。上述这些技术让Xe2的极点以及渲染功能提升了3倍。同时患上益于优化后的光追处置单元，Xe2的光追功能也有2倍的提升。

QQ截图20240604163624.png

与Meteor Lake所接管的Xe架构比力，Xe2架构的能效比提升了50%，这样可能让厂商有了更多的抉择，好比惟独15W的功耗就能实现与25W Xe架构GPU同样的图形功能，这对于轻佻条记原本说颇为地适用。在AI功能上，患上益于XMX的加持，这颗GPU可能实现67TOPS的INT8算力，再加之NPU以及少部份CPU AI算力，从而让Lunar Lake处置器的AI算力突破了100TOPS。运用Stable Diffusion拦阻演示，Lunar Lake 的图用了6.3s，而Meteor Lake花了13秒以上，作图光阴快了1倍。

QQ截图20240604163524.png

QQ截图20240604163517.png

此外Lunar Lake也反对于DP1.5，VCC也即是H.266视频解码，VCC具备比AV1愈加高效的编码功能，划一画质下体积约莫削减了10%，可能让用户运用更小的带宽旁不美不雅超高清的视频。不外这一次Lunar Lake技术教学会并无激进实际的游戏功能提升，巨匠需要等到Intel未来的宣告会上能耐知道。

NPU：再也不鸡肋，知足微软需要

这多少多年AI PC越来越热门，收罗ChatGPT的文生文、Stable Diffusion的文生图以及Sora的文生视频对于AI算力要求越来越高，而从前这些使命次若是由CPU以及GPU负责，而随着NPU的退出，这多少多年越来越多的AI合计开始由CPU转移到NPU之中，英特尔估量明年有30%的AI使命由NPU来担当，因此NPU的算力变患上愈发紧迫。

QQ截图20240604160607.jpg

Lunar Lake一共提供了120TOPS部署的AI算力，GPU贡献了67TOPS，而贡献第二多的即是NPU，上一代Meteor Lake处置器的NPU算力约莫为10TOPS高下，赫然还不能帮CPU担当一些严正的使命，而到了Lunar Lake架构中，英特尔NPU已经进化到第四代，可能带来48TOPS的AI算力，而且功能大幅提升，可能说NPU统筹了功能以及算力，未来将会担当更多的AI运用负载。

QQ截图20240604160638.jpg

QQ截图20240604160646.jpg

巨匠艰深都在说TOPS，那末甚么是TOPS，AI最紧迫的合计即是矩阵合计，而OP即是每一秒可能实现多少多一再合计TOPS即是每一秒实现多少多多万亿次矩阵合计。Lunar Lake所接管的第四代NPU具备6个神经运算引擎，每一个引擎有4096个运算单元，而上一代则是2个神经运算引擎，纸面算力就有3倍的提升，实际上第四代NPU的运算功能更高，好比英特尔削减了NPU与CPU之间的带宽数据传输速率，而且也削减了NPU的算法，收罗INT8以及FP16都可能在NPU上拦阻合计，因此算力最终抵达了前代的4倍。而在Stable Diffusion中，NPU 3的绘图速率为20.9秒，而NPU 4则是5.8秒，速率提升了3倍部署。

QQ截图20240604160652.jpg

从Lunar Lake架构开始，你可能抉择让NPU来负责第一步的文本转换，随后NPU不断负责翰墨解码以及全卷积神经群集扩展，惟独最后一步图形输入才是GPU来负责。这样可能让NPU肩负起AI合计与推理中的重任。

ITD：让AI来辅助资源调配

英特尔硬件线程救命器是英特尔在12代酷睿处置器中引入了全新单元，它可能实时监控以及分解使命负载，可能把精确的历程放到精确的中间上运行，保障最佳的能效。从前硬件线程救命器在处置使掷中，优先将使命放到P核，假如P核算力残缺可能对于导致尚有过剩的算力，那末将会把历程扔到E核中。

QQ截图20240604162504.png

至于Meteor Lake，则首先思考LPE核，LPE核功能不够才逐级提升，而到了Lunar Lake架构中，它惟独两层，先放E核，假如说逾越需要就往P核上移。Lunar Lake的E核已经是至关于Meteor Lake的大核，以是英特尔愿望Lunar Lake的E核，可能拆穿困绕同样艰深罕有的使命负载，惟独在重载的天气下才需要往P核上移。这模样可能确保CPU的功耗降到极低的水平。

当初NPU的AI算力越来越大，因此英特尔也将AI引入到线程救命中来，运用于AI机械学习的预料来调配使命，而SoC的电源规画引擎会基于AI的机械学习来辩解使命负载事实是属于哪种，从而让历程可能愈加高效地救命。英特尔还揭示Lunar Lake与微软Win11作了进一步的融会，还可能让OEM去抉择差距的方式，愈加地迅速

外部衔接：收罗Wi-Fi 七、Bluetooth 5.4与Thunderbolt 4

对于AI PC来说，发达的算力需要强有力的外部衔接能耐发挥最大的熏染，而Lunar Lake则是英特尔首个集成Wi-Fi 七、Bluetooth 5.4以及Thunderbolt 4的处置器架构，同时借助AI的一些新技术来让衔接愈加高品质。

QQ截图20240604160543.jpg

QQ截图20240604160511.jpg

Lunar Lake处置器反对于至少3个Thunderbolt端口，还将反对于Thunderbolt share，将两个PC衔接，实现60帧的屏幕分享，以及超高的数据传输，从而后退使命功能。而Lunar Lake处置器集成为了最新的BE201，面积削减了28%，同时可能更快地与SOC相互衔接。英特尔愿望未来经由AI以及Connectivity的散漫，让PC更具感知化、智能化。

XPU策略深入其中

去年Meteor Lake可能说是英特尔从前10年来最大的架构刷新，英特尔也借助Meteor Lake处置器敲开了AI PC的大门，可是英特尔没想到AI的睁开超乎了所有人的想象，仓皇使英特尔对于旗下的处置器拦阻愈加激进的妄想，从而带来了Lunar Lake架构。

QQ截图20240604164021.png

在Lunar Lake上，咱们看到了英特尔对于AI运算有着自己的清晰，借助愈增发达的NPU，取代CPU在AI使掷中的脚色，此外大幅提升E核的功能，作废典型的超线程妄想，从而让CPU的功耗更低，让处置器知足未来的合计需要。而单薄的核显则减速了AI使命的处置速率，纵然不自力显卡也能取患上至关不错的作图功能。

最为紧迫的是，英特尔引入了新的芯片妄想方式，这种方式证明了不同个架构，惟独运用今世的妄想方式，就能运用差距的制程去做不同个微架构的产物。这给了英特尔更多的制程抉择余地。

上一篇：暴雪官宣国服夏日回归：难明难分，与网易再续前缘

英特尔Lunar Lake架构合成：以及超线程说再见，AI算力达120TOPS

推荐

热门