AMD 2023年初发布的锐龙7040系列(代号Pheonix),是全球首款集成独立NPU AI引擎的x86处理器,基于全新设计的XDNA架构,算力约10TOPS(每秒10万亿次浮点运算),加上CPU、GPU整体算力约33TOPS,开创了AI PC的新时代。
2023年底的锐龙8040系列(代号Hawk Point),NPU AI算力一举提升了60%,达到约16TOPS,整体算力也提升至39TOPS。
现在,Strix Point终于登场了,官方命名为“锐龙AI 300系列”,架构焕然一新,性能也再次飞跃,成为下一代AI PC的基石。
CPU是全新的Zen5架构,GPU是升级版的RDNA3.5架构,NPU是全新的XDNA2架构,号称“面向下代AI PC/Copilot+ PC的世界一流处理器”。
锐龙AI 300系列首发只有两款型号,都定位高端市场。
其中,“锐龙AI 9 HX 370”是顶级旗舰,CPU部分拥有12核心24线程,多年来首次在这一定位上提供更多核心,相比锐龙8040系列增加了多达1/3。
二级缓存还是每核心1MB,总容量自然增加到12MB。
三级缓存终于打破了16MB的“禁锢”,增加了足足一半来到24MB。
最高主频5.1GHz,和现在倒是差不多。
GPU部分不但升级架构,CU单元数量也从12个增至16个,命名为“Radeon 890M”。
NPU部分算力来到了50TOPS,增加了2倍有余,问鼎最强NPU的宝座。
“锐龙AI 9 365”也是高端型号,10核心20线程,二级缓存10MB,三级缓存仍为24MB,最高频率达5.0GHz。
NPU算力还是50TOPS,GPU部分也还是Radeon 890M。
说了这么多,大家也看到了,AMD这一代移动处理器采用了全新的命名方式,不再是单纯的四位数字,而是将AI直接加入品牌名,地位之高前所未有。
9 HX、9都是代表产品级别,但注意这里的HX,和以往高端游戏本处理器用的HX(比如锐龙9 7945HX)不是一回事儿。
数字编号采用300系列,代表从NPU单元的角度来看,这已经是第三代AI PC处理器。
以上是一二代XDNA NPU架构的对比图,可以看到整体布局基本一致,但规模大大扩充。
AI Tile(初代叫AIE Tile)也就是核心的AI计算引擎模块,从之前的20个增加到32个,再加上本身的增强。
Mem Tile也就是本地内存模块,从原来的5个增加到8个,可以更好地配合更大规模的本地调度、运算。
另外,用于互连的交叉总线也从普通的Data Fabric,升级为Zen/RDNA家族上无处不在的Infinity Fabric,传输带宽和效率更高。
AMD声称,XDNA2 NPU的计算能力提升了多达5倍,多任务并行能力翻了一番,能效也提升了最多2倍。
这里说的提升5倍,来自Llama 2 70亿参数大模型的响应速度,从启动到获得第一个token,锐龙AI 9 HX 370达到了锐龙9 8940HS的多达5倍。
另外非常关键的一点,XDNA2首发引入了全新的Block FP16浮点精度,也就是BFloat16、BF16。它在CPU、GPU上已经很常见,而在NPU上还是第一次。
传统的FP8浮点格式性能高而精度不足,FP16浮点格式精度高而性能略逊,而将二者融合起来的BF16可以在精度、性能上达到较好的平衡,灵活性也更高。
同时,大多数AI应用都采用了16位精度,因此有了BF16,不再需要量化为8位精度,减少了转换步骤,提高了执行效率。
高通骁龙X Elite NPU的算力为45TOPS,Intel即将推出的下一代酷睿Ultra Lunar Lake NPU算力同样是45TOPS,锐龙AI 300系列则一举超越二者,成为当今最强NPU。
至于苹果,M4 NPU的算力只有区区38TOPS,还不到Windows阵营这边Copilot+ PC的最低算力需求门槛40TOPS。
随着算力的大幅提升,NPU的应用也将不再局限于一些持续性低负载场景(比如视频会议),而是有了更多可能,一方面可以在更多场景中部分取代CPU、GPU,以更高的能效执行AI运算,大大提升笔记本的续航能力。
另一方面,更强力的NPU配合更强力的CPU、GPU,可以在更多场景中部署端侧AI,进一步摆脱对云侧的依赖,最大好处就是可以避免隐私泄露和安全威胁。
当然,硬件算力再强,也需要生态应用的落地配合。
作为AI PC的先行者,AMD 2024年内的ISV合作厂商将超过150家,既有Adobe、微软、Topaz Labs这样的世界级大厂,也有百川智能、钉钉、无问芯穹、有道这样的国内名企,前途不可限量。
当然,新一代AI PC的最大亮点就是配合Windows,可以打造全新的Copilot+体验,比如历史回忆、视频会议实时录制与翻译、协同创作等。
最后是一些官方性能对比,供参考。
锐龙AI 9 HX 370对比骁龙X Elite,日常办公、生产力创作、多任务、图形等各方面都遥遥领先,尤其是图形计算,骁龙在移动端无敌,但是在AMD面前还是个弟弟。
对比Intel目前最好的酷睿Ultra 9 185H,无论是日常应用还是游戏,都已经不在一个级别上,就看下一代Lunar Lake的表现了。
苹果这边就更不够看了,尤其是多任务、3D图形性能,不在一个层次上。
锐龙AI 300系列的笔记本将从7月份起陆续上市,目前已有100多款设计,涵盖宏碁、华硕、戴尔、惠普、联想、微星等各大主要OEM品牌。
华硕会在台北电脑展上宣布一系列配备锐龙AI 300系列处理器的笔记本,其中轻薄本有16英寸的灵耀(Zenbook S)、14/15/16英寸的无畏(Vivobook S),创作本有16和13英寸的ProArt P16/X13,游戏本有16英寸的ROG幻系列、14/16英寸的天选系列(TUF GAMING A14/A16)。
微星首批三款,都是16寸大屏机型,包括面向高端商务办公的Summit A16 AI+,轻薄全能游戏型的绝影A16 AI+、主打超薄商务与创作的尊爵A16 AI+。