新智元报道
编辑:LRS
曾在显卡价格暴涨时被视为「救世主」的英特尔高性能显卡,终于来了!
3月30日,英特尔正式发布锐炫ARC移动端独立显卡,代号Alchemist炼金术士。
救世主来了,但还没完全来。
广大玩家等了这么久,就拿了个移动端显卡?说好的脚踢英伟达,拳打AMD呢?
虽然说去年英特尔推出了一个DG1显卡,但性能却只和十年前的显卡差不多,且主要面向服务器市场,所以并没有掀起太大波澜。
而上次英特尔面向消费端推出的独立显卡还是1998年的i740,此后一直专注于集成显卡。时隔二十四年,当英特尔再次开启独显研发,所有人都在期待它的表现。
先来看看产品,本次英特尔主要发布了面向移动端推出的A系列显卡,包含三个型号,锐炫(Arc)3/5/7,分别对应低中高端产品。
和酷睿CPU的命名传统一样,Arc 3面向「主流游戏」,Arc 5可用于「性能游戏」,Arc 7则针对「硬核性能游戏」。
本次公布的Arc移动独显具体型号主要包括5款:A350M、A370M、A550M、A730M、A770M,在Xe内核数量、频率、光追单元数量、显存容量与位宽,以及显卡功耗上有差异。
锐炫显卡支持 XeSS 超采样、完整的 AV1 硬件加速、Smooth Sync 抖动过滤、Deep Link 技术,全方位覆盖游戏、创意设计、功耗控制等场景。
首款搭载Arc 3独立显卡的三星Galaxy Book 2 Pro已经上市,不过并不面向中国市场。预计从今年第二季度开始,国内会看到采用Arc独显的笔记本产品。
其他品牌包括宏碁、华硕、戴尔、海尔、惠普、联想、微星、三星、英特尔NUC等品牌也都已经有推出锐炫独显笔记本的计划。
一个例外是12代酷睿的U系列处理器并不会搭载锐炫显卡,而是仅搭配更高TDP的Alder Lake-H与Alder Lake-P. 英特尔的解释是搭载U系列低压处理器的轻薄本的功耗余量有限,不过也可能和低压处理器的I/O限制也有一定的关系。
本次面市的只有Ac3系列显卡,Arc 5/7可能还要等到夏天才能发售。
英特尔还确认,未来英特尔显卡可与AMD CPU搭配。
至于何时进入台式机电脑市场,英特尔专家Tom Peterson则表示,这个问题更多取决于OEM和ODM的规划,从技术角度来说并不难实现。
是骡子还是马?
在GPU的基本单位上,英特尔抛弃了过去核显的EU(执行单元)的说法,而是引入了一个新的计数单位:Xe内核,主要包括算术单元、cache、load/store逻辑单元。算术单元部分包含一般的矢量引擎,以及加速卷积和矩阵运算的AI引擎。
在Arc显卡的Xe-HPG架构中,Render Slice(渲染切片)是基本模块,每个Slice包含有4个Xe内核、4个光追单元、4 个采样器、几何引擎、光栅引擎、HiZ 引擎以及 2 个像素后端构成,支持DXR和Vulkan光追,以及一些针对网格着色、采样器反馈等DirectX 12 Ultimate图形技术的硬件单元。英特尔宣称Xe-HPG架构相比此前核显Xe-LP架构的每瓦性能提高了1.5倍。
在图形和AI单元方面,英特尔还是下了大手笔的。每个Xe内核都配有16个矢量引擎(XVE)+16个矩阵引擎(XMX)。其中XVE主要负责传统的图形运算,可提供16 ops/clock的FP32、32 ops/clock的FP16,以及64 ops/clock INT8运算能力,而XMX则主要是加强AI性能,INT8的算力达到了256 ops/clock,可用于游戏中加速XeSS这类超分辨率算法。
在XVE和XMX之间,他们还加入了192KB的本地内存,可根据工作负载的需求在L1缓存和SLM(共享本地内存)之间进行动态分配,而为了有效提高执行性能和算力,Xe-HPG可以同时调度和执行浮点FP、整数INT和 XMX 指令,并以锁步形式并行两个引擎和共享资源。
至于英特尔的XeSS和英伟达的DLSS的性能到底哪个更好,因为现在还没有一个通用的超分辨率基准测试,所以还很难说,不过在英特尔的演示效果来看XeSS还是相当不错的。
首批将有14款游戏支持XeSS,未来几个月英特尔计划加入更多游戏支持。
Xe-HPG架构在针对视频硬编解码的Xe媒体引擎部分基于Xe-LP架构进行全面增强。目前可支持VP9、AVC、HEVC和AV1格式的硬件编解码,最高能支持到8K60 12-bit HDR硬解码,以及8K 10-bit HDR硬编码。
其中AV1硬件编码是英特尔首家提供的,这种视频格式有更好的压缩比和画质,效率要比常见的H.264格式高了50%,即使相比HEVC也高了20%,更适合作为未来互联网的超高清视频传播格式,而且AV1格式是开源无授权费用的,目前HandBrake、Adobe Premiere Pro和FFMPEG等知名软件都已经支持英特尔AV1硬件编码能力。
Xe-HPG架构带有4个显示通道,支持HDMI 2.0b、DisplaysPort 1.4a和2.0 10G Ready,最高支持输出2条8K60 HDR,或者4条4K120 HDR,而2K和1080p均能达到360Hz,并支持Adaptive Sync、Speed Sync和Smooth Sync三种显示同步技术。
除了显卡独立作战以外,英特尔也认同GPU应该和CPU协同起来,「CG搭配,干活不累」,比如AMD就在这条路上推出了SAM,能够充分发挥自家平台优势。
Arc独显可与12代酷睿及其核显搭配,优化效率或协同完成某些工作。这类技术统称为Deep Link。Intel主要列举了Deep Link的动态功率共享、超级编码、超级算力三项特性。
动态功率共享指的是在CPU或GPU任何一方更需要功率的情况下,能够将功率进行动态分配的机制。在系统处于高负载状态下,如游戏场景,为加快响应负载变化,系统会以100毫秒为最小间隔来动态调控功率配比;而在轻载场景下,不需要快速响应时,为实现节能则该时间窗口会变大。
超级编码就是把媒体编码工作交给Arc独显和酷睿处理器的Xe核显去协同完成。
超级算力则是在某些应用中同时结合核显和独显的算力,比如视频降噪、超分辨率等可以并行的任务,按照视频帧进行切分后就可以合理分配给不同的算力模块,这个分配过程主要考量的是负载的延迟敏感度、吞吐量、性能要求、功率消耗等因素。
实机游戏性能怎么样?
英特尔拿出A370M在大量的游戏上进行的帧率测试,在1080p中等画质情况下,杀手3、毁灭战士:永恒、命运2、巫师3等中大型游戏跑到60帧一点问题都没有。
对于电竞类的游戏,如堡垒之夜、火箭联盟、无畏契约等,A370M甚至可以在搭配酷睿i7-12700H的情况下跑到90-115帧,妥妥的够用了!
游戏性能测试的结果大概和英伟达的桌面端显卡GTX 1050差不多,但游戏的帧率并不能反映完全反映显卡的性能,比如细节的设置、游戏场景的选择、CPU和内存的匹配都会影响实际帧率。
不过性能肯定是要比目前英特尔自家的集成显卡要强一大截的。
英特尔显卡的入局,让显卡市场正式进入「三国时代」,红黄蓝三厂大战。
但目前来看,英特尔的显卡性能目前还无法与英伟达、AMD的高端显卡一战,所以能否影响显卡价格,让消费者买到更便宜的显卡还是一个未知数。
多一个入局者,对于消费者来说,终归是多了一个选择。
参考资料:
https://www.techadvisor.com/news/pc-components/intel-arc-gpu-3807569/
https://www.zdnet.com/article/intel-debuts-arc-gpu-lineup-for-laptops/
https://www.expreview.com/82842.html