综合报道:华为麒麟970详解,人工智能的手机芯片

2017 年 9 月 3 日 人工智能学家

作者: 芯智讯

来源:在麒麟970发布之前,华为就曾多次为其造势,称之为“人工智能处理器”。确实此次发布的麒麟970也集成了NPU(Neural-Network Processing Unit)即神经网络处理器。


德国当地时间9月2日下午1点,华为在柏林IFA2017大展上举办新品发布会,正式发布了传闻已久的新一代旗舰级芯片——麒麟970,同时这也是全球首款内置神经元网络单元(NPU)的人工智能处理器。



台积电10nm工艺加持,性能大幅提升


根据资料显示,麒麟970采用了台积电10nm工艺,面积约100平方毫米,其中集成了55亿个晶体管,作为对比,此前的骁龙835是31亿颗,苹果A10则是33亿颗,足见麒麟970的复杂度更高。



具体参数方面,正如之前外界所传闻的那样,麒麟970采用ARM Cortex-A73四核+Cortex-A53四核的架构,大核主频为2.4GHz,小核主频为1.8GHz,虽然CPU内核沿用了之前麒麟960的架构,不过得益于10nm工艺的加持,麒麟970的能效相比麒麟960提升了20%。


GPU方面,麒麟970采用的是ARM最新推出的Mali-G72 MP12。



根据此前ARM的资料显示,基于Bifrost架构的Mali-G72实现了多种创新,相比上一代的Mali-G71,性能提升了40%、能效提升25%、每平方毫米的芯片面积效能提升20%,同时机器学习效率提升17%。



具体到麒麟970的GPU(Mali-G72 MP12)性能上,比麒麟960(Mali-G71 MP8)提升了20%,能效比提升50%。


在视频编解码方面,麒麟970开始首次支持HDR10,支持4K@60fps视频解码以及4K@30fps视频编码。


集成NPU人工智能芯片


在麒麟970发布之前,华为就曾多次为其造势,称之为“人工智能处理器”。确实此次发布的麒麟970也集成了NPU(Neural-Network Processing Unit)即神经网络处理器。


从技术角度看,深度学习实际上是一类多层大规模人工神经网络。它模仿生物神经网络而构建,由若干人工神经元结点互联而成。神经元之间通过突触两两连接,突触记录了神经元间联系的权值强弱。每个神经元可抽象为一个激励函数,该函数的输入由与其相连的神经元的输出以及连接神经元的突触共同决定。为了表达特定的知识,使用者通常需要(通过某些特定的算法)调整人工神经网络中突触的取值、网络的拓扑结构等。该过程称为“学习”。在学习之后,人工神经网络可通过习得的知识来解决特定的问题。


由于神经网络计算的类型和计算量与传统计算的区别,导致在进行神经网络计算的时候,传统CPU、DSP甚至GPU都有算力、性能、能效等方面的不足,所以激发了专为神经网络计算而设计NPU的需求。


我们的手机芯片目前有CPU、GPU、DSP都可以做运算,但是根据高通是数据显示,同样的一个算法在GPU上速度要比CPU快4倍,如果在DSP上则要比CPU快8倍。在能效方面,GPU运算要比CPU节省8倍,DSP则可节省25倍。但是,如果集成专用的NPU来做神经网络运算则能效会更高。


根据此前寒武纪团队公布的数据来看,其 “寒武纪一号”(代号DianNao,为单核处理器,主频为0.98GHz,峰值性能达每秒4520亿次神经网络基本运算,65nm工艺下功耗为0.485W,面积3.02平方毫米)平均性能已超过主流CPU核的100倍,但是面积和功耗仅为1/10,效能提升可达三个数量级;与主流GPU相比性能相当,但是面积和功耗仅为其百分之一。



根华为介绍,麒麟970集成的NPU专用硬件处理单元,设计了HiAI移动计算架构,其AI性能密度大幅优于CPU和GPU。相较于四个Cortex-A73核心,处理相同AI任务,新的异构计算架构拥有约50倍能效,以及25倍性能优势,面积只有CPU的1/2,运算能力达到了1.92T FP16 OPS,图像识别速度可达到约2000张/分钟。


根据华为公布的数据显示,识别同样的200张照片,CPU需要120秒,而其NPU只需6秒,速度达到了CPU的20倍。并且其NPU识别1000张照片仅消耗0.19%电量。



同时华为宣布将把麒麟作为人工智能移动计算平台开放给更多的开发者和合作伙伴,让开发者利用麒麟970的强大AI算力,开发出更具想象力和全新体验的应用。可以看到,麒麟人工智能移动计算平台除了支持caff、coffe2,还包含了对Google TensorFlow等神经网络和模型框架的支持。


基带突飞猛进:支持1.2Gbps


虽说很多手机CPU都是拿的ARM的内核来做,但是要把它们整合优化好并不是一件容易的事。而如果要自己来做手机通讯基带芯片的话,则更是难上加难。因为这块的技术壁垒、专利限制和资金投入需求更大。


早在2009年10月,华为推出了业界首款支持TD-LTE的多模终端芯片“Balong 700”。


2012年巴塞罗那MWC大会上,华为发布业界首款支持LTE Cat.4的多模LTE终端芯片Balong 710,下行速率达到150Mbps,并整合在麒麟910系列处理器中。


2014年华为又推出麒麟920,整合基带Balong 720,全球率先支持Cat.6 300Mbps。此后的麒麟950也依然沿用的是Balong 720。


2015年,华为展示了Balong 750,全球范围内第一个支持了LTE Cat.12、Cat.13 UL网络标准,理论下载速率高达600Mbps,而上传也达到了150Mbps,与高通的骁龙X12相当。去年发布的麒麟960搭载的正是这款基带,同时还告别祖传的55NM外挂基带,真正实现了则全网通(开始支持CDMA)。



而此次发布的麒麟970则更是令人意外,其基带可以支持LET Cat.18(4.5G,Pre 5G),支持3CC CA,4×4 MIMO以及256QAM,能够将数据的传输效率最大化,超过了高通去年推出的千兆级基带芯片骁龙X16,达到了与高通最新发布的骁龙X20一样的1.2Gbps的下载速率。而且还会在高通骁龙X20之前商用。


此外麒麟970还支持双卡双4G双VoLTE,并内建TEE和inSE安全引擎,拥有更高的安全性。


自主双ISP


手机拍照性能是近两年华为手机的主打功能。而要想拍出好的照片,不仅要有好的镜头,还需要强大的ISP(图像信号处理)。


众所周知,CPU负责处理通用逻辑数据,GPU则负责处理图像方面的多媒体数据,ISP则是负责处理拍照模组反馈的信息,也是另一颗重要的处理器。当相机打开快门的瞬间,光线透过镜头、光圈之后,折射并传递到摄像头感光元件(CMOS)上,产生光电效应,这个时候CMOS传感器就会将这些数据传递到ISP进行处理,最终将电信号转化为肉眼可见的数码相片,显示在屏幕上。整个过程中,ISP起到关键作用,不仅仅需要准确还原CMOS上得到的数据,还要对部分有瑕疵和损坏的数据(例如噪点、亮度衰减、肤色苍白)进行算法优化。


麒麟970相比原来的麒麟960的单IPS,升级成了华为自主设计的双ISP。双核ISP架构相比单核ISP也有明显的优势。两个ISP核心可分工合作,一个用来负责实时预览,也就是我们看到屏幕的取景画面,另一个负责拍照。如果单ISP就需要同时负责预览和拍照,则反应速度会下降,功耗也会提升。



根据华为公布的数据显示,新的双IPS可以带来更快的响应速度,数据吞吐量提升25%,相应时间提升15%;快速对焦,支持四种混合对焦模式;支持运动检测,实时识别运动速度并对焦拍摄,同时支持人脸追焦技术;支持增强降噪及低光增强,可以使夜景拍摄效果更自然通透。


小结:


通过前面的关于麒麟970的四大主要提升的介绍,我们不难看出,麒麟970相比上一代的麒麟960确实有很大的提升。不论是CPU性能、GPU性能还是功耗方面都有了不小的提升。特别是基带方面的提升,确实称得上是突飞猛进,1.2Gbps的下行速率不仅追平了高通最新发布的骁龙X20以及7月底曝光的三星最新的基带,成为了全球第三款支持1.2Gbps下行速率的芯片,而且麒麟970还将抢先于高通、三星之前率先实现商用。这也意味着华为首次在基带技术上追上了高通。


华为宣布10月16日在德国慕尼黑将召开新品发布会,Mate 10、Mate 10 Pro将作为麒麟970的首发机型登场。


更为令人兴奋的是,麒麟970还集成了NPU,成为了全球首款人工智能处理器,当然虽说初期这其中会有些噱头,但是相信随着后续更多应用的接入,对于智能手机用户来说,还是会带来实际体验的大幅提升。


目前智能手机是全球数量最为庞大也是用户最多的智能终端产品,同时也是人们每天使用最为频繁的智能设备,强大的感知能力和人工智能加入将会使得智能手机成为人们的得力“助手”。毫无疑问,在智能手机的端上部署人工智能已是大势所趋。这一次,华为走在了前面。


强劲中国芯!华为麒麟 970 正式发布

爱范儿

从 Android 和 iOS 智能手机爆发开始,手机的硬件配置也在以迅雷不及掩耳的速度在快速迭代。伴随着智能手机的军备大战,高通骁龙、德州仪器 OMAP、三星 Exynos、英伟达 Tegra、苹果 A 系列、华为麒麟、联发科 Helio 等 SoC 品牌也逐渐为普通消费者所知晓。

大浪淘沙,在多年的智能手机 SoC 厮杀中,有的品牌已经退出了这个市场,而有的则以自己特有的姿势在这个市场站稳了起来。前者的代表是德州仪器,而说起后者的代表,华为麒麟可算一个。

华为作为国产厂商中少有的技术流,其麒麟处理器颇受关注。但早期,麒麟处理器受到的争议也同样不少,主要集中于一些关键技术指标,如制程工艺、处理器架构、图形处理能力等,均非行业顶级。这一情况在麒麟 950/960 处理器发布后得到了逆转。凭借着不错的性能表现和 Mate 系列的销量,麒麟处理器也开始在高端市场逐渐站稳了脚跟。

就在刚才,华为在 IFA 上发布了最新的旗舰 SoC 麒麟 970。

和传闻的一样,麒麟 970 采用了四个 Cortex-A73 核心@2.4GHz 和四个 Cortex-A53 核心@1.8GHz 的架构,制程工艺为台积电 10nm,包含 55 亿晶体管,作为对比,骁龙 835 是 31 亿颗晶体管,苹果 A10 是 33 亿颗晶体管。不过,根据华为的说法,麒麟 970 的功耗下降 20%,芯片面积小 40%,但性能比前代麒麟 960 强了 20%。

此外,麒麟 970 也支持 LPDDR4X 内存和 UFS 2.1 存储。当然,这是理论情况。

麒麟 970 的 GPU 为 Mali-G72MP12。GPU 核心数达到了骇人听闻的 12 个。具体的频率暂不得而知。需要注意的是,这是 Mali-G72MP12 GPU 的首次商用。

麒麟 970 还采用了双 ISP,进步主要在于运动检测和低光拍摄。而余承东还在微博上表示,该双 ISP 还支持人工智能场景识别、人脸追焦、智能运动场景检测。

网络支持上,麒麟 970 采用 4.5G LTE 技术,支持目前全球最高的 LTE Cat.18 通信规格,实现了业界最高的 1.2Gbps 峰值下载速率,能在全球范围内实现各运营商的最高速率组合。同时该 SoC 内建 TEE 和 inSE 安全引擎,拥有更高的安全性。

视频方面,这款处理器支持 HDR10,支持 4K@60fps 视频解码,4K@30fps 视频编码。

总的说来,麒麟 970 的 CPU 和 GPU 各项参数比起已经发布的竞品互有胜负,但麒麟 970 最大的亮点应该是专门搭载的 NPU。麒麟 970 是业界首颗带有独立 NPU 专用硬件处理单元的手机芯片。

据称,麒麟 970 的 NPU 运算能力达到了 1.92T FP16 OPS,该单元创新设计了 HiAI 移动计算架构,其 AI 性能密度大幅优于 CPU 和 GPU。华为终端官方微博称,相较于四个 Cortex-A73 核心,处理相同 AI 任务,新的异构计算架构拥有约 50 倍能效和 25 倍性能优势,图像识别速度可达到约 2000 张/分钟。

华为表示,用户需求推动科技进步,应用场景促使 AI 发展。麒麟 970 作为人工智能移动计算平台,他们将开放给更多的开发者和业界合作伙伴。

在发布会的最后,余承东正式宣布,首款搭载麒麟 970 的终端产品华为 Mate 10 将会于 10 月 16 日在德国慕尼黑发布。

有了如此强劲的内在,Mate 10 在与其它顶级旗舰过招时会更游刃有余。这也更让人期待骁龙 845 以及 Exynos 下一代旗舰 SoC 的表现。



登录查看更多
0

相关内容

【UCLA】基于深度神经网络的工业大模型预测控制,36页ppt
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
125+阅读 · 2020年5月22日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
82+阅读 · 2019年12月13日
云游戏行业发展趋势分析报告
行业研究报告
13+阅读 · 2019年3月24日
华为Mate20系列4款新机发布,售价最高超一万六
DeepTech深科技
3+阅读 · 2018年10月17日
谭铁牛院士:人工智能的春天刚刚开始(附PPT)
走向智能论坛
17+阅读 · 2018年5月29日
海康威视AI Cloud助力平安城市4.0建设
海康威视
7+阅读 · 2018年1月17日
小米Note3 ‖ 国产首款支持人脸解锁手机
机械鸡
4+阅读 · 2017年9月12日
Area Attention
Arxiv
5+阅读 · 2019年2月5日
Neural Approaches to Conversational AI
Arxiv
8+阅读 · 2018年12月13日
Arxiv
6+阅读 · 2018年10月3日
Arxiv
6+阅读 · 2018年3月28日
Arxiv
12+阅读 · 2018年1月28日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员