看点:华为AI能力加持下,图像处理软件体验比iPhone X快三倍。
随着AI技术的发展,商业化与行业落地已成为近两年AI市场的核心。而作为全球第一大硬件入口的智能手机,AI又岂会放弃这块“肥肉”,也正在从芯片、语音、视觉等各个方面加速涌入手机入口。
近期华为发布了P20智能手机,这是搭载了其自研的麒麟970 AI芯片的又一款手机。自2017年9月,华为率先在全球发布麒麟970芯片后,此前这款AI芯片已经先后落地华为Mate 10、荣耀V10等系列新品。
但是AI能力绝不是芯片和算法的简单叠加,在AI芯片与AI算法的加持下,真正落地到软件应用,提供更快的处理能力以及更优的软件体验,对于消费者而言手机的AI能力才有意义。
近期,我们通过深度体验华为手机中来自系统层的软件、自有APP、第三方APP,来从这三个维度实际感受一下,华为手机的AI能力到底在软件层面表现如何。
首先我们先看一下华为手机在系统层的AI能力,这些应用直接内置到手机中,可以说是企业打造的一些标杆应用,无论是在芯片算力、AI算法以及软件适配等方面都会花大工夫打磨。在系统层的应用上我们选择了华为内置的商品识别能力进行体验。
具体而言,唤醒华为手机后,无需解锁也无需打开APP,只需从屏幕底部轻轻向上一划就可调出底部菜单栏,在华为手机的最右方有一个场景识物的功能标志。它调用了华为手机的摄像头功能,通过摄像头对物体进行“观察”识别,就可以识别出商品的信息,然后会为你推荐类似的产品。这些推荐的商品来自淘宝,如果你对那个感兴趣就可以直接进入到淘宝中进行查看购买。
我们进行了两组测试,首先先用华为手机扫描了一台空气加湿器,经过1~2秒钟的商品识别,它就识别出答案后就会推荐出类似的商品。从结果显示来看,它推荐的前两款都是巴慕达净化加湿器,无论外观还是颜色都与实际产品是一致的,可见它准确识别了这台加湿器,并且还根据物体识别推测了最接近的品牌。
此外,广大女性同胞在看到一件漂亮衣服时,是否想第一时间就知道商品的品牌信息。我们又用华为手机的商品识别功能扫描了一位小姐姐的灰色外衣,识别成功后手机就推荐了相关品牌的外衣。
目前场景识物方面取得的效果,得益于机器视觉技术较为成熟,机器通过摄像头能够对三维物体进行感知识别。更重要的是华为将场景识物功能和淘宝平台做了无缝对接,构建了一个不错的AI实际体验场景。
通过这两次体验,我们发现华为手机对于商品识别能力做了很好的优化,首先无需APP内操作,而是直接从手机系统入口直接启用,更加方便快捷;其次是物体识别时间较快,一般1~2秒内即可完成,并且准确率较高。
这对于喜欢购物的女士无疑是一大利器,街头看到一件好看的商品,直接拿出手机识别就可以推荐出相关的产品,并通过淘宝获取信息,用户可以更便捷的“剁手”了。
华为手机中的微软翻译是由微软提供的技术支持,华为做的优化,以翻译这个自有APP为例,我们看一下华为手机中自有APP的AI能力如何。
华为手机中的翻译APP有4项功能,包括语音翻译、文字翻译、图片识别翻译、以及多人(多语种)会话,这里主要用到的AI能力就是机器翻译,也涉及语音识别、图像识别。
这里我们重点介绍语音机器翻译和图片识别翻译这两个功能。在语音翻译中,设置好语种的转换,比如中英翻译,当我说出“你好,欢迎来到人工智能的世界”,在华为手机上方就实时呈现出中文语音识别的结果,然后屏幕上实时呈现英文翻译结果“Hello,welcome to the world of artificial intelligence”。你也可以翻译的结果调整成其他语种。
可以看出语音翻译首先在识别率上已经很高,并且正常的口语机器翻译都可以呈现非常不错的翻译效果,语音识别与机器翻译的准确性都较高。此外,翻译速度采用实时翻译的形式,当你说完一句话时,相关的英文翻译已经输出,这也体现出华为手机中AI芯片能够为软件提供更多算力,来保证用户体验。
图片识别翻译是指调用华为手机中的摄像功能,将所要翻译的内容进行拍照,然后就可以立即呈现出你想要的翻译结果。
具体来说,我们找了一篇英文新闻来考验这项能力,篇章、片段对机器翻译可谓挑战很大,因为机器没有理解上下文语境的能力。首先我先用华为手机将这三段英文拍照,大约不到1秒,在英文上方就呈现了中文的翻译结果。
这里涉及到两大重要AI技术,一项是图片识别,在用华为手机拍照后,它需要调用AI芯片中的算力快速进行图片中的文字识别,然后在通过机器翻译将英文翻译成中文,其他语种之间的翻译也支持。
从结果来看,首先整个图片识别、机器翻译整个过程用时不到1秒,可以想象华为手机AI芯片提供了足够的算力,AI算法进行准确快速识别,并进行翻译,来使用户瞬间获得想要的翻译结果,无疑华为手机AI的能力增强了用户体验。
Prisma是一个图片处理APP,可以通过AI把你手机中的普通照片模仿出著名艺术家画作的风格,在2016年一经推出便红遍全球。但这一应用需要软件对图片内容进行识别,并进行相关的渲染等,在算力上要求很高,现有手机的处理能力,往往需要很长时间才能完成。
华为除了将AI芯片的能力落地到自己开发的应用中,还HiAI移动计算平台,向第三方开发者提供人工智能计算库及其API,可以让开发者更好的调用华为手机的AI能力。而Prisma也是华为HiAI平台的一个开发者。
为了体验第三方APP在华为手机AI能力加持下效果如何,我们特意找了一位清新脱俗的妹子作为模特,随意站在办公室一角拍了一张照片,光线、背景、构图什么的都不考虑。然后调用Prisma图片处理功能,选择了图中的两种渲染效果,经过大概近3秒的处理,就自动生成了图中后面两张渲染照片,是不是随手拍的照片瞬间就有了艺术风格。
而在艺术图片生成的背后,首先需要软件对照片进行感知,识别出前后不同的物体、人像、背景,然后对不同的部门进行艺术风格的渲染,这背后需要大量的算力的支持,以及AI算法对不同物体尤其是人像的识别、边框的界定。而华为麒麟970 AI芯片中搭载的NPU(神经网络处理单元)的计算速度比CPU快了25倍,同时还将能耗效率提高50倍,无疑这为Prisma提供了强有力的算力支持。
算力加持的效果就是Prisma的图片处理速度更快,效果也更好,用户可以在更短的时间获得艺术风格渲染的照片,而不会出现处理速度过慢、卡顿等情况,从而增强手机与APP的用户体验。
有趣的是,一份Prisma在华为P20手机与iPhone X中处理耗时的对比图可以看出,华为P20处理时间为3.2秒,而iPhone X则需要9.6秒,这无疑显示出华为手机AI能力在第三方软件层面的体现。
通过华为手机中系统层软件物体识别、自有APP微软翻译、第三方APP Prisma图片处理工具三方软件的体验,我们可以看到在华为AI芯片、AI算法等能力的加持下,无论是华为自有的软件还是第三方的软件都可以提升AI的处理能力,增强用户体验。
随着华为将AI的能力以HiAI平台的形式开放给第三方开发者,开发者也可以调用华为AI的能力来增强自身软件算法的处理速度,进而提升自身软件的体验。
延伸阅读
▲扫描二维码进入专区
加入社群
智东西“人工智能专业社群”开始招募工程师及研究者
AI行业解读、技术交流、企业追踪
微信加zhidx008递交名片入群
合作勾搭
文章转载微信:zhidx_com
媒体合作:marketing@zhidx.com
商务合作微信:hillsmart