阿里云免费开放人脸识别 SDK

2017 年 9 月 27 日 程序员观察

原文:http://www.techug.com/post/aliyun-face-recoginaz-sdk.html

早在今年五月,阿里云已经推出了短视频解决方案。近日,阿里云再次率先颠覆行业,在业内首推免费的人脸识别 SDK,结合其原有的短视频能力,大大降低了人脸识别 +AR 特效+短视频的入行门槛。

  你所知道的人脸识别行业

提到人脸识别,大家会联想到商业支付、身份识别、广告投放、人机交互、系统公安等等众多生活场景。虽然这项技术的研究始于 20 世纪 60 年代,但是在近年这个课题才愈发活跃。以日常生活中比较常见的场景——社交互动为例,通过人脸识别、AR 特效、动图元素的支持,可以帮助用户打破社交壁垒,更立体化、个性化、趣味化的表达自我和分享生活点滴。

市面上已经有的人脸识别 SDK 多数费用高昂,动辄几十万,而某些厂商号称免费,其实也是基于网络 API 的调用,并不适合在移动端录制短视频时使用,也就无法应用在社交场景之中。这让很多想在 APP 中添加短视频 AR 特效的团队望尘莫及。

  阿里云联合手淘,推出人脸识别免费 SDK

阿里云通过整合集团资源,将手淘团队自研的人脸识别 SDK 和阿里云短视频 SDK 深度融合,真正做到了不依赖于网络 API 的实时检测、识别、跟踪。

目前,官网上的专业版短视频 SDK 已经拥有了手淘自研的人脸识别功能,实现了人脸识别 +AR 动态贴纸的完整体验,结合原有的短视频采集、导入裁剪、编辑、合成、极速上传、媒资管理、视频转码、分发加速、播放等全链路能力,阿里云可以为创业者们提供一站式解决方案,让每个 APP 轻松实现短视频 AR 新玩法。


关键技术介绍及算法性能测速

我们来看看具体的应用场景和技术是怎样的,用户在客户端进入拍摄画面后,可以自行选择搭配动态贴纸等个性化素材,实现 AR 特效,使短视频打造出科幻、卖萌、恶搞等不同的效果。其中主要涉及到的是人脸检测、关键点定位、追踪等核心技术。

第一,人脸的检测是用于定位视频中的人脸,同时检测多张人脸和处理多角度、部分遮挡人脸等复杂情况也在这一步妥善处理,从而快速、准确的找到人脸。

第二,人脸的关键点定位,则是用于已知人脸所在位置的基础上,自动标注人脸的轮廓、五官位置,比如眼睛、鼻子、嘴巴、眉毛、耳朵等关键位置。阿里云提供人脸识别关键点个数多达 68 个,可以更准确的追踪五官,保证用户的体验。

第三,AR 特效美化,根据已知的关键点位置,搭配上用户所选的动态贴纸,并根据捕捉不同的面部动作来变换 AR 特效,达到真实互动。

第四,人脸追踪,视频是动态而非静止的,当用户脸部移动、转动时,阿里云 SDK 可以实现对关键点的追踪,可识别姿态范围为 yaw±60°,pitch±45°,roll±45°,精准的捕捉动作,持续追踪动态贴纸和 AR 特效。

阿里云人脸识别 SDK 具有准确度高的特性,通过 68 个关键点检测和以上技术,实现平均错误率低于 5%,出现“对不上”这种尴尬场面的概率极低。据悉,阿里云未来也会推出商业版人脸识别的高级功能,满足更高级客户的需求。

在性能方面,阿里云人脸识别算法和其它厂商算法在测速上的区别如下:


注:以上测试 480p 的最小人脸尺寸为 48*48(px);720p 的最小人脸尺寸为 72*72

从上表可以看出,本人脸识别算法在同样机型、同等测试对象的条件下,测速表现大幅优于业内友商。经过阿里云集团手淘亿级日活跃用户产品的考验,性能方面毋庸置疑。由于该算法也应用于手淘相关业务之中,所以后续的迭代、维护都会有强有力的保障。

阿里云人脸识别 SDK 的免费开放,给短视频行业带来了无限的可能性。基于阿里云,创业者和用户们都有了更多新鲜的玩法,创新机遇随之而来,希望整个行业能产生更多元、更深入的探索。

登录查看更多
3

相关内容

SDK(Software Development Kit, 即软件开发工具包 )一般是一些被软件工程师用于为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件的开发工具的集合。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
234+阅读 · 2020年5月21日
深度神经网络实时物联网图像处理,241页pdf
专知会员服务
76+阅读 · 2020年3月15日
《人工智能2020:落地挑战与应对 》56页pdf
专知会员服务
195+阅读 · 2020年3月8日
【电子书】Flutter实战305页PDF免费下载
专知会员服务
22+阅读 · 2019年11月7日
阿里云发布机器学习平台PAI v3.0
雷锋网
12+阅读 · 2019年3月22日
从人脸识别到机器翻译:52个有用的机器学习和预测API
深度学习世界
3+阅读 · 2018年5月11日
免费云真机测试 | 让您的应用完美适配 Android Oreo
引力空间站
3+阅读 · 2018年2月2日
无人驾驶免费、人脸识别免费、语音识别免费…百度要干啥?
人工智能机器人联盟
4+阅读 · 2017年12月15日
52 个有用的机器学习与预测API
北京思腾合力科技有限公司
3+阅读 · 2017年10月26日
Simplifying Graph Convolutional Networks
Arxiv
12+阅读 · 2019年2月19日
VIP会员
Top
微信扫码咨询专知VIP会员