图像识别 | 基于Amazon Rekognition的图像识别应用

2017 年 7 月 19 日 沈浩老师 袁璐 沈浩

导语:随着人工智能在世界范围内的大爆发,机器学习和深度学习算法不断精进,在图像识别和机器翻译等方面的应用方面,各大巨头也是使出了浑身解数。



今天我们就来借由亚马逊开发出的Amazon Rekognition看一看,人工智能深度学习在图像识别方面有哪些实际性的应用。


首先,我们需要对机器学习、深度学习的概念有一些认识。


什么是机器学习呢?Tom Mitchell在其《Machine Learning》一书的序言开场白中给出了一个定义:机器学习这门学科所关注的问题是:计算机程序如何随着经验积累自动提高性能。


在整个机器学习知识领域中,深度学习作为机器学习的一个子领域,是人工智能的重要分支之一。深度学习大致上基于大脑中的信息处理和通信模型,使用从大量的注释数据中学到的特征代替人工编写的特征。在目前的深度学习发展中,卷积深度神经网络 (CNN)、递归神经网络等几种深度学习架构已经在计算机视觉、语音识别、自然语言处理和音频识别中得到了应用。


好了,了解了机器学习、深度学习这些看完似懂非懂的概念之后,我们来用Amazon Rekognition 来看看它们的实际应用。相信玩一圈之后,你就对深度学习人工智能有了新的认识。

 


Amazon Rekognition Amazon AI 系列服务的一部分,是一种采用深度学习技术的完全托管式图像识别服务。Amazon Rekognition 提供了易于使用的 API,能够检测数千种对象和场景、分析面部、比较两副面孔并测量相似性,以及对照面孔库核验面孔。


目前,Amazon Rekognition比较成熟的应用主要有五个:

  • 对象和场景检测

  • 图像监管

  • 面部分析

  • 名人识别

  • 面部比较


接下来,跟随我的步伐,一起探索这些有趣的功能吧。


A——对象和场景检测

Rekognition可识别数千种对象 (如车辆、宠物或家具) 并提供置信度。Rekognition 还可以检测出图像内的场景,如日落或沙滩。这能够轻松添加搜索、筛选等功能,并管理大型图像库。

接下来,看一下我们通过图片获得的测试结果。

 

这幅图是电视剧《伪装者》的剧照图,我们可以看到在图中,有人物、茶壶等在一个堂厅的场景里的。


我们来看看Rekognition的识别结果:


 Rekognition给的识别结果是人、茶壶等关键词,而且每个类别存在的概率(即置信度)都在结果列表里给出了详细的信息。总的来说,测试结果还是比较准确。


我们又测试了一张图片。如下图,是的,依然是《伪装者》的剧照。


我们来看看Rekognition给出的识别结果:


由于图片的内容辨识度更高,我们看到识别结果包括花、植物、玫瑰等不同的关键词,而且在置信度上也有一个比较高的分数。


B——图像审核

Rekognition 能够检测明显和暗示性的内容,因此可以根据应用需求来筛选图像。Rekognition 可以提供一个带有置信度的分级标签列表,能够精细地控制自己允许显示的图像。

说到这一部分的功能,基本上可以用在内容的监测和监管方面,有着很大的实际意义。


 C——面部分析

借助 Rekognition,可以定位到图像中的面孔并分析面孔特征,如面孔是否在微笑或者眼睛是否睁开着。在分析图像时,Rekognition 将返回每个所检测面孔的位置和矩形框架。利用 Rekognition 的面孔分析功能,可以轻松地跟踪用户的情绪。以下图为例,我们看到在杂志的封面图中,胡歌穿着红色的毛衣微笑着看着镜头,我们来看一看Rekognition的识别结果。



识别内容:

 


识别结果分类中有:脸部识别概率,性别,年龄范围,情绪的分析,是否戴眼镜,眼睛和嘴巴是否张开。玩到这里,是不是按耐不住已经打算上传一张自己的图片一测究竟呢?


 D——面部比较

Rekognition 能够衡量两张图像中的面孔属于同一个人的可能性。借助 Rekognition,可使用相似性得分,以近乎实时的方式验证某位用户与参考照片中的人物的相似性。在这里我们选择了两幅图,一幅是胡歌本人的时装杂志的图片,一幅则是从网站上下载的《琅琊榜》的剧照图。我们看到右侧的识别结果,可以明显看到脸部的识别结果,正确率还是可信的。



 试完了一张简单的图,来试一张比较复杂的。我从自己的手机里截图了很多照片的缩略图,我们来看一下Rekognition是否可以从这么多图中找出藏在其中的胡歌。

 


识别结果如下图,可以看到,众里寻他千百度,Rekognition精准的根据相似度找到了藏在缩略集合图中的各种胡歌。


E——名人识别

Rekognition 检测和识别某一领域中数千位著名、显赫和成绩突出的人士。这样一来,就可以根据自己的独特兴趣索引和搜索名人的数字图像库。在这一组的体验中,依然是测试整个图库对于脸部识别的精准度。我们来看以下的例子。

 


是的,在对胡歌的脸部识别中,Rekognition给出了准确的结果。那么,如果换一个人呢?

兄弟情深,对于靳东的检测,也完全没有问题。有些童鞋可能有疑问了,那么对于政要人物的检测准确吗?好的,我们来一组高难度的。

 


左侧图片是被检测的图片,我们看到其实普京是一张侧脸,奥巴马则是一个鬼脸。Rekognition给出的识别结果,虽然在置信度方面没有达到100%,但是也给出了足以让人满意的识别结果。


好了,以上5种功能体验完毕。看到我们一路以胡歌为例的测试,你有没有想自己动手试试呢?


那么,其实只需要一个Amazon的账户就可以开始玩耍了。有兴趣的童鞋,甚至可以好好学习一下深度学习,自己开发一套这样的图片识别系统。


备注:(以上所有测试图片均来自于网络)


我们大数据挖掘实验室正在调试树莓派的人脸识别和语音播报系统:

树莓派+摄像头+AWS账户+Rekognition API +Polly API + AWS loT


稍后分享...



沈浩老师

——————
中国传媒大学新闻学院教授、博士生导师
中国传媒大学调查统计研究所所长

大数据挖掘与社会计算实验室主任

中国市场研究行业协会会长






欢迎关注俺任会长的 市场研究协会

微信号:CMRA_2001

数艺智训
DAtraining

欢迎关注:灵动数艺

——数艺智训

数据艺术家
TableauHome




登录查看更多
5

相关内容

从图像中提取出有意义、有实用价值的信息。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
最新《深度学习行人重识别》综述论文,24页pdf
专知会员服务
81+阅读 · 2020年5月5日
【CVPR2020-港中文】 图像识别中的自注意力探索
专知会员服务
56+阅读 · 2020年4月29日
基于深度神经网络的少样本学习综述
专知会员服务
172+阅读 · 2020年4月22日
斯坦福&谷歌Jeff Dean最新Nature论文:医疗深度学习技术指南
南洋理工大学,深度学习推荐系统综述
专知会员服务
176+阅读 · 2019年10月14日
深度学习技术在自动驾驶中的应用
智能交通技术
26+阅读 · 2019年10月27日
【机器学习】无处不在的机器学习
产业智能官
4+阅读 · 2019年8月18日
基于TensorFlow和Keras的图像识别
Python程序员
16+阅读 · 2019年6月24日
这5种计算机视觉技术,刷新你的世界观
AI研习社
5+阅读 · 2018年11月27日
推荐|改变你对世界看法的五大计算机视觉技术!
全球人工智能
4+阅读 · 2018年4月14日
为什么深度学习不能取代传统的计算机视觉技术?
人工智能头条
3+阅读 · 2018年3月14日
52 个有用的机器学习与预测API
北京思腾合力科技有限公司
3+阅读 · 2017年10月26日
Arxiv
7+阅读 · 2019年10月6日
Arxiv
4+阅读 · 2019年4月17日
Arxiv
5+阅读 · 2018年10月11日
VIP会员
相关资讯
深度学习技术在自动驾驶中的应用
智能交通技术
26+阅读 · 2019年10月27日
【机器学习】无处不在的机器学习
产业智能官
4+阅读 · 2019年8月18日
基于TensorFlow和Keras的图像识别
Python程序员
16+阅读 · 2019年6月24日
这5种计算机视觉技术,刷新你的世界观
AI研习社
5+阅读 · 2018年11月27日
推荐|改变你对世界看法的五大计算机视觉技术!
全球人工智能
4+阅读 · 2018年4月14日
为什么深度学习不能取代传统的计算机视觉技术?
人工智能头条
3+阅读 · 2018年3月14日
52 个有用的机器学习与预测API
北京思腾合力科技有限公司
3+阅读 · 2017年10月26日
Top
微信扫码咨询专知VIP会员