导语:随着人工智能在世界范围内的大爆发,机器学习和深度学习算法不断精进,在图像识别和机器翻译等方面的应用方面,各大巨头也是使出了浑身解数。
今天我们就来借由亚马逊开发出的Amazon Rekognition看一看,人工智能深度学习在图像识别方面有哪些实际性的应用。
首先,我们需要对机器学习、深度学习的概念有一些认识。
什么是机器学习呢?Tom Mitchell在其《Machine Learning》一书的序言开场白中给出了一个定义:“机器学习这门学科所关注的问题是:计算机程序如何随着经验积累自动提高性能。”
在整个机器学习知识领域中,深度学习作为机器学习的一个子领域,是人工智能的重要分支之一。深度学习大致上基于大脑中的信息处理和通信模型,使用从大量的注释数据中学到的特征代替人工编写的特征。在目前的深度学习发展中,卷积深度神经网络 (CNN)、递归神经网络等几种深度学习架构已经在计算机视觉、语音识别、自然语言处理和音频识别中得到了应用。
好了,了解了机器学习、深度学习这些看完似懂非懂的概念之后,我们来用Amazon Rekognition 来看看它们的实际应用。相信玩一圈之后,你就对深度学习人工智能有了新的认识。
Amazon Rekognition是 Amazon AI 系列服务的一部分,是一种采用深度学习技术的完全托管式图像识别服务。Amazon Rekognition 提供了易于使用的 API,能够检测数千种对象和场景、分析面部、比较两副面孔并测量相似性,以及对照面孔库核验面孔。
目前,Amazon Rekognition比较成熟的应用主要有五个:
对象和场景检测
图像监管
面部分析
名人识别
面部比较
接下来,跟随我的步伐,一起探索这些有趣的功能吧。
A——对象和场景检测
Rekognition可识别数千种对象 (如车辆、宠物或家具) 并提供置信度。Rekognition 还可以检测出图像内的场景,如日落或沙滩。这能够轻松添加搜索、筛选等功能,并管理大型图像库。
接下来,看一下我们通过图片获得的测试结果。
这幅图是电视剧《伪装者》的剧照图,我们可以看到在图中,有人物、茶壶等在一个堂厅的场景里的。
我们来看看Rekognition的识别结果:
Rekognition给的识别结果是人、茶壶等关键词,而且每个类别存在的概率(即置信度)都在结果列表里给出了详细的信息。总的来说,测试结果还是比较准确。
我们又测试了一张图片。如下图,是的,依然是《伪装者》的剧照。
我们来看看Rekognition给出的识别结果:
由于图片的内容辨识度更高,我们看到识别结果包括花、植物、玫瑰等不同的关键词,而且在置信度上也有一个比较高的分数。
B——图像审核
Rekognition 能够检测明显和暗示性的内容,因此可以根据应用需求来筛选图像。Rekognition 可以提供一个带有置信度的分级标签列表,能够精细地控制自己允许显示的图像。
说到这一部分的功能,基本上可以用在内容的监测和监管方面,有着很大的实际意义。
C——面部分析
借助 Rekognition,可以定位到图像中的面孔并分析面孔特征,如面孔是否在微笑或者眼睛是否睁开着。在分析图像时,Rekognition 将返回每个所检测面孔的位置和矩形框架。利用 Rekognition 的面孔分析功能,可以轻松地跟踪用户的情绪。以下图为例,我们看到在杂志的封面图中,胡歌穿着红色的毛衣微笑着看着镜头,我们来看一看Rekognition的识别结果。
识别内容:
识别结果分类中有:脸部识别概率,性别,年龄范围,情绪的分析,是否戴眼镜,眼睛和嘴巴是否张开。玩到这里,是不是按耐不住已经打算上传一张自己的图片一测究竟呢?
D——面部比较
Rekognition 能够衡量两张图像中的面孔属于同一个人的可能性。借助 Rekognition,可使用相似性得分,以近乎实时的方式验证某位用户与参考照片中的人物的相似性。在这里我们选择了两幅图,一幅是胡歌本人的时装杂志的图片,一幅则是从网站上下载的《琅琊榜》的剧照图。我们看到右侧的识别结果,可以明显看到脸部的识别结果,正确率还是可信的。
试完了一张简单的图,来试一张比较复杂的。我从自己的手机里截图了很多照片的缩略图,我们来看一下Rekognition是否可以从这么多图中找出藏在其中的胡歌。
识别结果如下图,可以看到,众里寻他千百度,Rekognition精准的根据相似度找到了藏在缩略集合图中的各种胡歌。
E——名人识别
Rekognition 检测和识别某一领域中数千位著名、显赫和成绩突出的人士。这样一来,就可以根据自己的独特兴趣索引和搜索名人的数字图像库。在这一组的体验中,依然是测试整个图库对于脸部识别的精准度。我们来看以下的例子。
是的,在对胡歌的脸部识别中,Rekognition给出了准确的结果。那么,如果换一个人呢?
兄弟情深,对于靳东的检测,也完全没有问题。有些童鞋可能有疑问了,那么对于政要人物的检测准确吗?好的,我们来一组高难度的。
左侧图片是被检测的图片,我们看到其实普京是一张侧脸,奥巴马则是一个鬼脸。Rekognition给出的识别结果,虽然在置信度方面没有达到100%,但是也给出了足以让人满意的识别结果。
好了,以上5种功能体验完毕。看到我们一路以“胡歌”为例的测试,你有没有想自己动手试试呢?
那么,其实只需要一个Amazon的账户就可以开始玩耍了。有兴趣的童鞋,甚至可以好好学习一下深度学习,自己开发一套这样的图片识别系统。
备注:(以上所有测试图片均来自于网络)
我们大数据挖掘实验室正在调试树莓派的人脸识别和语音播报系统:
树莓派+摄像头+AWS账户+Rekognition API +Polly API + AWS loT
稍后分享...
沈浩老师
大数据挖掘与社会计算实验室主任
中国市场研究行业协会会长
欢迎关注:灵动数艺
——数艺智训