Rekognition 识别图像文字的功能是指,当用户使用了 Rekognition 服务后,可以识别路牌、交通摄像头拍摄的车牌、新闻、电视屏幕上的标题等,并提取图像中的文本内容。该功能支持大多数拉丁语文本和嵌入在各种物体上的数字,还支持识别覆盖在背景上的各种方向的文字,如横幅和海报等。
正如已经开始使用亚马逊 Rekognition 服务的图片社交媒体 Pinterest CTO Vanja Josifovski 所说,Rekognition 的图像文字识别功能满足了很多人的需求。Pinterest 作为一个以视觉为主的平台,图像的上传下载速度和质量固然重要,但这些图像的描述性文字的作用,对该平台的 2 亿多活跃来说同样不可忽略。Josifovski 称,Rekognition 的图像文字识别功能使得该平台可以大规模地从海量的图片中抓取文字信息,而且 Pins 存储在亚马逊 S3 上的图片延迟时间也会大大减少。
又如,三星联合创始人兼 CEO Don MacAskill 称,有一些专业摄影师会使用三星手机拍摄马拉松比赛中运动服上的号码拿来售卖,通过使用亚马逊 Rekognition,摄影师可以批量提取图像中的数字,提高工作效率,更快实现变现。
亚马逊 Rekognition 的另一个新功能——实时面部识别也很有意思,可以从数千万张面孔中实时搜索和识别特定面孔。这意味着,面部搜索的效率将提高 5-10 倍,同时存储的脸孔数量增加 10-20 倍。 在治安和公共安全领域,这个功能可用于在数千万张面孔中识别出目标面孔,在需要迅速做出反应的场景中将发挥重要的作用。
例如,华盛顿州警察局是接收俄勒冈居民 911 报警电话的部门,还为美国其他城市的警察局提供预防犯罪支持。据悉,该警局在过去的一年中使用亚马逊 Rekognition 后,识别犯罪嫌疑人所需的时间从 2-3 天缩短至数分钟,使用该系统一周之内,就“抓住”了第一个嫌疑犯。
亚马逊 Rekognition 发布的第三个新功能群像人脸识别,可以让用户在一张群像图片中同时检测、分析、搜索 15-100 张人脸,在群像图片和拥挤的场所,如机场、商场中,也可以精确识别、分析图像中所有人的情绪。
Sen 公司 SRE 工程部主管宫原慎治说道,该公司平台上有大量用户购买或上传的图片,该公司长期使用亚马逊 Rekognition 从这些照片中搜索特定的人脸,比如某个用户的孩子的图片。在应用这个功能之前,为了准确检测到群像中所有比例较小的面孔,他们不得不裁剪和分割原始图像。而通过使用 Rekognition 的群像人脸识别功能,该公司可以轻松做到一次性检测所有人脸,而无需进行任何复杂的预处理。
Rekognition 新功能不仅使得图像识别的效率提高,人脸检测算法的精度也有所提高。据亚马逊称,在登机手续办理柜台、门卫处和移动人脸验证应用中的 Rekognition 面部验证和识别,精准度提高了 10%。
在 2016 年的 AWS re:Invent 2016 Keynote 会议上,AWS CEO Andy Jassy 发布了基于深度学习的亚马逊 Rekognition。Amazon Rekognition 的全面管理服务,可以让用户的应用从图像中提取信息,检测图像中的物体和人脸,实时批量化处理图像,具有识别物体和场景,以及面部分析的能力,从而让应用变得更加智能,提高用户体验。
在发布这三个新功能之前,Amazon Rekognition 已经具备检测人的情绪和特征、根据物体和场景识别人脸的功能,并可以识数百万名政治、体育、商界、娱乐和媒体界名人。与微软和谷歌提供的服务类似,使用 Amazon Rekognition,开发者需要建立一个 API。
以上图的人脸检测 API 为例,用户可以通过输入的图像检测到面部的存在和位置。除了面部边界框和标注,API 还会反馈每张面孔的特征,如情感、性别、眼镜、睁眼或闭眼、胡须、微笑等。
在这个每年都生成海量图片的时代,图像处理的需求也将呈爆炸式增长,类似于亚马逊 Rekognition 的结合了人工智能技术的图像处理服务应用场景相当广泛。例如,Rekognition 正在帮助 Marinus Analytics 打击人口贩卖。这家公司的旗舰软件被美国执法机构用于性贩运调查,借助 Rekognition,执法机构可以在几秒钟内搜索数百万条记录,找到受害者,并迅速采取有效措施。