随着电影制作成为科学艺术的一部分,电影制作者需要更好的方式来评估观众的反应。
观众喜欢多长时间的电影?42分钟?来自加州理工学院和迪斯尼研究所的系统使用面部表情跟踪神经网络来学习和预测观影人如何反应,也许会为尼尔森收视率评级带来新的影响。
研究项目刚刚在夏威夷的IEEE计算机视觉与模式识别会议上发布,通过这种方法能可靠且相对简单地实时跟踪电影院观影人的面部表情。
使用因式分解变量自动编码器 - 矩阵和张量因子分解方法经常用于从嘈杂数据中找到潜在的降维模式。团队研究了基于变分自编码器的非线性张量因子分解方法。非常适合于对于学习的潜在表现与原始数据表示之间的非常复杂的关系设置。
团队用此方法收集了观影人的面部表情大型数据(超过1600万张脸),通过红外高保真摄像机用来抓取每个人的动作和面部表情。实验表明,与传统线性因式分解方法相比,这种方法可以更好地重建数据,进一步发现可解释的潜在因素。
一旦系统完成了训练,团队就设置系统实时抓取观众的表情,并试图预测给定人脸在不同点上的表情。他们发现,大概要花10分钟的时间来预热观众,也就是说,在那之后,观众的哭、笑等表情才更可靠。
当然,这样的技术还可可以应用于其他方面,如监控人群,或其它他领域实时地解释复杂的视觉数据。
参与研究的加州理工学院的Yisong Yue说:“了解人类行为对于开发具有大规模行为和社交智能的AI系统至关重要。例如,开发人工智能系统来协助监测和照顾老年人,能够从身体语言中获取线索。毕竟,人们并不总是了解他们的想法”。
paper:http://t.cn/RKd2ixy
详情:http://t.cn/R9wwRBp
作者:http://www.yisongyue.com/
编辑:雷特
★推荐阅读★
加入「AI从业者社群」请备注个人信息,添加小鸡微信 liulailiuwang