除了过滤不当内容,计算机视觉还可以为宅男(女)造福。
撰文 | 邱陆陆
日访客量高达 8000 万的成人影片分享网站 Pornhub 近日发表声明称,网站已经将最新的计算机视觉技术用于识别成人影片中演员的身份,标记为视频的标签方便用户检索。
根据官方声明中的描述分析,技术人员应该是在已有的通用人脸识别模型基础之上,利用数万张成人片明星的官方照片和数千段视频片段作为训练集,对模型进行微调(finetune),然后扫描新的视频,提取出含有人脸的帧,与原有数据库进行比对,预测其中可能包含哪位演员,并把置信度高的人名作为视频标签提供给用户。用户可以给影片的演员标签点「赞同」或「反对」来验证 AI 模型的有效性,而模型也会根据用户反馈继续进行修正。
「一切都是为了不断地更新平台,为粉丝提供最先进的技术和最流畅的用户体验」,Pornhub 的副总裁 Corey Price 在接受媒体采访时说,「最终,我们希望为每位粉丝推荐符合他们喜好的影片。而我们的新模型会显著地加快这一进程,让他们成为我们产品的『忠实用户』。」
总部位于人工智能重镇加拿大蒙特利尔的 Pornhub,是目前世界上最大的成人影片分享网站之一,也是各大「世界上最受欢迎的网站」榜单上的常客。网站每天都会新增超过 1 万条视频,依靠人工对视频内容逐一进行标记显然是不现实的,而只要有足够多的细分类目下的精确标注数据,如今成熟的计算机视觉模型是可以在图像分类任务上轻松地实现「比人类标记员还准确」的水平的。
早在两年前,Pornhub 就开始在各大平台公开招聘「有机器学习及数据挖掘经验的数据科学家」,职位描述为「拥有强大好奇心,享受透过现象挖掘本质的过程,能够不断改进模型以臻完美。」而最近一年也有不少用户在 Pornhub 的反馈区里,建议公司使用人工智能和机器学习来推荐视频,Pornhub 的产品经理还很认真地在下面回复:您具体想要哪些功能呢?
Price 之前也透露,网站除了计划在明年对全站所有影片进行标记之外,还会引入更多人工智能模型,对动作类型、场景、演员的不同特征等等进行更详细的分类。
而 Pornhub 也并不是第一个想到将计算机视觉技术与成人影片联系在一起的。去年 11 月,工程师 Ryan Jay 就在 Github 上公开了自己的 Caffe 项目 Miles Deep,用一个卷积神经网络(CNN)对六种不同类型的性行为进行分类,准确度高达 95%,而另一位来自日本的工程师 Xolmon 也发布了用 Chainer 和 Keras 实现根据图片检索女优的功能。当然了,两位程序员都表示,出于大家都知道的原因,我们只能把训练好的模型分享出来,训练集就暂不提供了。
事实上,最强大的与色情内容相关的计算机视觉模型要数各家科技巨头的不恰当内容过滤器了。
Google 在去年 8 月就公开了基于谷歌云的深度学习安全检索 API,方便网站运营者进行内容审核。国内对互联网内容审核愈发严格的环境下,BAT 三家也分别有百度 AI 开放平台的智能内容审核方案、阿里云的阿里绿网、腾讯云的万象优图等提供照片与视频内容智能鉴黄解决方案。
例如,百度的色情识别功能就能把图片分为色情、性感和正常三个类别,并能准确将含有袒露上半身的自由女神的名画《自由引导人民》识别为「正常」。
通常来说,哪里有最明确的痛点,哪里就会成为高新技术的第一片试验田,在「色情内容」这个牵动全世界成年男女的领域里,人工智能技术显然也不会成为例外。
往期文章
大公司:微软、亚马逊、阿里、百度、腾讯、英伟达、苏宁、西门子、浪潮
创业公司:商汤科技、依图科技、思必驰、竹间智能、三角兽、极限元、云之声、奇点机智、景驰科技、思岚科技、追一科技、海知智能、出门问问、钢铁侠科技、体素科技、晶泰科技、收购
人物报道:吴恩达、陆奇、王永东、黄学东、任小枫、初敏、沈威、肖建雄
自动驾驶:传统变革、Uber、图森未来、速腾聚创、驭势科技、全球汽车AI大会