人脸识别、动作识别.....世界最大成人片网站为用户操碎了心

2017 年 10 月 12 日 机器之能 邱陆陆

除了过滤不当内容,计算机视觉还可以为宅男(女)造福。


撰文 | 邱陆陆


日访客量高达 8000 万的成人影片分享网站 Pornhub 近日发表声明称,网站已经将最新的计算机视觉技术用于识别成人影片中演员的身份,标记为视频的标签方便用户检索。

根据官方声明中的描述分析,技术人员应该是在已有的通用人脸识别模型基础之上,利用数万张成人片明星的官方照片和数千段视频片段作为训练集,对模型进行微调(finetune),然后扫描新的视频,提取出含有人脸的帧,与原有数据库进行比对,预测其中可能包含哪位演员,并把置信度高的人名作为视频标签提供给用户。用户可以给影片的演员标签点「赞同」或「反对」来验证 AI 模型的有效性,而模型也会根据用户反馈继续进行修正。



「一切都是为了不断地更新平台,为粉丝提供最先进的技术和最流畅的用户体验」,Pornhub 的副总裁 Corey Price 在接受媒体采访时说,「最终,我们希望为每位粉丝推荐符合他们喜好的影片。而我们的新模型会显著地加快这一进程,让他们成为我们产品的『忠实用户』。」

总部位于人工智能重镇加拿大蒙特利尔的 Pornhub,是目前世界上最大的成人影片分享网站之一,也是各大「世界上最受欢迎的网站」榜单上的常客。网站每天都会新增超过 1 万条视频,依靠人工对视频内容逐一进行标记显然是不现实的,而只要有足够多的细分类目下的精确标注数据,如今成熟的计算机视觉模型是可以在图像分类任务上轻松地实现「比人类标记员还准确」的水平的。


早在两年前,Pornhub 就开始在各大平台公开招聘「有机器学习及数据挖掘经验的数据科学家」,职位描述为「拥有强大好奇心,享受透过现象挖掘本质的过程,能够不断改进模型以臻完美。」而最近一年也有不少用户在 Pornhub 的反馈区里,建议公司使用人工智能和机器学习来推荐视频,Pornhub 的产品经理还很认真地在下面回复:您具体想要哪些功能呢?


Price 之前也透露,网站除了计划在明年对全站所有影片进行标记之外,还会引入更多人工智能模型,对动作类型、场景、演员的不同特征等等进行更详细的分类。


而 Pornhub 也并不是第一个想到将计算机视觉技术与成人影片联系在一起的。去年 11 月,工程师 Ryan Jay 就在 Github 上公开了自己的 Caffe 项目 Miles Deep,用一个卷积神经网络(CNN)对六种不同类型的性行为进行分类,准确度高达 95%,而另一位来自日本的工程师 Xolmon 也发布了用 Chainer 和 Keras 实现根据图片检索女优的功能。当然了,两位程序员都表示,出于大家都知道的原因,我们只能把训练好的模型分享出来,训练集就暂不提供了。

事实上,最强大的与色情内容相关的计算机视觉模型要数各家科技巨头的不恰当内容过滤器了。


Google 在去年 8 月就公开了基于谷歌云的深度学习安全检索 API,方便网站运营者进行内容审核。国内对互联网内容审核愈发严格的环境下,BAT 三家也分别有百度 AI 开放平台的智能内容审核方案、阿里云的阿里绿网、腾讯云的万象优图等提供照片与视频内容智能鉴黄解决方案。


例如,百度的色情识别功能就能把图片分为色情、性感和正常三个类别,并能准确将含有袒露上半身的自由女神的名画《自由引导人民》识别为「正常」。

 通常来说,哪里有最明确的痛点,哪里就会成为高新技术的第一片试验田,在「色情内容」这个牵动全世界成年男女的领域里,人工智能技术显然也不会成为例外。


往期文章


大公司:微软亚马逊阿里百度腾讯英伟达苏宁西门子浪潮


创业公司:商汤科技依图科技思必驰竹间智能三角兽极限元云之声奇点机智景驰科技思岚科技追一科技海知智能出门问问钢铁侠科技体素科技晶泰科技收购


人物报道:吴恩达陆奇王永东黄学东任小枫初敏沈威肖建雄


自动驾驶:传统变革Uber图森未来速腾聚创驭势科技全球汽车AI大会


应用场景:金融医疗法律新零售网络安全


商业地理:加拿大匹兹堡瑞士


登录查看更多
2

相关内容

【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
35+阅读 · 2020年4月5日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
近期必读的8篇 AAAI 2020【图神经网络(GNN)】相关论文
专知会员服务
76+阅读 · 2020年1月15日
【论文推荐】小样本视频合成,Few-shot Video-to-Video Synthesis
专知会员服务
23+阅读 · 2019年12月15日
分析 | 抖音背后的计算机视觉技术
计算机视觉life
9+阅读 · 2019年5月31日
已删除
架构文摘
3+阅读 · 2019年4月17日
PornHub 用计算机视觉识别 A 片中的演员和内容
TechCrunch中国
4+阅读 · 2017年10月13日
人脸识别独角兽之战
数据玩家
6+阅读 · 2017年9月30日
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
Arxiv
5+阅读 · 2018年12月18日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
35+阅读 · 2020年4月5日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
近期必读的8篇 AAAI 2020【图神经网络(GNN)】相关论文
专知会员服务
76+阅读 · 2020年1月15日
【论文推荐】小样本视频合成,Few-shot Video-to-Video Synthesis
专知会员服务
23+阅读 · 2019年12月15日
相关资讯
分析 | 抖音背后的计算机视觉技术
计算机视觉life
9+阅读 · 2019年5月31日
已删除
架构文摘
3+阅读 · 2019年4月17日
PornHub 用计算机视觉识别 A 片中的演员和内容
TechCrunch中国
4+阅读 · 2017年10月13日
人脸识别独角兽之战
数据玩家
6+阅读 · 2017年9月30日
相关论文
SlowFast Networks for Video Recognition
Arxiv
4+阅读 · 2019年4月18日
Arxiv
5+阅读 · 2018年12月18日
ViZDoom Competitions: Playing Doom from Pixels
Arxiv
5+阅读 · 2018年9月10日
Arxiv
3+阅读 · 2012年11月20日
Top
微信扫码咨询专知VIP会员