信息爆发的当下，怎样拯救令你无所适从的娱乐生活？

2018 年 1 月 21 日 极客公园 谁是大英雄

时间冲刷之下，如今的视频娱乐正面临新的挑战，爱奇艺找到了解开难题的钥匙。

1985 年，当电视娱乐占据美国家庭，开始成为人们生活休闲不可缺少的一部分时，作家尼尔·波兹曼却看到了它对社会的潜在影响，他觉察出电视节目将不仅仅占用人类时间，更会改造人和娱乐之间的平衡关系，于是在《娱乐至死》一书中这样说道：

「到处是水却没有一滴水可以喝，在信息的海洋里，却找不到一点有用的信息。」

这一观点在三十多年后的今天历久弥新。时间冲刷之下，如今的视频娱乐正面临新的挑战：海量内容每时每刻在被制造，被输出，被传递到所有家庭当中时，这让它膨胀、拥挤不堪，令人眩目，而电视也不再是主要娱乐系统，人们拿起手机，随时随地开始观看视频，这种状态下，视频娱乐往何处去？

这个问题出现在每个人面前，所有人都亟需拿回信息的主动权。对内容公司来说，一切难题的解答，也许都要回归技术来解答，而在爱奇艺 CTO 汤兴看来，AI 技术对视频娱乐系统的改造，正让我们迈向一个全新的，与众不同的未来。

以下内容根据爱奇艺 CTO 汤兴在 IF 2018 大会演讲内容整理：

毫无疑问，我们正处在整个视频的风口。大家的日常生活，抬头会看到屏幕，低头会看到视频，今天很多嘉宾演讲也加入了视频展示。在去年 8 月，根据艾瑞统计，爱奇艺单月用户播放时长就有 76.8 亿小时，相当于 88 万年，这是从时间的维度上看视频数量的爆发。

从空间维度上，视频已经深入到社交、资讯、娱乐，安防、教育、交通、以及医疗等各行各业。在日常生活中，我们本身已经无法离开视频。

当 AI 重构视频生态

回顾视频发展历程，从 1895 年法国第一部电影《火车进站》诞生已来，总体发展只有 100 多年，但随着 1080P、HDR，高清视频进我们的生活，现在也有了 8k 视频，网络直播，以及 VR、全景声……当新技术带给我们更多沉浸感体验，也对视频语义重构和信息媒介运营等产生重大的影响。

去年最火热的技术是深度学习，AI 撬动了整个视频内容的生态，从创作、生产、分发到播放、营销、变现，都因为 AI 技术的引入，对生态产生了巨大的影响。在视频创作、生产、视频标注、分发乃至之后的播放、变现和客服上，AI 无所不在，让爱奇艺视频生产线变得更加自动化、智能化。

具体来看一些有趣的点：视频采购是一个巨大的支出，行业里说拍电影和赌博其实没多大区别，因为每年那么多电影被拍摄出来，真的能上线、赚钱的也就几百部。当我们采购或者决定创作一个内容的时候，怎么能够确定创作出来的是有人看的？目标的群体在哪？最终可预测的播放量是多少？票房是多少？未来给你带来的收益是多少？

在爱奇艺，我们通过 AI 技术实现了多时间窗口的影视剧流量预测。电影的预测准确率能到 81%，我们对电视剧提前半年、一年预测的精准度能够到 88%，比如说《急诊室医生》，我们最终预测的误差低于 3%。这种预测会对最终版权采买的成本控制，以及精准度有巨大的帮助。

同样，我们人类的眼睛也像两个「摄像头」，当我们看到一个场景时，我们很容易分辨出，场景里哪是人哪是物体。但在很久一段时间里，计算机准确识别图片是一件非常困难的事情，现在，随着深度学习、云计算的发展，它变成了可能。今天我们可以通过人物识别、场景识别，识别视频中的事件、情感、对白，实现对视频的语义重构。

被重塑的用户体验

在可视化视频时代，最重要的一点是什么？是我们所拥有的大量的媒介内容可被重新解锁。我们现在在互联网搜索视频，是通过关键字描述，未来我们希望像我们眼睛一样，当我们搜索一个物体的时候，我们是通过对这个图片、甚至对这个镜头最根本的理解，来找到相应的物体。

我们知道人脸识别现在精准度很高了，但是当人是背过身，穿着卫衣时，精准度会急剧下降，如果能对视频前后镜头理解，重塑这个三维的人体，那未来机器识别人物会更加精准，而且不依赖于脸部的遮挡。

爱奇艺有全网最大的视频搜索引擎，视频搜索给用户带来了精准找到自己内容的手段。而用户寻找内容的另一个手段是推荐，推荐来自于三个方式。

第一，编辑的推荐。给你推荐最热的内容，但有时候这不是你想要的。

第二，机器推荐。机器也会推热点，推目前最火的内容，它根据相关性，认为这群人和那群人相关，这个内容和那个内容相关，利用相关性来推荐。

第三，通过社交。你的朋友给你推荐内容。

每种推荐都存在问题，前两种最容易带来的问题是过度集中，爱奇艺现在每天的视频内容传送量非常巨大。当我们只给用户推荐他喜欢或者是热度的内容时，大量的产品内容是无法露出的，所以我们需要 AI 去识别用户的属性，识别平台的内容，去推荐他有可能感兴趣的内容。让他个人的习惯、爱好、以及看到的内容更加分散化、长尾化。

今天借助深度学习和人工智能对推荐的帮助，爱奇艺每天会导流 6 亿多的视频。同时我们也拍了一些影片和情景剧，也要经过宣发。传统的宣发追求的是 UV 的大覆盖，需要在用户出现的所有的地方出现相应的广告，他希望用户都能看到这个片子，记住这个片子。但最终的转化率很难衡量，因为他不知道粉丝在哪里。

而今天的宣发，我们通过爱奇艺最大的视频社交平台泡泡，通过对明星和兴趣圈的精准定向，能够让整个宣发变得更加精准，像前一段时间的《中国有嘻哈》，我们社区的精准导流达到了 6300 多万，并且是在刚开始的热播期就达到这样的效果。

AI 影响下的商业化之路

大家最怕的广告就是一部视频前面 90 秒广告甚至是 120 秒广告，但很多在真实视频中嵌入场景的广告，反而会让大家觉得更加自然。

我们通过 AI 技术理解视频后，在视频相应场景、物品出现时插入内容相关的随视购广告，大家不会感到大的干扰。比如 AI 技术识别出视频场景是在吃饭、干杯，它就可以推荐和吃相关的告。或者识别人物的对白，做出相应的判断。

同时，怎样去帮助用户创作更多更优秀的视频，真正降低门槛？这是 AI 能够解决的另一个问题。

在文学界有一种同人小说的概念，优质的作品经过粉丝对它的改写，会变成各种不同的结局、更多后续情节发展。日本有一个铁人编辑大赛，通过一些动画片粉丝对动画的重新定义，产生了新的动画，通过加入新的对白和新的音轨，按照自己创作的故事情节重新编排整个动画，会产生新的艺术形式。

经过了一百多年的发展，我们已经积累了浩瀚的视频内容，而这些内容以前是沉寂在那里的，绝大多数的视频流量来自于电视剧，而电视剧通常来说热播期也就几个月，这几个月过去以后，大量的优质内容就会沉淀在媒介系统中。如何让这些系统的内容重新被利用，帮助普通用户或者是编辑来创作更多更好的视频，这是 AI 时代能够帮助我们解决的最重要的问题之一。

我们目前正在做的，是让整个平台的视频从原始的制作开始逆向的工程，通过 AI 进行镜头的重新提取和分割，对镜头重新进行标注，对里面的物体重新识别，自动将各个镜头归类，这样当用户想创作新的视频的时候，可以充分利用以前已经生产过的精彩内容。

当你想拍一个埃菲尔铁塔的视频的时候，拍摄的成本是巨大的，但这个世界上已经有无数多的人拍出过相应的镜头，你如果能找到相应的镜头，把它重新组合，重新配上音乐和对白、你的字幕，充分利用你的才华，把你的精力放在剧本创作上，我们会从原来的内容产生更多新的内容。

利用旧有视频的素材做结合，产生新的视频，对未来视频生产会有巨大的推动作用。今天用户之所以不愿意上传视频，最大的问题是视频的制作是非常专业的事情。手机只是让拍摄变得简单，但在镜头的拍摄，灯光、道具、特效方面仍然是非常专业的，我们希望 AI 时代的发展，能让那些视频的制作者继续在后期有变现的机会，我们可以采用区块链技术管理版权，把版权在后期进行全面的追踪，让后来的人利用前面艺术家创作的内容，去创作更多、更好的内容。