时间冲刷之下,如今的视频娱乐正面临新的挑战,爱奇艺找到了解开难题的钥匙。
1985 年,当电视娱乐占据美国家庭,开始成为人们生活休闲不可缺少的一部分时,作家尼尔·波兹曼却看到了它对社会的潜在影响,他觉察出电视节目将不仅仅占用人类时间,更会改造人和娱乐之间的平衡关系,于是在《娱乐至死》一书中这样说道:
「到处是水却没有一滴水可以喝,在信息的海洋里,却找不到一点有用的信息。」
这一观点在三十多年后的今天历久弥新。时间冲刷之下,如今的视频娱乐正面临新的挑战:海量内容每时每刻在被制造,被输出,被传递到所有家庭当中时,这让它膨胀、拥挤不堪,令人眩目,而电视也不再是主要娱乐系统,人们拿起手机,随时随地开始观看视频,这种状态下,视频娱乐往何处去?
这个问题出现在每个人面前,所有人都亟需拿回信息的主动权。对内容公司来说,一切难题的解答,也许都要回归技术来解答,而在爱奇艺 CTO 汤兴看来,AI 技术对视频娱乐系统的改造,正让我们迈向一个全新的,与众不同的未来。
以下内容根据爱奇艺 CTO 汤兴在 IF 2018 大会演讲内容整理:
毫无疑问,我们正处在整个视频的风口。大家的日常生活,抬头会看到屏幕,低头会看到视频,今天很多嘉宾演讲也加入了视频展示。在去年 8 月,根据艾瑞统计,爱奇艺单月用户播放时长就有 76.8 亿小时,相当于 88 万年,这是从时间的维度上看视频数量的爆发。
从空间维度上,视频已经深入到社交、资讯、娱乐,安防、教育、交通、以及医疗等各行各业。在日常生活中,我们本身已经无法离开视频。
回顾视频发展历程,从 1895 年法国第一部电影《火车进站》诞生已来,总体发展只有 100 多年,但随着 1080P、HDR,高清视频进我们的生活,现在也有了 8k 视频,网络直播,以及 VR、全景声……当新技术带给我们更多沉浸感体验,也对视频语义重构和信息媒介运营等产生重大的影响。
去年最火热的技术是深度学习,AI 撬动了整个视频内容的生态,从创作、生产、分发到播放、营销、变现,都因为 AI 技术的引入,对生态产生了巨大的影响。在视频创作、生产、视频标注、分发乃至之后的播放、变现和客服上,AI 无所不在,让爱奇艺视频生产线变得更加自动化、智能化。
具体来看一些有趣的点:视频采购是一个巨大的支出,行业里说拍电影和赌博其实没多大区别,因为每年那么多电影被拍摄出来,真的能上线、赚钱的也就几百部。当我们采购或者决定创作一个内容的时候,怎么能够确定创作出来的是有人看的?目标的群体在哪?最终可预测的播放量是多少?票房是多少?未来给你带来的收益是多少?
在爱奇艺,我们通过 AI 技术实现了多时间窗口的影视剧流量预测。电影的预测准确率能到 81%,我们对电视剧提前半年、一年预测的精准度能够到 88%,比如说《急诊室医生》,我们最终预测的误差低于 3%。这种预测会对最终版权采买的成本控制,以及精准度有巨大的帮助。
同样,我们人类的眼睛也像两个「摄像头」,当我们看到一个场景时,我们很容易分辨出,场景里哪是人哪是物体。但在很久一段时间里,计算机准确识别图片是一件非常困难的事情,现在,随着深度学习、云计算的发展,它变成了可能。今天我们可以通过人物识别、场景识别,识别视频中的事件、情感、对白,实现对视频的语义重构。
在可视化视频时代,最重要的一点是什么?是我们所拥有的大量的媒介内容可被重新解锁。我们现在在互联网搜索视频,是通过关键字描述,未来我们希望像我们眼睛一样,当我们搜索一个物体的时候,我们是通过对这个图片、甚至对这个镜头最根本的理解,来找到相应的物体。
我们知道人脸识别现在精准度很高了,但是当人是背过身,穿着卫衣时,精准度会急剧下降,如果能对视频前后镜头理解,重塑这个三维的人体,那未来机器识别人物会更加精准,而且不依赖于脸部的遮挡。
爱奇艺有全网最大的视频搜索引擎,视频搜索给用户带来了精准找到自己内容的手段。而用户寻找内容的另一个手段是推荐,推荐来自于三个方式。
第一,编辑的推荐。给你推荐最热的内容,但有时候这不是你想要的。
第二,机器推荐。机器也会推热点,推目前最火的内容,它根据相关性,认为这群人和那群人相关,这个内容和那个内容相关,利用相关性来推荐。
第三,通过社交。你的朋友给你推荐内容。
每种推荐都存在问题,前两种最容易带来的问题是过度集中,爱奇艺现在每天的视频内容传送量非常巨大。当我们只给用户推荐他喜欢或者是热度的内容时,大量的产品内容是无法露出的,所以我们需要 AI 去识别用户的属性,识别平台的内容,去推荐他有可能感兴趣的内容。让他个人的习惯、爱好、以及看到的内容更加分散化、长尾化。
今天借助深度学习和人工智能对推荐的帮助,爱奇艺每天会导流 6 亿多的视频。同时我们也拍了一些影片和情景剧,也要经过宣发。传统的宣发追求的是 UV 的大覆盖,需要在用户出现的所有的地方出现相应的广告,他希望用户都能看到这个片子,记住这个片子。但最终的转化率很难衡量,因为他不知道粉丝在哪里。
而今天的宣发,我们通过爱奇艺最大的视频社交平台泡泡,通过对明星和兴趣圈的精准定向,能够让整个宣发变得更加精准,像前一段时间的《中国有嘻哈》,我们社区的精准导流达到了 6300 多万,并且是在刚开始的热播期就达到这样的效果。
大家最怕的广告就是一部视频前面 90 秒广告甚至是 120 秒广告,但很多在真实视频中嵌入场景的广告,反而会让大家觉得更加自然。
我们通过 AI 技术理解视频后,在视频相应场景、物品出现时插入内容相关的随视购广告,大家不会感到大的干扰。比如 AI 技术识别出视频场景是在吃饭、干杯,它就可以推荐和吃相关的告。或者识别人物的对白,做出相应的判断。
同时,怎样去帮助用户创作更多更优秀的视频,真正降低门槛?这是 AI 能够解决的另一个问题。
在文学界有一种同人小说的概念,优质的作品经过粉丝对它的改写,会变成各种不同的结局、更多后续情节发展。日本有一个铁人编辑大赛,通过一些动画片粉丝对动画的重新定义,产生了新的动画,通过加入新的对白和新的音轨,按照自己创作的故事情节重新编排整个动画,会产生新的艺术形式。
经过了一百多年的发展,我们已经积累了浩瀚的视频内容,而这些内容以前是沉寂在那里的,绝大多数的视频流量来自于电视剧,而电视剧通常来说热播期也就几个月,这几个月过去以后,大量的优质内容就会沉淀在媒介系统中。如何让这些系统的内容重新被利用,帮助普通用户或者是编辑来创作更多更好的视频,这是 AI 时代能够帮助我们解决的最重要的问题之一。
我们目前正在做的,是让整个平台的视频从原始的制作开始逆向的工程,通过 AI 进行镜头的重新提取和分割,对镜头重新进行标注,对里面的物体重新识别,自动将各个镜头归类,这样当用户想创作新的视频的时候,可以充分利用以前已经生产过的精彩内容。
当你想拍一个埃菲尔铁塔的视频的时候,拍摄的成本是巨大的,但这个世界上已经有无数多的人拍出过相应的镜头,你如果能找到相应的镜头,把它重新组合,重新配上音乐和对白、你的字幕,充分利用你的才华,把你的精力放在剧本创作上,我们会从原来的内容产生更多新的内容。
利用旧有视频的素材做结合,产生新的视频,对未来视频生产会有巨大的推动作用。今天用户之所以不愿意上传视频,最大的问题是视频的制作是非常专业的事情。手机只是让拍摄变得简单,但在镜头的拍摄,灯光、道具、特效方面仍然是非常专业的,我们希望 AI 时代的发展,能让那些视频的制作者继续在后期有变现的机会,我们可以采用区块链技术管理版权,把版权在后期进行全面的追踪,让后来的人利用前面艺术家创作的内容,去创作更多、更好的内容。
现在我们在做的事情,会对明天视频娱乐发展产生什么影响?我最后用三个无来谈谈:
第一、AI 对内容无所不知
通过对视觉、语音的感知、语义理解、知识图谱推理,AI 对视频的理解在慢慢接近人类。它们不仅能理解视频里静止的象素,还会理解里面的信息。未来通过 AI 帮我们总结一篇文章,一个视频的段落大意变为真正的可能。
第二、交互在未来无所不能
直播的发展,让我们可以在远端和别人进行沟通,也催生了移动直播的飞速发展,所以 VR 、 AR,以及全景声的发展,随着整个 AI 技术的进步以及生物科技、人机交互的融合,未来视频世界会变成我们现实世界的一个平行世界。
第三、开放让娱乐无所不在
整个科技的发展,尤其是 AI 的发展,让它能够帮助我们创造出更多的虚拟世界,可以让我们在千里之外来到现场。未来,你一定可以通过视频、通过娱乐去体验你体验不到的人生。当你参与其中变成了在一个虚拟世界中的替身,你可以做现实世界中做不到的事情或是尝试不到的东西,去体验另一种人生。
人类有天生的基因,我们希望把我们做的所有的重复性的工作交给机器来做,AI 时代,人和机器之间的互动变得更加重要,我们需要的是能让我们开心,让我们对现有生活、未来生活、对看不见的生活引发好奇,这种好奇会带来对新知识、新领域的探索并最终产生创新。这是我们的目标,也是我们一直追求的未来。
编辑:Rubberso
本文由极客公园原创
转载联系 zhuanzai@geekpark.net