大剧播出无人值守“心里不慌”,优酷全链路技术齐上阵

2020 年 6 月 29 日 CSDN

作者|  阿里文娱高级测试开发工程师 党高锋

责编 | 夕颜

头图 | CSDN下载自视觉中国

什么是大剧保障?


优酷大剧保障主要是对大剧、大综等节目视频上线前和上线后进行质量保障。大剧视频上线所涉及方很多:比如播放(类似报错、卡住、黑屏、声音等问题)、付费权益、运营配置、用户舆情反馈是否正常等。


总的来说,优酷大剧保障主要是在大剧大综开播前、开播后对视频进行质量保障,及时发现问题并解决,避免资损和客诉,使用户有更好的观影体验。

 

如何保障?


大剧保障基本涵盖了大剧生命周期的全链路各个阶段保障,其中核心环节包括以下方面:

 

              

针对图中的各阶段,我们建设了大剧上线流程中需要保障的环节以及能力:

 

1. 视频生产

    1. 视频生产环节保障包括片源质量、上传转码质量等维度,主要以视频质量检测为主:1)介质到位时间,在上线前 24 小时检查介质是否到位;

    2. 介质质量,采用机检和人工检查两种方式进行,保证片源正常;

    3. 上传转码耗时评估,重点关注开播前转码完成情况;

    4. 码完成的流会自动进入视频质量检测,检测其声音、画质、数据等;

    5. 直播流生产场景,主要检测源流规格、流稳定性等源流质量,录制过程中关注负载、排 队、耗时、画质等。

 

2. 运营管理


  1. 视频、节目播控策略检测及实时监控;

  2. 媒资数据检查,如广告点位、编目、其他重要字段,实时变化通知。


3. 权益管理 


  1. 付费会员是视频网站的重要上帝用户,保证会员权益重中之重:1)会员可看视频的会员权益正确;

  2. 付费点播的交易、权益正确;

  3. 视频相关付费属性的校验和实时监控。

 

4.播放环节


播放环节是最主要的环节。以前有个痛点:视频在开播前是屏蔽状态,无法提前通过前端 播放,只能等开播后到线上观看,如果有问题则为时已晚。为了解决这个问题,我们建设了播 放预览能力:


  1. 播放提供预览环境,可以播放未上线的视频,同时与线上真实场景保持一致的会员权益、 广告、播放策略等,保证上线前可以模拟上线后的真实数据;

  2. 同时优酷提供 APP、PC 等客户端预览环境,得以在各端验证播放效果。


另外,我们也将播放自动化测试能力赋能在播放环节,比如接口自动化测试、播放器自动 化测试。


5.线上监控


  1. 上线之后,除了有全量的播放监控,也有针对大剧建立了相应指标监控和报警,如播放 成功率、卡顿率等;

  2. 对弹幕评论、客诉反馈、社会舆情中的信息,建立了实时监控,发现问题及时响应排查。

 

大剧保障平台


围绕以上各环节,我们建立了大剧保障平台,提供自动或人工的检测机制,并有相关变更 和事件的通知触达能力。


下图是我们覆盖到的业务以及相关的功能。

              

1.大剧管理


我们会将重要级别的剧集自动或手动方式录入到大剧保障平台,平台将自动拉取节目下的 正片视频、介质,上线时间等信息,大剧保障将围绕上线时间展开一系列的保障。

              

2.服务管控


大剧上线期间,相关信息第一时间同步给各环节服务方,核心应用避免在大剧上线期间发 布,如有服务发布或变更出现问题,第一时间回滚,避免问题扩大化。为了避免大剧上线期间 因服务发布产生的问题,我们制定了服务管控规则:


1)大剧上线期间禁止相关业务发布变更,会在开播前机器人通知所有人;

2)热度比较高的剧,实施封网管控。

 

3.问题触达


建立大剧保障钉钉群,将所有相关业务方技术、产品、运营等同学集中到一起,并配置机 器人用于发送报警通知。系统支持订阅大剧重要字段的变更通知,实时监听正片的各个字段变 化,有异常则报警通知。同时将各个业务方已有的保障和报警能力接入进来。


检测预警消息接入后,各环节消息非常多,重要消息有可能会被忽略,那如何优化消息触 达,不错过重要异常信息呢?通过持续建立和优化机器判断的能力,重要异常情况发送报警并 精准触达到指定人。同时我们会存储以上所有操作变更记录和时间点,用于快速排查问题。


4. 机器和人工保障


1)系统自动执行各个环节的机器检测,并提供人工 check 机制,双重保障; 

               

2)上线前实时的检测以及结果直观的展示;

             

3)上线前 24 小时播报检测情况,比如在上线前的 12 小时、4 小时、1 小时播报当前检测 状态。这样不仅让各方知晓即将上线剧集,也了解各个业务的检查状况。

 

5.线上监控


1)上线后的实时弹幕评论预警,客诉预警。其中我们在弹幕评论这块做到了自动化过滤关 键字来实时报警,这也是比较准确和及时的舆情来源;

2)上线后的播放质量监控。监控各端播放卡顿、成功率、错误数等情况,及时关注各端播 放情况。

 

6.应急预案


大剧建设了发现问题的能力,也要有应对快速止血的机制。我们确定了出现问题时的预案 项以及相关人员,保证问题第一时间准确的传达和快速止血,保证及时止损和问题快速修复, 减少对用户的影响。

 

总结


通过以上大剧保障能力的建设,我们在一个平台上可以直观的看到每部大剧在上线前各个 环节的健康状态,异常变动有预警通知,有线上的稳定性监控以及舆情监控,线上问题有相对应的快速止血策略,整个保障链路形成闭环。目前平台相关能力仍在持续建设中,横向我们将 覆盖更多的相关联业务方,纵向将持续细化和加强每个业务方的保障能力。我们的目标是向着自动化、智能化发展,无人值守,做到上线前“心里有底”,上线后“心里不慌”。


【END】

更多精彩推荐

☞汉芯一号、木兰语言再到天赐 OS,国产基础软件十年泣血,梦想何圆?

☞JavaScript 虽火,但不要轻易去追随!

密码界“女杀手”,破译世上最安全密码系统,获 771 万奖金!

138 张图带你 MySQL 入门!

独家揭秘!抖音爆款漫画变身特效的背后技术

2013年买了100万美元比特币却希望“比特币归零”,这位亿万富翁公开“比特币鲸鱼”身份

你点的每个“在看”,我都认真当成了喜欢


登录查看更多
1

相关内容

一家在线视频网站,隶属于优酷土豆集团。
【经典书】统计学,806页pdf,解锁数据的力量
专知会员服务
79+阅读 · 2020年8月12日
【实用书】Python爬虫Web抓取数据,第二版,306页pdf
专知会员服务
116+阅读 · 2020年5月10日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
118+阅读 · 2020年5月6日
大数据安全技术研究进展
专知会员服务
91+阅读 · 2020年5月2日
算法与数据结构Python,369页pdf
专知会员服务
161+阅读 · 2020年3月4日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
阿里 Lindorm 技术解析:支撑每秒7亿次请求
DataFunTalk
5+阅读 · 2019年12月13日
爱奇艺视频人物识别技术及应用
QCon
7+阅读 · 2019年4月8日
如何运营15万付费用户?
三节课
6+阅读 · 2019年2月28日
毫不自夸,甚至有点骄傲——视频检测与拼接
无人机
9+阅读 · 2018年12月25日
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
探秘视频编码黑科技,窄带高清2.0视觉模型及场景实战
机器学习研究会
5+阅读 · 2017年10月22日
直击“黑产”痛点,金融反欺诈大赛等你夺魁
数据挖掘入门与实战
4+阅读 · 2017年8月7日
Arxiv
3+阅读 · 2019年8月26日
Area Attention
Arxiv
5+阅读 · 2019年2月5日
Risk-Aware Active Inverse Reinforcement Learning
Arxiv
7+阅读 · 2019年1月8日
Arxiv
5+阅读 · 2016年10月24日
Arxiv
3+阅读 · 2012年11月20日
VIP会员
相关VIP内容
相关资讯
阿里 Lindorm 技术解析:支撑每秒7亿次请求
DataFunTalk
5+阅读 · 2019年12月13日
爱奇艺视频人物识别技术及应用
QCon
7+阅读 · 2019年4月8日
如何运营15万付费用户?
三节课
6+阅读 · 2019年2月28日
毫不自夸,甚至有点骄傲——视频检测与拼接
无人机
9+阅读 · 2018年12月25日
抖音的 2017 和它背后的黑科技
PingWest品玩
8+阅读 · 2018年1月4日
探秘视频编码黑科技,窄带高清2.0视觉模型及场景实战
机器学习研究会
5+阅读 · 2017年10月22日
直击“黑产”痛点,金融反欺诈大赛等你夺魁
数据挖掘入门与实战
4+阅读 · 2017年8月7日
Top
微信扫码咨询专知VIP会员