Salsify:来自斯坦福的下一代RTC技术

2018 年 4 月 26 日 前端之巅 覃云 编译
Salsify 是斯坦福研究的新型实时视频系统,它可协同控制视频编解码器和网络传输协议,在质量方面和延迟方面优于目前的实时视频系统。
项目背景

当前,实时视频系统如 Skype、Facetime、WebRTC 是由两个独立的组件构建的,一个是压缩视频的“视频编解码器”,另一个是网络“传输协议”,它根据数据传输速度来传输数据包,并避免网络过载。

多年来,视频编解码器和传输协议经过不同公司进行设计与构建,然后整合到诸如 Skype、FaceTime 等应用程序中。

然而,每个组件都有自己的控制回路,传输协议里有一个“拥塞控制”,它可以在发生拥塞时控制进入网络的数据量,而编解码器有自己的“速率控制”算法,并根据传输协议提供的信息进行视频压缩。传输协议必须和编解码器一同工作,当传输协议和编解码器不同步或网络条件不稳定时,就容易发生延迟现象或故障。

而 Salsify 是在单个回路中协同逐帧控制压缩和逐包控制传输,这可以让视频流根据网络的变化进行调整,避免延迟。

技术解读

当前的视频编码器不能准确预测单个视频帧的压缩大小,相反,编解码器总是试图控制几个帧的“比特率”(例如通过 VBV 约束)。如果编码器产生的帧与传输协议认为网络可以容纳的帧相比太大,应用程序通常会传输它,之后,它认为这可能会引起拥塞,那么应用程序可能会暂停将数据输入视频编码器,以缓解拥塞。

但这不是一个很好的方案,因为网络仍然拥塞。更好的方法应该是,如果编码器产生的压缩帧太大,系统应该提醒编码器重新试一次,不是通过降低质量对相同的帧进行重新编码,而是应该从摄像机中取出一个新帧,并进行编码, 质量设置为不会使网络拥塞的压缩帧。实际上,只有在不会引起丢包和延迟的情况下才发送帧,而不应该固定帧的发送频率。

Salsify 纯功能的视频编解码器就能实现这一点。它的视频编解码器与 Google VP8 格式 100%兼容,编码和解码是纯功能性的,没有副作用,同时展现解码器的帧间“状态”。这将允许 Salsify 编码器相对于任意解码器状态压缩一帧,允许应用程序安全地跳过来自编码器输出的帧,而不仅仅是输入的帧。

Salsify 的编解码器保证发送者不会在网络拥塞时发送帧(必要时会丢弃已经编码的帧),不固定帧的发送速率。它还允许编解码器生成更接近可用网络容量的帧,生成每个帧的两个版本:其中一个质量略高于先前的成功案例,另一个质量略低。应用程序在查看每个选项的实际压缩大小后,从这些选项中选择(或不选)。

Salsify 压缩视频的格式是谷歌的 VP8,之后被 VP9 和 H.265 取代。Salsify 的纯功能 VP8 编码器 / 解码器是去年用于 ExCamera 的一个修改过的版本,它的优点是允许我们将视频编码细分为小线程(小于关键帧之间的间隔),并且可以并行处理数千 AWS Lambda 上的线程。今年,Salsify 可以探索视频编解码器的执行路径。Salsify 的拥塞控制方案基于 Sprout-EWMA,后者又基于数据包对( packet-pair )的早期工作和可用带宽的包列( packet-train)估计。Salsify 的损失恢复策略与 Mosh 的 “p-retransmissions” 相关。

综上,Salsify 创新体现在新的组合方式——编解码器速率控制和传输拥塞控制,以及使用功能性视频编解码器,并仅在网络可以容纳它们时才发送编码帧。

性能对比

研究人员将 Salsify 与微软的 Skype、Google Google Hangouts、苹果的 FaceTime 以及 Google 浏览器中的 Internte 标准 WebRTC 协议进行测试,就平均而言,Salsify 在延迟上仅是后者平均值的四分之一,图片质量至少提高了 60%,

测试结果如下:

关于未来

Salsify 的技术团队坦言,他们很希望 Salsify 能够融入行业中,并愿意在法律上提供帮助,但是在技术层面上,这恐怕不是那么容易。如果 Salsify 只是一个优良的视频编解码器或传输协议,这就会简单得多,相反,Salsify 是一种将各个部分组合起来的技术形式,这意味着,在不进行重构的情况下对现有应用程序进行改造将会变得很困难,这是他们与业界对话之后得到的结论,因为他们很难拿出有效证据证明 Salsify 的收益是可观的,其次,目前来讲,他们也很难通过对现有应用程序进行小改动就能达到 Salsify 赋予的新特性。

  项目简介

Salsify 项目由斯坦福大学的学生们研发,并获得国家科学基金会和国防部高级研究计划署(DARPA)的资助。同时获得了谷歌、华为、VMware、Dropbox、Facebook 和斯坦福平台实验室的支持。该项目相关的论文和原始数据都是对外开放的,而且源码也是开源的。

  相关链接

原文链接:

https://snr.stanford.edu/salsify/

GitHub:

https://github.com/excamera/alfalfa

相关论文:

https://www.usenix.org/system/files/conference/nsdi18/nsdi18-fouladi.pdf

前端之巅

「前端之巅」是 InfoQ 旗下关注大前端技术的垂直社群。紧跟时代潮流,共享一线技术,欢迎关注。

  活动推荐

PWA、Web 框架、UI 与动画、Node... 大前端的下一站在哪里?前端工程师的价值和成长路径是什么?GMTC2018 上,来自 Google、Facebook、BAT 等 60+ 国内外一线前端大牛,将与你面对面探讨大前端领域最新技术趋势和实践,想要升职加薪就快来吧!扫描下方二维码或点击“阅读原文”了解更多大会详情!

目前大会 8 折热销中,团购更优惠,购票咨询:18514549229(同微信)

登录查看更多
4

相关内容

【CVPR2020】跨模态哈希的无监督知识蒸馏
专知会员服务
61+阅读 · 2020年6月25日
华为发布《自动驾驶网络解决方案白皮书》
专知会员服务
126+阅读 · 2020年5月22日
斯坦福2020硬课《分布式算法与优化》
专知会员服务
120+阅读 · 2020年5月6日
【MIT深度学习课程】深度序列建模,Deep Sequence Modeling
专知会员服务
78+阅读 · 2020年2月3日
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
OpenAI「假新闻」生成器GPT-2的最简Python实现
机器之心
4+阅读 · 2019年4月20日
【物联网】物联网产业现状与技术发展
产业智能官
15+阅读 · 2018年12月17日
麻省理工发布2018年全球十大突破性技术
算法与数学之美
12+阅读 · 2018年9月13日
深度剖析卷积神经网络
云栖社区
7+阅读 · 2018年5月27日
深度学习之图像超分辨重建技术
机器学习研究会
12+阅读 · 2018年3月24日
Universal Transformers
Arxiv
5+阅读 · 2019年3月5日
Arxiv
8+阅读 · 2018年1月25日
Arxiv
4+阅读 · 2015年8月25日
VIP会员
相关资讯
阿里技术大牛:一份架构师成神路线图!
51CTO博客
30+阅读 · 2019年7月6日
OpenAI「假新闻」生成器GPT-2的最简Python实现
机器之心
4+阅读 · 2019年4月20日
【物联网】物联网产业现状与技术发展
产业智能官
15+阅读 · 2018年12月17日
麻省理工发布2018年全球十大突破性技术
算法与数学之美
12+阅读 · 2018年9月13日
深度剖析卷积神经网络
云栖社区
7+阅读 · 2018年5月27日
深度学习之图像超分辨重建技术
机器学习研究会
12+阅读 · 2018年3月24日
Top
微信扫码咨询专知VIP会员