当音视频技术被打通任督二脉,元宇宙未来还会有哪些新可能?

2022 年 1 月 21 日 CSDN

最近,元宇宙这个概念火出圈,就连科技盲都听到耳朵起茧了。一夜之间,到处都是“元宇宙”,各种相关概念满天飞,相关技术也获得了大范围的关注,迎来了发展的新契机。当然,元宇宙的爆红带来的也是争议不断,很多人在调侃称,十个探讨元宇宙的活动,九个在争议元宇宙究是什么。但如果要笔者来为元宇宙下一个定义的话,那就是以更加真实、沉浸和多样化的方式来接触到虚拟的数字化世界。

元宇宙给了人们进入虚拟世界的门票,但音视频技术的价值却不止于此,其还能够通过网络让虚拟世界与现实世界统一融合,帮助线上和线下一体化进程加速。可以说,音视频技术的升级让不同地点、不同次元的用户实现无缝沟通,能够更加快速、沉浸的获取信息,这在如今追求效率的时代里显得更具价值。在今年的腾讯数字生态大会上,腾讯云副总裁李郁韬就曾提到“随着全真互联时代来临,音视频技术将重构‘连接’,包括技术与社会、人与人、人与世界的连接。相应的,对沉浸感的追求已经成为音视频技术的主线之一。”

在过去的两年里,长短视频持续发力,直播产业日益成熟,5G网络不断落地,播放设备清晰度逐渐提升,这些因素的交织之下,用户对于更低时延、更加高清、更为沉浸的需求就更加明显。可是音视频技术的升级是一种系统性的提升,单纯的依赖于终端、应用或者网络都不现实。当潮水退去,企业需要进一步提升的还在于底层和平台,这其中包括了实时音视频传输、编解码、场景化渲染、AI特效、RTC/IM等诸多技术的升级,也包括了海量SDK接入的问题。

面对挑战,如何才能一站式满足用户音视频需求?腾讯云音视频便提出了“全、真、稳”的技术解决方案。


多元需求下,IM、RTC、CDN如何实现三网合一


在以往,在用户平常使用的消息通讯应用中,IM 这种基于互联网的即时通讯技术已经成为主流;网络视频通话这样的实时音视频应用中,RTC则是不二选择,其与IM配合能够实现音视频互动直播的流程运行;而在直播应用平台和视频的点播应用中,CDN是支撑起内容分发的核心。三大网络各司其职,日常音视频通信应用也都很难离开这三张大网。

随着低延时、强交互、沉浸式的需求强烈,三网合一已成大势所趋,尤其是电商直播、在线教育、企业直播等新兴场景中更是如此。以直播场景为例,对于一场流畅、低延时的直播来说,一开始可能只是需要普通的直播能力,后期如需要连麦、互动、弹幕、商品明细等功能,就需要IM技术,如果对延时不满意,想要进行超低延时的直播时就需要RTC + CDN技术。另外,在云游戏或是远程控制领域,也是通过IM音视频传输、RTC,再加上低延时技术才可以实现的。

在腾讯生态大会的云上展厅就采用了实时云渲染技术,将整个线上展厅完全搬至线上,让用户真正能够在手机上沉浸式逛展。展厅基于腾讯云渲染PaaS平台,以云渲染RTC技术为基底,实现了端到端时延低至60~80ms,最高可提供8K 144 FPS高清高帧率输出能力。因此除传统应用场景外,在云游戏、云渲染、远程控制等非典型音视频通信新兴技术应用上同样离不开RT-ONE™的三张网络。

腾讯云音视频不仅可以提供高连通、高可靠、强安全的全球网络连接通道,还能保证超低延时,全球互联的音视频通信服务。除了具备海量的基础设施资源外,整合后的 RT-ONE™网络在海量调度、就近接入、传输优化效率方面的能力也都获得了提升,用高质量、低成本、快速便捷的接入方式,能够为开发者提供更为精准智能的网络调度服务以及更低延时的传输能力。并且腾讯云音视频直接将TRTC、IM、CDN三张大网整合打通,在底层设施上实现复用,技术能力共享共建,在上层应用方案和产品化方面以一站式的SDK和API提供给开发者,为开发者解决了技术痛点难题。

腾讯云音视频利用“三网合一”这一优势,为用户在大多数场景提供更高质量、更低成本的便捷服务,随着各行各业的数字化转型以及疫情带来的用户习惯改变,“三网合一”降低客户了接入及使用门槛,为客户提供更方便高效的音视频通信能力,助力客户实现场景创新。


SDK调用过多,RT-Cube如何实现All in one SDK


随着万物互联的时代到来,人工智能等技术强势接入生活,我们对于场景的需求越发多样化。而以往单一的场景模式很难满足用户的更多需求,无论是低延时,强交互,亦或是多样性玩法,这都需要更多的SDK支持。但多场景往往意味着大量SDK集成才能够满足客户的音视频通信需求,这就意味着开发周期的大量延长。

对于音视频应用研发而言,SDK的整合与统一,意味着效能的全面提升,成本的进一步降低。

RT-Cube™作为腾讯云音视频推出的全新终端品牌产品, 整合了所有音视频通信能力,包括IM,TRTC,直播,点播等。其能够实现一个SDK解锁全部音视频通信能力,覆盖音视频通信全场景,一次接入,多处调用。这对于开发流程而言是一种极大的效能释放,开发者可以根据实际业务场景自由组合,随时快速升级扩展。对于直播产品而言,从简单的直播能力,到接入IM能力,RTC连麦能力,录制回放的点播能力等等,通过RT-Cube™,最快仅一天就可以搭建完成。并且可以实现一个控制台下管理IM,直播和互动直播等多种能力。账号系统也进行了统一,用户可以用同一个账号来管理IM,直播,TRTC的用户,进行统一登录,鉴权。

21年技术的积累,完备的音视频通信能力建设,让腾讯云音视频能够率先提出 All in One 的创新模式。SDK有很多模块,大到操作系统,小到SDK功能,需要做到协同运转和谐是很难的。多模块协同运作时很多协同、咬合、CPU拼抢等问题会一一浮现。RT-Cube™解决方案承载腾讯音视频多年积累的移动直播、互动直播、实时音视频、短视频、播放器等终端能力,在协同整合能力并让其发挥最大功效方面是十分困难的。基于这一技术难点,RT-Cube™ 解决方案完成了基础框架,架构设计、消息总线、线程模型、编译环境、监控模块以及测试系统的统一,在端侧的组件能够很好的协同增强。

在各种娱乐社交情景中,传统行业被云化的案例也比比皆是。当然,无论场景如何,所有开发者主要考量的内容都是一致的:时延、成本、品质。RT-Cube™ 面向各大场景提供低代码解决方案,为各行各业提供开箱即用的音视频应用开发工具,能够让开发者更专注创新,使得开发者可以快速上线高品质的音视频应用,节省开发者集成时间。


让音视频多一种可能,超高清的思与变


音视频产业的未来在哪里?有人说是高清互动,有人便直接说是元宇宙了。而笔者看来二者虽然路径不同,但从结果上来看,他们都是在为我们提供一个更加多彩的世界。虚拟的接触是一笔,高清触碰更是一笔。

8K的清晰度在以往看来几乎是不可能的事情,网络、编解码、时延,甚至连存储都可能是巨大的难题。但是随着5G和音视频技术的升级,如今这些看起来似乎都不再艰难。尤其是在如今更强的计算和处理能力,更优质的AI服务能力加持下,低码率更高清已经不再是天方夜谭。

腾讯明眸·核心能力展示

腾讯云音视频的腾讯明眸·极速高清产品致力于以更低码率提供更高清的流媒体服务,给用户带来全新的高清视野。其采用的智能动态编码技术通过智能场景识别、动态编码匹配、画质修复增强相结合来不断提升我们的服务质量。同时,明眸能在保持视频画质质量不变的情况下,最多可以降50%的码率,减少视频传输存储成本;提供超分、片源修复等多种功能,帮助用户提升视频画质;通过AI,其还能识别视频中的人物信息,自动过滤弹幕信息,提升用户观看体验。

腾讯明眸研究团队的画质增强研究工作主要是应用到编码优化前的前置处理的这个阶段,提供一些画质修复和增强的能力。通过传统算法和深度学习模型,来有效消除片源中的噪点和压缩效应,增强细节去除模糊,提升色彩质量,并解决由于分辨率和帧率低面卡顿不清晰等问题。

这样的技术能够适应的场景还有很多,腾讯已经将将更低成本、端到端的自由视角技术推向赛事直播、演会、活动直播、在线教学等各种侧重临场感和沉浸感的场景,让沉浸式体验走入生活,为游戏、影视、社交、办公等多个领域带来改变和影响。

越来越多的线下场景也会通过数字化的建模、音视频处理的技术还原到线上。去年疫情期间,腾讯云音视频与贝壳如视合作了VR带看的场景,随时随地可以发起与经纪人的联系,相较于业界普通3D效果,基于点云编码技术,提供三维景深信息,实现了全景图片对距离远近和方位的感知。VR同屏带看功能还用到了腾讯云音视频业界领先的实时音视频 (RTC)技术,可以实现接待人员和参观者之间在音视频之间做到实时同步。

“全真稳”三大特性成为了腾讯云音视频的标签,其能够支持 C 端及 B 端的各类音视频业务快速上线,赋能场景创新。而这样的表现也使得腾讯云视频云解决方案持续领跑中国市场,近日,国际数据公司(IDC)发布的《中国视频云市场跟踪(2021 上半年)》报告显示,腾讯云音视频在视频云解决方案市场排名第一,同时在 RTC(实时通信)这个重点赛道,腾讯云音视频的增速在头部厂商中排名 NO.1。不止于此,腾讯云音视频在音视频编解码、音视频处理等技术领域深耕,曾获得中国知识产权最高奖项“中国专利金奖”,且多次在 MSU 视频编解码大赛取得冠军。

伴随着技术演进,音视频技术的发展将会给更多用户接触到全新世界的机会。这样的时代到来,也能为开发者的创新提供基础,让科技与社会、人与人、人与世界的连接更加多样化。

登录查看更多
0

相关内容

IM:IFIP/IEEE International Symposium on Integrated Network Management。 Explanation:综合网络管理国际研讨会。 Publisher:IFIP/IEEE SIT: http://dblp.uni-trier.de/db/conf/im/index.html
《5G 毫米波赋能 8K 视频制作》未来移动通信论坛
专知会员服务
11+阅读 · 2022年4月15日
产业元宇宙白皮书(2021-2022)
专知会员服务
113+阅读 · 2022年2月18日
腾讯:2022年十大数字科技应用趋势
专知会员服务
80+阅读 · 2022年1月13日
德勤《2022科技、传媒和电信行业预测》,142页pdf
专知会员服务
30+阅读 · 2021年12月21日
元宇宙专题深度,63页ppt
专知会员服务
216+阅读 · 2021年11月22日
专知会员服务
61+阅读 · 2021年9月20日
【腾讯IDC】数实共生:未来经济白皮书2021,81页pdf
专知会员服务
73+阅读 · 2021年1月24日
元宇宙浪潮下,如何通过虚拟手段打造非虚构营销?
人人都是产品经理
0+阅读 · 2022年1月23日
当实时互动爆发后,谁会成为领跑者?
CSDN
0+阅读 · 2022年1月18日
全真互联趋势下的音视频技术|Q推荐
InfoQ
0+阅读 · 2022年1月4日
体验完“元宇宙入口”,我有点晕
人人都是产品经理
0+阅读 · 2021年12月2日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
Arxiv
2+阅读 · 2022年4月19日
Vision-and-Language Pretrained Models: A Survey
Arxiv
3+阅读 · 2022年4月15日
Arxiv
29+阅读 · 2022年2月15日
Arxiv
24+阅读 · 2021年6月25日
A Survey on Edge Intelligence
Arxiv
49+阅读 · 2020年3月26日
Arxiv
11+阅读 · 2018年1月11日
VIP会员
相关VIP内容
相关资讯
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
Top
微信扫码咨询专知VIP会员