3D视频 | 多模式3维视频形状编码

2018 年 7 月 23 日 中国图象图形学报

导语:具有立体感和高端真实感的3D视频正发展成为大众化的视觉体验需求,在3D影视、机器视觉、远程医疗、军事航天等领域中有广泛应用前景。高效形状编码是对象基3D视频应用中的核心和关键。


       
引用格式

朱仲杰, 王玉儿, 蒋刚毅. 多模式3维视频形状编码[J]. 中国图象图形学报, 2018, 23(7): 953-960.

DOI: 10.11834/jig.170533

原文链接

http://www.cjig.cn/html/jig/2018/7/weixin/20180702.htm

文后有彩蛋!!!
近年国内外形状编码 算法集锦 立即购买


论文亮点


(1) 首次面向对象基3D视频应用需求,研究了3D视频形状编码问题,提出一种基于多模式3D视频高效形状编码方法。


(2) 提出了一种新的轮廓基运动补偿预测和视差补偿预测结构和方法,可以充分利用3D对象形状轮廓的视点间和视点内的时域与空域相关性,从而进行高效压缩。


(3) 提出了新的基于轮廓的形状活动性分析方法和多模式编码思想,可以针对不同图像采用不同的编码模式,从而从整体上提高整个形状视频的编码效率。


本文方法


对于给定的3D视频形状序列逐帧进行对象轮廓提取并预处理后, 进行对象轮廓活动性分析, 将形状图像分成帧内模式编码图像和帧间预测模式编码图像。


对于帧内编码图像, 基于轮廓内链码方向约束和线性特征进行高效编码。对于帧间编码图像, 采用基于链码表示的轮廓基运动补偿预测、视差补偿预测、联合运动与视差补偿预测等多种模式进行编码, 以充分利用视点内对象轮廓的帧间时域相关性和视点间对象轮廓的空域相关性, 从而达到高效编码的目的。


 ▲算法整体框图


▲基于轮廓和链码表示的帧间预测结构


本文结果


实验仿真结果显示所提算法性能优于经典和现有的最新同类方法, 压缩效率平均能提高9.3%~64.8%不等。


提出的多模式3D视频形状编码方法可以有效去除对象轮廓的帧间和视点间冗余, 能够进行高效编码压缩, 性能优于现有同类方法, 可广泛应用于对象基编码、对象基检索、对象基内容分析与理解等。


▲测试序列第1帧原始形状图像和提取的最终对象轮廓


近年国内外形状编码算法集锦


文献[1]提出了一种基于算术编码的二值图像形状编码方法。它利用目标轮廓中存在的局部线性边缘来增强算术编码上下文建模的准确性, 从而提高编码效率。


文献[2]提出了一种四分树结构的基于上下文算术编码的形状编码方案。


Lai等人[3]研究了率失真优化形状编码中的边缘选择与优化编码问题, 提出了基于8分区和16分区的边缘编码方案, 可以降低待编码定点数从而提高编码效率。


文献[4]提出了一种基于图像相关性的高效形状编码方法, 利用图像内容和对象形状之间的相关性来提高编码效率。


文献[5]通过分析对象轮廓链码的空域相关性和线性特征, 前期提出了基于轮廓和链码表示的高效形状编码方法。对于给定的形状图像, 提取对象轮廓和细化成严格单像素宽度后将其转换成链码表示, 并基于方向相关性将其分割成若干子段, 使得每个子段最多包含2个基本方向码, 在编码时每个链路只需要1个比特表示。同时结合线性检测, 分离出对象轮廓中的长线性子段采用行程编码进行高效压缩。实验结果显示, 与其他同类方法相比能大幅提高压缩效率。


文献[6]进一步研究提出了结合空时预测的形状编码方案, 通过同时利用轮廓链码的帧内空域相关性和帧间时域相关性进一步提高了编码效率。


  • [1] Aghito S M, Forchhammer S. Context-based coding of bilevel images enhanced by digital straight line analysis[J]. IEEE Transactions on Image Processing, 2006, 15(8): 2120–2130. [DOI:10.1109/TIP.2006.875168]

  • [2] Shen Z L, Frater M R, Arnold J F. Quad-tree block-based binary shape coding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18(6): 845–850. [DOI:10.1109/TCSVT.2008.919086]

  • [3] Lai Z Y, Zhang F, Lin W S. Operational rate-distortion shape coding with dual error regularization[C]//Proceedings of 2014 IEEE International Conference on Image Processing. Paris, France: IEEE, 2014, 5547-5550.[DOI:10.1109/ICIP.2014.7026122]

  • [4] Luo H T. Image-dependent shape coding and representation[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2005, 15(3): 345–354. [DOI:10.1109/TCSVT.2004.842596]

  • [5] Zhu Z J, Wang Y E, Jiang G Y. High efficient shape coding based on the representation of contour and chain code[J]. Journal on Communications, 2014, 35(8): 8–14. [朱仲杰, 王玉儿, 蒋刚毅. 基于轮廓和链码表示的高效形状编码[J]. 通信学报, 2014, 35(8): 8–14. ] [DOI:10.3969/j.issn.1000-436x.2014.08.002]

  • [6] Zhu Z J, Wang Y E, Jiang G Y. Spatio-temporal shape prediction and efficient coding[J]. Journal of Image and Graphics, 2016, 21(1): 1–7. [朱仲杰, 王玉儿, 蒋刚毅. 空时形状预测与高效编码[J]. 中国图象图形学报, 2016, 21(1): 1–7. ] [DOI:10.11834/jig.20160101]


作者简介

朱仲杰第一作者),1976年生,教授。2004年于浙江大学获电子科学与技术专业博士学位,主要研究方向为2D与3D视频编码与传输。E-mai:lizhongjiezhu@yeah.net

王玉儿,女,助理研究员,主要研究方向为视频编码、信息隐藏。E-mail:365401628@qq.com

蒋刚毅,男,教授,主要研究方向包括数字视频编码与通信、多视点视频信号处理、数字水印与信息隐藏等。E-mail: gangyuylangg1-o.com


宁波市数字信号处理重点实验室简介



宁波市数字信号处理重点实验室是宁波市依托浙江万里学院建设的市级重点实验室。现有固定研究人员26名,其中正高级职称人员7名,副高级职称人员18名。现有浙江省中青年学科带头人2人,浙江省151人才工程人选3人,宁波市领军与拔尖人才3名,其中第一层次1人。

实验室目前主要有视频信号处理及应用、嵌入式系统设计与开发和智能信号处理及智能开发三个主要研究方向。近5年承担各类科研项目30多项,其中国家级科研项目3项,省部级项目20余项,累计新增科研经费500余万元。发表研究论文50多篇,其中SCI论文10多篇。

推荐阅读
算法集锦 | 国内外非结构化的NoSQL数据库研究
 

封面故事 | 海量建筑绘制
 

院校风采 | 信息工程大学地理空间信息学院

前沿丨观点丨咨讯丨独家

扫描下方二维码 关注学报公众号

中国图象图形学报 | 订阅号


登录查看更多
0

相关内容

3D是英文“Three Dimensions”的简称,中文是指三维、三个维度、三个坐标,即有长、有宽、有高,换句话说,就是立体的,是相对于只有长和宽的平面(2D)而言。
【CVPR2020】时序分组注意力视频超分
专知会员服务
30+阅读 · 2020年7月1日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
【CVPR2020】多模态社会媒体中危机事件分类
专知会员服务
54+阅读 · 2020年4月18日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
深度学习视频中多目标跟踪:论文综述
专知会员服务
92+阅读 · 2019年10月13日
已删除
将门创投
8+阅读 · 2019年6月13日
【泡泡点云时空】FlowNet3D:学习三维点云中的场景流
泡泡机器人SLAM
41+阅读 · 2019年5月19日
深度学习之视频图像压缩
论智
13+阅读 · 2018年6月15日
基于二进制哈希编码快速学习的快速图像检索
炼数成金订阅号
8+阅读 · 2018年5月17日
Arxiv
30+阅读 · 2019年3月13日
Arxiv
5+阅读 · 2018年12月18日
Conditional BERT Contextual Augmentation
Arxiv
8+阅读 · 2018年12月17日
Joint Monocular 3D Vehicle Detection and Tracking
Arxiv
8+阅读 · 2018年12月2日
VIP会员
相关VIP内容
【CVPR2020】时序分组注意力视频超分
专知会员服务
30+阅读 · 2020年7月1日
3D目标检测进展综述
专知会员服务
191+阅读 · 2020年4月24日
【CVPR2020】多模态社会媒体中危机事件分类
专知会员服务
54+阅读 · 2020年4月18日
姿势服装随心换-CVPR2019
专知会员服务
34+阅读 · 2020年1月26日
深度学习视频中多目标跟踪:论文综述
专知会员服务
92+阅读 · 2019年10月13日
相关资讯
已删除
将门创投
8+阅读 · 2019年6月13日
【泡泡点云时空】FlowNet3D:学习三维点云中的场景流
泡泡机器人SLAM
41+阅读 · 2019年5月19日
深度学习之视频图像压缩
论智
13+阅读 · 2018年6月15日
基于二进制哈希编码快速学习的快速图像检索
炼数成金订阅号
8+阅读 · 2018年5月17日
Top
微信扫码咨询专知VIP会员