The paper introduces a novel, holistic approach for robust Screen-Camera Communication (SCC), where video content on a screen is visually encoded in a human-imperceptible fashion and decoded by a camera capturing images of such screen content. We first show that state-of-the-art SCC techniques have two key limitations for in-the-wild deployment: (a) the decoding accuracy drops rapidly under even modest screen extraction errors from the captured images, and (b) they generate perceptible flickers on common refresh rate screens even with minimal modulation of pixel intensity. To overcome these challenges, we introduce DeepLight, a system that incorporates machine learning (ML) models in the decoding pipeline to achieve humanly-imperceptible, moderately high SCC rates under diverse real-world conditions. Deep-Light's key innovation is the design of a Deep Neural Network (DNN) based decoder that collectively decodes all the bits spatially encoded in a display frame, without attempting to precisely isolate the pixels associated with each encoded bit. In addition, DeepLight supports imperceptible encoding by selectively modulating the intensity of only the Blue channel, and provides reasonably accurate screen extraction (IoU values >= 83%) by using state-of-the-art object detection DNN pipelines. We show that a fully functional DeepLight system is able to robustly achieve high decoding accuracy (frame error rate < 0.2) and moderately-high data goodput (>=0.95Kbps) using a human-held smartphone camera, even over larger screen-camera distances (approx =2m).


翻译:本文为强力屏幕- Camera 通信(SCC) 引入了一种创新的整体方法, 屏幕上的视频内容以人类无法察觉的方式在视觉上编码, 由摄像机捕捉到屏幕内容的图像解码。 我们首先显示, 最先进的 SCC 技术对于在各种现实世界条件下的部署有两个关键限制 : (a) 在从所摄图像中采集的微小屏幕提取错误下, 解码精确度迅速下降, 以及 (b) 它们会在普通的更新率屏幕上生成可见的闪烁器, 即使对像素强度进行最小的调控。 为了克服这些挑战, 我们引入了 DeepLight, 这个系统将机器学习(ML)模型纳入解码管道的解码中, 在不同的现实世界条件下, 最先进的 SSCC 比率是: 深光线网络的设计, 将所有的比目在空间解码在高显示的屏幕上变异, 但不试图精确地将与每部的精确度连接的像素解析点隔隔断, 。 (CLLlightL- dal- lable- cremodeal- decal- decal- decal lab- decreal lax) lax lax a lax a lax lax a lax lax a lax lax a lax a lax a lax lax a lax a lax a lax a lax lax a lax lax a lax a lax lax a lax a lax lax lax lax lax lax lax lax lader lax lax lax labildal lax laut lax lax lax labil- lader lax lax lader- lader- lader- lax lax lax lax lader lax a lax lax lax lax lax lax lax lax lax lax lax a lax lax lax

0
下载
关闭预览

相关内容

如今,服务业占据了IT行业的主要部分。公司越来越喜欢专注于其核心专业领域,并使用IT服务来满足其所有外围需求。服务计算是一门新的科学,其目的是研究和更好地理解这个高度流行的产业的基础。它涵盖了利用计算和信息技术来建模、创建、操作和管理业务服务的科学和技术。SCC 2019也将为构建这一重要科学的支柱和塑造服务计算的未来做出贡献。 官网链接:https://conferences.computer.org/services/2019/
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
视频目标检测:Flow-based
极市平台
22+阅读 · 2019年5月27日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
IEEE2018|An Accurate and Real-time 3D Tracking System for Robots
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
carla 体验效果 及代码
CreateAMind
7+阅读 · 2018年2月3日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Real-Time High-Resolution Background Matting
Arxiv
4+阅读 · 2020年12月14日
Deep Learning for Deepfakes Creation and Detection
Arxiv
6+阅读 · 2019年9月25日
Real-time Scalable Dense Surfel Mapping
Arxiv
5+阅读 · 2019年9月10日
VIP会员
相关VIP内容
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
103+阅读 · 2019年10月9日
相关资讯
【泡泡汇总】CVPR2019 SLAM Paperlist
泡泡机器人SLAM
14+阅读 · 2019年6月12日
视频目标检测:Flow-based
极市平台
22+阅读 · 2019年5月27日
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
IEEE2018|An Accurate and Real-time 3D Tracking System for Robots
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
(TensorFlow)实时语义分割比较研究
机器学习研究会
9+阅读 · 2018年3月12日
carla 体验效果 及代码
CreateAMind
7+阅读 · 2018年2月3日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员