The paper introduces a novel, holistic approach for robust Screen-Camera Communication (SCC), where video content on a screen is visually encoded in a human-imperceptible fashion and decoded by a camera capturing images of such screen content. We first show that state-of-the-art SCC techniques have two key limitations for in-the-wild deployment: (a) the decoding accuracy drops rapidly under even modest screen extraction errors from the captured images, and (b) they generate perceptible flickers on common refresh rate screens even with minimal modulation of pixel intensity. To overcome these challenges, we introduce DeepLight, a system that incorporates machine learning (ML) models in the decoding pipeline to achieve humanly-imperceptible, moderately high SCC rates under diverse real-world conditions. Deep-Light's key innovation is the design of a Deep Neural Network (DNN) based decoder that collectively decodes all the bits spatially encoded in a display frame, without attempting to precisely isolate the pixels associated with each encoded bit. In addition, DeepLight supports imperceptible encoding by selectively modulating the intensity of only the Blue channel, and provides reasonably accurate screen extraction (IoU values >= 83%) by using state-of-the-art object detection DNN pipelines. We show that a fully functional DeepLight system is able to robustly achieve high decoding accuracy (frame error rate < 0.2) and moderately-high data goodput (>=0.95Kbps) using a human-held smartphone camera, even over larger screen-camera distances (approx =2m).


翻译:本文为强力屏幕- Camera 通信(SCC) 引入了一种创新的整体方法, 屏幕上的视频内容以人类无法察觉的方式在视觉上编码, 由摄像机捕捉到屏幕内容的图像解码。 我们首先显示, 最先进的 SCC 技术对于在各种现实世界条件下的部署有两个关键限制 : (a) 在从所摄图像中采集的微小屏幕提取错误下, 解码精确度迅速下降, 以及 (b) 它们会在普通的更新率屏幕上生成可见的闪烁器, 即使对像素强度进行最小的调控。 为了克服这些挑战, 我们引入了 DeepLight, 这个系统将机器学习(ML)模型纳入解码管道的解码中, 在不同的现实世界条件下, 最先进的 SSCC 比率是: 深光线网络的设计, 将所有的比目在空间解码在高显示的屏幕上变异, 但不试图精确地将与每部的精确度连接的像素解析点隔隔断, 。 (CLLlightL- dal- lable- cremodeal- decal- decal- decal lab- decreal lax) lax lax a lax a lax lax a lax lax a lax lax a lax a lax a lax lax a lax a lax a lax a lax lax a lax lax a lax a lax lax a lax a lax lax lax lax lax lax lax lax lader lax lax lax labildal lax laut lax lax lax labil- lader lax lax lader- lader- lader- lax lax lax lax lader lax a lax lax lax lax lax lax lax lax lax lax lax a lax lax lax

0
下载
关闭预览

相关内容

如今,服务业占据了IT行业的主要部分。公司越来越喜欢专注于其核心专业领域,并使用IT服务来满足其所有外围需求。服务计算是一门新的科学,其目的是研究和更好地理解这个高度流行的产业的基础。它涵盖了利用计算和信息技术来建模、创建、操作和管理业务服务的科学和技术。SCC 2019也将为构建这一重要科学的支柱和塑造服务计算的未来做出贡献。 官网链接:https://conferences.computer.org/services/2019/
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
carla 体验效果 及代码
CreateAMind
7+阅读 · 2018年2月3日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Real-Time High-Resolution Background Matting
Arxiv
4+阅读 · 2020年12月14日
Real-time Scalable Dense Surfel Mapping
Arxiv
5+阅读 · 2019年9月10日
VIP会员
相关资讯
计算机类 | ISCC 2019等国际会议信息9条
Call4Papers
5+阅读 · 2018年12月25日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
carla 体验效果 及代码
CreateAMind
7+阅读 · 2018年2月3日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
Top
微信扫码咨询专知VIP会员