成为VIP会员查看完整内容
VIP会员码认证
首页
主题
发现
会员
服务
注册
·
登录
0
手机拍照全靠猜?为什么你的手机总拍不出「真实」的照片
2022 年 2 月 23 日
少数派
时间拉回到 2021 年 12 月,少数派团队在大理团建的那一周,几乎每天晚上都会有人跑上露台,尝试用各种各样的设备记录洱海上方那片澄澈的星空。
在这当中,几台 Google Pixel 设备的表现最为亮眼。以往我们总在感叹计算摄影的魅力,但只有用白天刷微博、刷抖音的那台手机捕捉到璀璨星河的那一刻,才真正明白算法的精妙与魅力。
惊叹之余,团队里一直主力使用 Google Pixel 的几位编辑也跟我聊到过一些有意思的细节:在计算摄影这件事情上,即便是一直以来被业界奉为圭臬的 Google Pixel,其实也有一些至今难以克服的短板。这当中最具代表性问题就包括偏色,这是一个从 Google Pixel 4 开始就有
提及
、但一直到最近的 Google Pixel 6 都没能得到有效解决的问题。
夜视算法加持下(右)画面色彩相比肉眼观感(左)存在明显偏色 | 图:Clyde 使用 Google Pixel 4 拍摄
即便是开头提到的那些星空样张也一样——对 Google 这样的计算摄影老牌劲旅来说,色彩还原也是个难以完全靠算法来解决的难题。为了让算出来的星空更加符合观感审美,在 Google 相册中的图片修饰功能中,Google 甚至还为夜视模式的照片准备了一套「天文滤镜」用于后期色彩修饰。
那色彩还原这件事为什么这么难?
▍
问题的根源在于「猜」
如果往希腊语词根的方向去理解,照片的英文是 Photograph 按字面意思可以被理解为「用光所作的画」。在摄影这件事情上,最初我们用来「作画」的载体是胶片,记录在底片上的光线信息需要经过化学冲洗才能显影;以
光电二极管
为核心的 CCD 与 CMOS 出现后,效率更高的光电信号转换则成为了主流。
但无论是 CCD 还是智能手机中更常见的 CMOS,受光电二极管的工作原理所限,它们都只能根据光照强度记录不同的亮度信息。换句话说,通过传感器所接收到的光电信号,仅仅只能还原出一张黑白照片。
为了让传感器捕捉到有色彩的光照信息,色彩滤波阵列(CFA)出现了
。
常见的色彩滤波阵列:拜尔阵列 | 图:维基百科
你可以将 CFA 理解为光线在到达传感器之前的一层「滤镜」,以应用最为广泛的拜尔阵列滤色镜为例,拜尔阵列以 2 个绿色像素、1 个红色像素和 1 个蓝色像素为单元,通过滤镜的光线除了能够在传感器上留下强度信息外,还能同时保留对应的色彩信息。值得注意的是,因为每个像素只过滤并记录红、绿、蓝三种颜色中的一种,这些从单个像素获取的信息其实也不能完整反映画面中不同颜色的组成方式。
光线通过阵列后留下不同色彩信息 | 图:维基百科
换句话说,画面细节的丢失从我们按下手机快门键的那一刻就已经开始了
。为了得到一张色彩完整的图像,通过拜尔阵列获取到的色彩信息后续还会依靠
去马赛克
算法进行插值、重建。如果像下图这样采用邻近像素平均值的算法,根据已采集像素对周边缺失的像素色彩信息进行推测,完成整个去马赛克过程后,重建得到的画面甚至会占据整个画面的 2/3。
将拜尔阵列得到的色彩信息还原的过程,也是细节丢失的过程 | 图:Google
因为「猜」的成分不可避免,最终得到的图像一般而言是无法准确还原原始拍摄场景的。即便在邻近像素平均值算法的基础之上,后续也衍生出了许多更为复杂的去马赛克算法,但「通过 CFA 获取到的色彩信息有限」这个大前提始终摆在这里。
另一方面,尽管近年很多厂商都在尝试其它的 CFA 排列方式,比如华为的 RYYB、OPPO 在 2014 年基于 QuadBayer 阵列的 RGBW,这些排列方式相比传统的拜尔阵列更多地也是在提高传感器进光量,符合前几年手机厂商在夜景拍摄这件事情上「血腥厮杀」的目标,但从实际的情况来看,纯粹靠算法猜,对解决色彩还原问题这件事并没有多大帮助。
▍
以 Google Pixel 为鉴
明确「因为照片都是猜的所以色彩还原很难」这个基本事实后,我们再回到文章开头提到的手机计算摄影巨擘 Google Pixel。如果要说 Google Pixel 诞生后这 6 年时间里,为手机行业计算摄影发展留下的、最为宝贵的经验是什么,个人认为有两点:
利用好一切可用算法资源的变通性,以及垂直整合硬件的能力
。
关于第一点,最好的例子是 Google Pixel 3 时引入的 Super Res Zoom(超分) —— 就是 Google 还在用单摄「吊打」其他厂商双摄长焦的那一代。
关联阅读:
媲美双摄的两倍数字变焦,Google 的 Super Res Zoom 技术是这样做到的
在解决数字变焦对画面进行裁剪、重建进而造成细节丢失这个问题时,Google 相机团队首先想到的切入点也是上文提到的 CFA 滤镜。不过相比于其他同行,Google 的工程师选择了 DRIZZLE —— 一种在天文摄影学中已经流行了数十年的常用拍摄技巧。DRIZZLE 通过捕捉并合成多张拍摄角度略有变化的照片,来实现 2x 甚至 3x 的数字变焦效果,基本理念是将多张低分辨率的连拍照片直接合并对齐到更高分辨率的像素网格中。具体的合并对齐流程如下:
通过平移的方法进行像素补全 | 图:Google
至于垂直整合硬件的能力,大家更是有目共睹了
。
从第二代 Google Pixel 开始,几乎每一代 Google Pixel 设备(a 系列以及 Pixel 5 除外)都会搭载专门用于图像算法处理的独立芯片,在 Google Pixel 2 上这枚芯片叫做 Pixel Visual Core,在 Pixel 4 上演变成为 Pixel Neural Core,最后来到今年的「大招」——Google Tensor。
关联阅读:
译文 | Tensor 之意不在「酒」:Google Silicon 团队专访,为你揭开定制芯片的秘密
原本对传感器型号不怎么「敏感」的 Google Pixel,随着计算摄影需求与功能的不断增加,对独立图像处理芯片的依赖也越来越大,走上自研芯片这条路成为了必然(对下文要提到的 OPPO 来说也是如此)——毕竟在已经将 RAM 从 4GB 提升至 6GB 的前提下,Google Pixel 4 用户依然会时不时遭遇「算力不够杀后台来凑」的情况。
话说回来,既然算法实力和软硬件整合强如 Google Pixel 这样的异类,都依然没能解决文章开头提到的色彩还原问题。近年来紧随其后的国内 Android 厂商还有哪些破题思路呢?
▍
软件不够硬件来补
这里便来到了另一个被更多人看作是「行业标杆」的厂商 —— Apple 了。既然通过传感器采集到的色彩信息难以完整还原,我们不妨再给图像处理器准备一组现实世界中的实际数据作为色彩校准参考。
而关于色彩的校准,其实早有专门的传感器负责采集现实中的色彩数据,早在 2017 年之时 Apple 就在 iPhone X 上的「刘海」矩阵里塞入一颗来自 AMS 的多光谱传感器。这款定制版本的 6 通道多光谱传感器颇有为 iPhone 十周年献礼的意味,其采集的空间色彩数据被用于驱动 True Tone 原彩显示功能,可让手机根据环境光色温来动态调节屏幕显示。
这个功能到今天依然有些新鲜,并且并非这类传感器的唯一用途——就像上面提到的那样,去年发布的 Apple TV 4K 就内置一个神奇的屏幕校色功能:将与 Apple TV 配对的 iPhone 正面紧贴电视屏幕,即可自动校准这块屏幕的内容显示颜色,从这个功能要求 iPhone 配有 Face ID 来看,iPhone 在这个过程中应该就是借着多光谱传感器化身成了一台简单的屏幕校色仪。
而后,在华为 P40、P50 Pro 这样的旗舰机型上,看到了利用多通道多光谱色温传感器辅助拍摄的用法,一方面可以作为环境色彩还原标准,提供白平衡参考,另一方面也顺带解决 RYYB 阵列带来的偏色问题。
OPPO 则在 Find X3 上推出了 10bit 的全链路色彩引擎,从屏幕硬件发力,优化色彩体验,来保证手机拍摄和输出的一体化观感。
▍
Find X5 如何处理色彩难题
以计算摄影领域先驱 Google Pixel,以及华为、Apple 在软硬件协同投入上的经验为参考,OPPO 基于多年深耕影像领域的优势,在 Find X5 上也做了一次软硬件垂直整合。
首先是自然色彩传感器的加入。这次 OPPO 采用的自然色彩传感器,背后主要依靠一个 13 通道的光谱传感器,相当于增加了类似人眼结构的电子视网膜,从硬件层面捕捉精准的颜色,还原真实的环境光源信息,从影像处理的源头为色彩还原提供高精度数据作为参考。
当然,多光谱传感器对于消费者也不是新鲜技术。去年年底发布的华为 P50 Pocket 就能实现紫外线检测功能,也是通过 10 通道光谱传感器完成的。这次 Find X5 系列的 13 通道多光谱传感器应该能把纯色色彩校准得更加准确,这是以往连 iPhone 都做不到的。
自研多年的影像 NPU 芯片「马里亚纳 MariSilicon X」,也将在 Find X5 系列正式搭载,为计算摄影能力带来底层质变。
和以往大部分厂商直接从芯片厂商购入 3A 算法、然后进行小修小补的做法不同,OPPO 可以基于马里亚纳 MariSilicon X 做更多、更深入也更灵活的底层开发,借助它高达 18Tops 的算力以及自研 3A 算法,无论是整合来自 13 通道光谱传感器的数据输入,还是在纯色、大面混淆色这类棘手场景下的色彩还原,效果都会有大幅提升。
当然了,最后还有一个色彩输出风格的标定,这就需要一种对自然和审美的长期经验积累了。OPPO Find X5 系列此前已经官宣了和拥有百年历史的哈苏合作,并且也通过了哈苏的自然色彩认证,色彩调试方案对标的是哈苏中画幅相机,实际拍摄的色彩效果非常令人期待。
我们曾经一直以为手机摄影已经很强大了,但基于算法的盲猜效果已经不能满足用户的需求,结合软硬件综合实力的自然色彩时代,才刚刚开始。
登录查看更多
点赞并收藏
0
暂时没有读者
0
权益说明
本文档仅做收录索引使用,若发现您的权益受到侵害,请立即联系客服(微信: zhuanzhi02,邮箱:bd@zhuanzhi.ai),我们会尽快为您处理
相关内容
Google Pixel
关注
0
Google Pixel
是由
Google
在2013年起推出的智能硬件系列,包括了Android智能手机、Android平板电脑和Chromebook笔记本电脑。
南大清华发布《从单目图像中恢复三维人体网格》综述论文,涵盖246篇文献全年阐述单目3D人体网格恢复研究进展
专知会员服务
32+阅读 · 2022年3月21日
【干货书】《日常算法》,154页pdf
专知会员服务
55+阅读 · 2022年1月22日
深度生成模型如何对抗攻击?中国地大等《深度生成模型的对抗性攻击》综述全面阐述GAN和VAEs安全性和隐私保护
专知会员服务
21+阅读 · 2021年12月3日
ICCV2021 RealVSR: 业界首个移动端真实场景视频超分数据集
专知会员服务
23+阅读 · 2021年9月28日
【SIGGRAPH 2021】仅输入单张图片,就能“看”出物体材质
专知会员服务
10+阅读 · 2021年8月11日
自动化机器学习,67页ppt
专知会员服务
72+阅读 · 2021年7月3日
【CVPR2021】动态度量学习
专知会员服务
39+阅读 · 2021年3月30日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
Google 发布图片配对基准及挑战:从系列图像重建三维物体和建筑物
专知会员服务
39+阅读 · 2020年4月4日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
教老人用手机后,我发现蠢的是自己
人人都是产品经理
0+阅读 · 2022年4月13日
三星S22系列,打造移动影像新边界
36氪
0+阅读 · 2022年2月24日
是什么原因让你不想换手机?
ZEALER订阅号
0+阅读 · 2022年2月12日
vivo S12 Pro 体验丨联发科天玑的影像实力如何?
ZEALER订阅号
0+阅读 · 2022年1月24日
你的手机在「监听」对话?为什么广告总能做到「精准推送」
少数派
0+阅读 · 2021年12月13日
一派讨论·10 年前你的在用什么手机?
少数派
0+阅读 · 2021年11月23日
手机的负一屏有用吗?
ZEALER订阅号
0+阅读 · 2021年11月14日
2021 年,如何选购一台适合自己的微单相机
少数派
0+阅读 · 2021年11月8日
双十一购物指南 VOL.2 | 接下来最值得买的是它们
ZEALER订阅号
0+阅读 · 2021年11月4日
Google 相册中新降噪和锐化算法让您的照片更清晰
TensorFlow
3+阅读 · 2021年8月5日
基于CMOS天线效应片上恒稳定指纹的物理不可复制功能研究
国家自然科学基金
0+阅读 · 2014年12月31日
基于语义分析的三维模型表面属性交互式编辑技术研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于多光谱成像的人体头肩检测系统研究
国家自然科学基金
1+阅读 · 2013年12月31日
基于视觉感知的场景再现技术研究
国家自然科学基金
0+阅读 · 2012年12月31日
金属表面原子台阶边缘合金的形成机制及其应用的理论研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于稀疏建模的视频图像编码与重建方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于稀疏视觉特征学习的真实环境人脸识别研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于能量变分导数的偏微分方程的时空自适应方法
国家自然科学基金
1+阅读 · 2012年12月31日
透明导电氧化物表面功函数的调控与改性
国家自然科学基金
0+阅读 · 2011年12月31日
多通道手语信息融合问题的研究
国家自然科学基金
0+阅读 · 2009年12月31日
Getting around the Halting Problem
Arxiv
0+阅读 · 2022年4月20日
Strong convexity of affine phase retrieval
Arxiv
0+阅读 · 2022年4月20日
NTIRE 2022 Challenge on Stereo Image Super-Resolution: Methods and Results
Arxiv
0+阅读 · 2022年4月20日
NAFSSR: Stereo Image Super-Resolution Using NAFNet
Arxiv
0+阅读 · 2022年4月19日
Imbalanced Classification via a Tabular Translation GAN
Arxiv
0+阅读 · 2022年4月19日
LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking
Arxiv
0+阅读 · 2022年4月18日
Real-world Deep Local Motion Deblurring
Arxiv
0+阅读 · 2022年4月18日
Sensitivity of sparse codes to image distortions
Arxiv
0+阅读 · 2022年4月15日
Universal approximation property of invertible neural networks
Arxiv
0+阅读 · 2022年4月15日
Multimodal Sentiment Analysis To Explore the Structure of Emotions
Arxiv
19+阅读 · 2018年5月25日
VIP会员
自助开通(推荐)
客服开通
详情
相关主题
Google Pixel
Google
传感器
Google 相册
算法
维基百科
相关VIP内容
南大清华发布《从单目图像中恢复三维人体网格》综述论文,涵盖246篇文献全年阐述单目3D人体网格恢复研究进展
专知会员服务
32+阅读 · 2022年3月21日
【干货书】《日常算法》,154页pdf
专知会员服务
55+阅读 · 2022年1月22日
深度生成模型如何对抗攻击?中国地大等《深度生成模型的对抗性攻击》综述全面阐述GAN和VAEs安全性和隐私保护
专知会员服务
21+阅读 · 2021年12月3日
ICCV2021 RealVSR: 业界首个移动端真实场景视频超分数据集
专知会员服务
23+阅读 · 2021年9月28日
【SIGGRAPH 2021】仅输入单张图片,就能“看”出物体材质
专知会员服务
10+阅读 · 2021年8月11日
自动化机器学习,67页ppt
专知会员服务
72+阅读 · 2021年7月3日
【CVPR2021】动态度量学习
专知会员服务
39+阅读 · 2021年3月30日
打怪升级!2020机器学习工程师技术路线图
专知会员服务
98+阅读 · 2020年6月3日
Google 发布图片配对基准及挑战:从系列图像重建三维物体和建筑物
专知会员服务
39+阅读 · 2020年4月4日
模型压缩究竟在做什么?我们真的需要模型压缩么?
专知会员服务
27+阅读 · 2020年1月16日
热门VIP内容
开通专知VIP会员 享更多权益服务
乌克兰首次完全依靠UGV 和 FPV 无人机全自动攻击俄罗斯部队
《中高度长航时遥控无人机自动定位和跟踪》190页
【伯克利博士论文】高效深度学习推理的全栈方法
《优化联合作战准备:日本视角》最新21页
相关资讯
教老人用手机后,我发现蠢的是自己
人人都是产品经理
0+阅读 · 2022年4月13日
三星S22系列,打造移动影像新边界
36氪
0+阅读 · 2022年2月24日
是什么原因让你不想换手机?
ZEALER订阅号
0+阅读 · 2022年2月12日
vivo S12 Pro 体验丨联发科天玑的影像实力如何?
ZEALER订阅号
0+阅读 · 2022年1月24日
你的手机在「监听」对话?为什么广告总能做到「精准推送」
少数派
0+阅读 · 2021年12月13日
一派讨论·10 年前你的在用什么手机?
少数派
0+阅读 · 2021年11月23日
手机的负一屏有用吗?
ZEALER订阅号
0+阅读 · 2021年11月14日
2021 年,如何选购一台适合自己的微单相机
少数派
0+阅读 · 2021年11月8日
双十一购物指南 VOL.2 | 接下来最值得买的是它们
ZEALER订阅号
0+阅读 · 2021年11月4日
Google 相册中新降噪和锐化算法让您的照片更清晰
TensorFlow
3+阅读 · 2021年8月5日
相关基金
基于CMOS天线效应片上恒稳定指纹的物理不可复制功能研究
国家自然科学基金
0+阅读 · 2014年12月31日
基于语义分析的三维模型表面属性交互式编辑技术研究
国家自然科学基金
0+阅读 · 2013年12月31日
基于多光谱成像的人体头肩检测系统研究
国家自然科学基金
1+阅读 · 2013年12月31日
基于视觉感知的场景再现技术研究
国家自然科学基金
0+阅读 · 2012年12月31日
金属表面原子台阶边缘合金的形成机制及其应用的理论研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于稀疏建模的视频图像编码与重建方法研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于稀疏视觉特征学习的真实环境人脸识别研究
国家自然科学基金
0+阅读 · 2012年12月31日
基于能量变分导数的偏微分方程的时空自适应方法
国家自然科学基金
1+阅读 · 2012年12月31日
透明导电氧化物表面功函数的调控与改性
国家自然科学基金
0+阅读 · 2011年12月31日
多通道手语信息融合问题的研究
国家自然科学基金
0+阅读 · 2009年12月31日
相关论文
Getting around the Halting Problem
Arxiv
0+阅读 · 2022年4月20日
Strong convexity of affine phase retrieval
Arxiv
0+阅读 · 2022年4月20日
NTIRE 2022 Challenge on Stereo Image Super-Resolution: Methods and Results
Arxiv
0+阅读 · 2022年4月20日
NAFSSR: Stereo Image Super-Resolution Using NAFNet
Arxiv
0+阅读 · 2022年4月19日
Imbalanced Classification via a Tabular Translation GAN
Arxiv
0+阅读 · 2022年4月19日
LayoutLMv3: Pre-training for Document AI with Unified Text and Image Masking
Arxiv
0+阅读 · 2022年4月18日
Real-world Deep Local Motion Deblurring
Arxiv
0+阅读 · 2022年4月18日
Sensitivity of sparse codes to image distortions
Arxiv
0+阅读 · 2022年4月15日
Universal approximation property of invertible neural networks
Arxiv
0+阅读 · 2022年4月15日
Multimodal Sentiment Analysis To Explore the Structure of Emotions
Arxiv
19+阅读 · 2018年5月25日
大家都在搜
palantir
自主可控
大型语言模型
CMU博士论文
生成式人工智能
无人艇
洛克菲勒
数字孪生
CSIG
出海产品从 0 到 1 该怎么做
Top
提示
微信扫码
咨询专知VIP会员与技术项目合作
(加微信请备注: "专知")
微信扫码咨询专知VIP会员
Top