【光电智造】相机图像处理过程

今日光电 2024-03-01 18:08

今日光电


     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光赢未来...欢迎来到今日光电!




----追光逐电 光赢未来----


在开始前介绍两个知识点:

集成信号处理器(Integrated signal processor, ISP):

指的是专门用来处理感光件信号并生成最终图像的硬件,通常会作为一个模块集成到片上系统。

典型的图像过程:

光线进入镜头,到达【带有RGB滤光阵列的传感器】,得到最原始的电信号。这个信号经过【ISO增益和原始图像处理】【RGB去马赛克】【降噪】,就会得到raw格式的图片,对它接着进行【白平衡以及色彩空间转换】【色彩处理】,并【映射到sRGB输出】,这时图片已经呼之欲出,只要【JPEG压缩】【保存成文件】,储存卡里就会增加一张JPEG格式的照片。

接下按照典型的图像过程依次介绍:

【带有RGB滤光阵列的传感器】

CMOS传感器是相机中用于感受光的部分,几乎所有的消费级相机的传感器都是基于CMOS技术。

大家应该都见过类似这样的传感器尺寸对比图,传感器越大,每个像素上接收到的光就越多,从而相对噪声就越小。智能手机的传感器往往是最小的。


相机传感器其实就是我们理想中的能够衡量光线强弱的装置,取同样长的时间,如果到达传感器某个像素点的光亮度变成两倍,那么该点的数值也会变成两倍。但要注意的是,传感器只能测量光的强弱,并不能区分颜色,那么我们的彩色是哪里来的呢?这就需要将不同颜色的滤镜和传感器结合起来,实现这一过程的技术叫做拜尔阵列(“Bayer” pattern)

于是我们就得到了具有色彩阵列(color filter array, CFA)的相机传感器。通过这样的设计,传感器得到的数值就可以用来衡量不同通道信号的强弱了。不同的相机有着各自的传感器阵列,不同阵列的滤光色就构成了相机色彩空间(raw RGB)的三原色因此相机的raw RGB空间不是一个通用的色彩空间。下面两张图展示了不同相机raw RGB空间的原色以及raw图片的色差。

【ISO增益和原始图像处理】

传感器接受光并直接传过来的信号非常原始,根本不能看,还需要接下来的一系列操作。

首先是ISO增益,这里要先明确一个概念:什么是ISO?

ISO,全称为International Standardization Organization,它对相机的对光线的敏感程度,也就是感光度,进行了量化规定,而那已经是胶卷时代的事了。对于现代相机,ISO并不是像快门时间或者光圈那样具有直白的物理含义,而是通过信号处理想要满足的标准。

为了达到与设置相对应的ISO,相机会将接收到的信号进行增益,增益倍数越大,也就对光线越敏感——当然,也会对噪音越敏感。下图展示了不同ISO设置下的效果(曝光时间进行了相应的调整)。

这里需要指出的是,我们经常说像素的强度,但其实像素值是没有单位的,它取决于曝光时间、增益和硬件本身,因此我们实际上关注的是图像上的相对值,而非绝对值

原始的图像处理是指对相机硬件的一系列校准,包括黑光减法、缺陷像素遮蔽和平场矫正加粗样式

黑光减法(Black light subtraction)是说对无光像素值的矫正。我们希望没有接收到光的像素值是0,但由于传感器本身的噪声,事情往往不是这样。同时这个噪声并不是恒定的,它会随着温度的变化而改变。为了进行校准,可以通过黑屏设置一系列无光的像素,得到光学黑的信号,再从整体中减去,实现校准。

缺陷像素遮蔽(Defective pixel mask)是为了处理CMOS传感器中的坏点。这一校准会在工厂中进行,通过拍摄无光的图像,来发现数值异常的点来制作遮蔽,被遮蔽处的坏像素会被周围点的插值所代替(也就是估算出这个点的值)。

平场矫正(Flat-field correction)是由于均匀落在传感器上的光在图像中可能并不均匀,这可能是由镜头、传感器在相机中位置误差等原因引起的,提前记录这一变化并予以矫正,从而得到一个“平”的图像。

【RGB去马赛克】

还记得拜尔阵列吗?那个聪明的设计让我们的传感器得以分辨颜色,但同时也使得我们的图片变得离散。我们得到了每个像素点的RGB三通道之一的值,但我们实际上希望得到每个像素点的三个值,所以我们需要进行插补。

让我们来看一个最最简单的插补算法。

在位置5,拜尔阵列只给了我们R值,G和B就需要用周围的其他位置来进行估算,这里采用了平均值。可以想见这样的算法基于“相近位置颜色都差不多”的假设,那么当遇到不同颜色的分界处,这样的假设自然就不再成立,于是可以加入一个边界判断,发展成“边界感知”型插值算法(听起来还蛮高大上的)。

上面的算法仅是为了帮助理解,实际上在IPS中进行的算法会复杂也强大得多,有时候去马赛克的过程还会有一些附加效果,如高光调整(Highlight clipping)、锐化、降噪等。

【降噪】

所有的传感器都自带噪音,大多数相机会在模数转换后加入一个降噪。

而对于高端相机,可以能会根据不同的ISO设置采用不同的降噪策略,当ISO较高时会采取更激进的降噪。手机的相机因为传感器较小,往往都会采取激进的降噪策略,所以手机自拍比较好看。

这里同样给出一个最简单的算法来对降噪有一个感性认识。

噪音往往比较突兀,因此可以使用模糊来减小噪音。但模糊也会影响细节,因此考虑将去掉部分中信号较强的区域补回图像(甚至会加强以后补回来)。

于是就得到了我们的算法:

【白平衡以及色彩空间转换】

到这里,我们已经得到了raw RGB空间里的图片,除了颜色怪异,多少是能看了。接下来就要好好处理一下颜色。

我们希望把raw RGB这一依赖于设备的色彩空间转换到一个无关设备的色彩空间里。在这里采用CIE XYZ为例子,实际上大多数相机会使用一个叫ProPhoto RGB的色彩空间。

转换分为两步,白平衡和色彩空间转换。

白平衡也就是矫正RGB相等的点(白点),只要对三个通道分别进行放缩就行了,也就是一个对角矩阵的事。

但怎么定义白点呢?

如果由用户手动设置,这件事就比较简单。相机一般会提供一些预设的白平衡数据,用户根据拍照的光照环境进行选择。下图是一些预设白平衡的例子。

如果没有手动指定,就会启用自动白平衡(auto white balance, AWB)算法,这件事就会变得很难,算法必须要能够确定任意照片的场景光亮。

这样的算法往往假设“白色”就是对场景光源的自然反射,如果我们可以定义图像中哪些像素属于“白色”,就可以得到场景光照的RGB表示。注意,这里的“白色”并不一定是白色,也有可能是灰色(白色就是最亮状态的灰色),有时我们会称这样的像素点为“消色差”或者“中性区”

这里介绍两个简单的算法,灰色世界算法Gray world和白块算法White patch。

灰色世界算法假设一个场景的平均反射光是消色差的(也就是灰色的),因此首先算出平均值再进行白平衡转换即可。

如果白平衡在去马赛克之前,那么不同通道的像素数量将会不一样。

前面说过,每个像素绝对值意义不大,有相对的就行,所以可以将绿通道取1。

接下来看白块算法,这个算法假设场景中的高亮点就是我们想要找的白点。也就是以最大值的RGB作为白色的数值。

基于这样的假设,算法工作如下:


上图是这两种算法的效果展示。

这两种算法都是非常基础的算法,当图像有大面积单色时很容易失败(比如蓝天),对于AWB的算法研究有很多论文研究,相机往往也会有自己独特的白平衡算法。注意,这些算法并不一定为了复原场景光照而设计,而是会出于审美考虑,留有一些色差。

进行了白平衡,接下来就要进行色彩空间转换(color space transform, CST),将图片从raw RGB空间转换到独立于设备的色彩空间,如CIE XYZ。

白平衡仅能努力接近真实的色彩恒定,因此在相机上进行的色彩空间转换还会包含一个依赖于工厂预设的插值。在工厂中会对不同的CCT预设色彩转换矩阵CST,在实际处理时,用场景的CCT根据预设的CST矩阵进行插值,得到想要的CST矩阵。

【颜色操作】

现在我们得到了处于CIE XYZ空间的图片,距离我们常见的处于sRGB的jpg文件只剩一步之遥,但在此之前,还有一个让每家相机各显身手的舞台,这就是【颜色操作】步骤。

各家相机会施展不同的秘法,来让照片变得更加好看。这个步骤有很多叫法:色彩调控、冲洗阶段(photo-finishing)、色彩渲染、YUV处理引擎。一般会允许用户对这个阶段进行一定的控制和选择,下图来自佳能的用户手册。

这些色彩操作可以分为两类,三维一维的,三维变换同时处理三个通道,一维曲线则是作用于每个通道,下图是一些变换的例子。这里说到的查询表(look up table, LUT)就相当于函数或者说映射。

可以看到,这些变换几乎都是非线性的变换,经过了这一步,像素值的强弱就不再能够反映场景中光线的强弱了(当然可能在此之前就已经有过非线性操作了)。

【映射到sRGB输出】

经过了这一步,我们可以将图片【映射到sRGB输出】了。这在之前已经解释过,会先从CIE XYZ映射到linear sRGB,再经过伽马变换(2.2)得到sRGB空间。

【JPEG压缩】

接着要进行【JPEG压缩】,这是为了减小文件大小而进行的有损压缩。

其中较难理解的是离散余弦变换(Discrete Cosine Transform , DCT)变换的步骤,在这里做感性介绍,帮助理解。

DCT可以理解为对傅里叶变换的采样,变换结果都是实数。傅里叶变换能够将原本在时域的信号转换到频域上,对于图像来说,就是将原本在空间上分布的像素值信号转变为不同频率的二维三角函数的带权重加和。同时结合一个经验:低频的信息要比高频的信号更重要(可以想象一个低频余弦和高频余弦加和,结果就是一个长了毛刺的山坡——山坡的信息更为重要),从而进行一个量化的操作(相当于滤波),将更多低频的信息保留,从而减小数值尺度的同时尽可能保留重要信息,这之后会再进行编码,提取数据的特征存储,从而实现更高的压缩比例。

在DCT上进行量化操作的数量会影响品质,操作越多,得到的图像质量就越低。在相机中往往可以选择jpeg格式的质量。

【保存成文件】

接下来就是【保存成文件】了,给照片加上日期时间、相机设定、输出的色彩空间、地理位置等等信息,写到存储卡里,就大功告成了。

国际色彩联盟(International Color Consortium, ICC)是一个负责制定色彩操作国际标准的组织,下图是来自ICC-ISO 22028的流程图,可以看到更多关于处理流程的细节。在这里,与raw RGB相关的RGB值都被称为“场景相关的”(scene referred),而转换到sRGB空间以后,就被称为“输出相关的”(output referred)。

还要注意的是,sRGB色彩空间和JPEG正在慢慢被取代,sRGB是为了90年代的显示器设计的,太过于古老了。JPEG也在逐步被压缩率更高的HEIC编码取代。苹果设备上已经开始用heic替代jpeg了,同时苹果设备使用Display P3的色彩空间,它是一种数字电影提倡的DCI-P3空间的变体,比sRGB要大25%,也包含了伽马变换。越来越多的安卓设备也会开始支持这个色彩空间。

再次强调一下,上面的这些步骤仅仅是一个指南,现代相机中的处理流程会更加复杂。对于不同品牌/型号的相机,操作的顺序可能会有不同,(如在去马赛克之后再白平衡),操作的方法也可能不一样(如把锐化和去马赛克结合)。

而对于工业/机器视觉相机,其ISP往往提供的是最小程度的处理,如有的只会进行白平衡,再在raw RGB空间上进行伽马变换,因此很多时候输出的图像仍然在设备的色彩空间内。


来源:机械视觉沙龙


申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。


 

----与智者为伍 为创新赋能----


【说明】欢迎企业和个人洽谈合作,投稿发文。欢迎联系我们
诚招运营合伙人 ,对新媒体感兴趣,对光电产业和行业感兴趣。非常有意者通过以下方式联我们!条件待遇面谈
投稿丨合作丨咨询

联系邮箱:uestcwxd@126.com

QQ:493826566


评论 (0)
  • 感谢面包板论坛组织的本次测评活动,本次测评的对象是STM32WL Nucleo-64板 (NUCLEO-WL55JC) ,该测试板专为LoRa™应用原型构建,基于STM32WL系列sub-GHz无线微控制器。其性能、功耗及特性组合经过精心挑选,支持通过Arduino® Uno V3连接,并利用ST morpho接头扩展STM32WL Nucleo功能,便于访问多种专用屏蔽。STM32WL Nucleo-64板集成STLINK-V3E调试器与编程器,无需额外探测器。该板配备全面的STM
    无言的朝圣 2025-05-13 09:47 34浏览
  •   电磁数据展示系统平台解析   北京华盛恒辉电磁数据展示系统平台是实现电磁数据高效展示、分析与管理的综合性软件体系,以下从核心功能、技术特性、应用场景及发展趋势展开解读:   应用案例   目前,已有多个电磁数据展示系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据展示系统。这些成功案例为电磁数据展示系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与预处理   智能分析处理   集成频谱分析、时频变换等信号处理算法,自动提取时域频域特征;
    华盛恒辉l58ll334744 2025-05-13 10:20 154浏览
  •   基于 2025 年行业权威性与时效性,以下梳理国内知名软件定制开发企业,涵盖综合型、垂直领域及特色技术服务商:   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转型、新能源软件、光伏软件、汽车软件,ERP,系统二次开发,CRM等领域有很多成功案例。   五木恒润科技有限公司:是一家专业的部队信
    华盛恒辉l58ll334744 2025-05-12 16:13 214浏览
  • 【拆解】+CamFi卡菲单反无线传输器拆解 对于单反爱好者,想要通过远程控制自拍怎么办呢。一个远程连接,远程控制相机拍摄的工具再合适不过了。今天给大伙介绍的是CamFi卡菲单反无线传输器。 CamFi 是专为数码单反相机打造的无线传输控制器,自带的 WiFi 功能(无需手机流量),不但可通过手机、平板、电脑等设备远程连接操作单反相机进行拍摄,而且还可实时传输相机拍摄的照片到 iPad 和电视等大屏设备进行查看和分享。 CamFi 支持大部分佳能和尼康单反相机,内置可充电锂离子电池,无需相机供电。
    zhusx123 2025-05-11 14:14 286浏览
  • 在全球供应链紧张和国产替代需求推动下,国产存储芯片产业快速发展,形成设计到封测一体化的完整生态。北京君正、兆易创新、紫光国芯、东芯股份、普冉股份和佰维存储等六大上市公司在NOR/NAND Flash、DRAM、嵌入式存储等领域布局各具特色,推动国产替代提速。贞光科技代理的品牌紫光国芯,专注DRAM技术,覆盖嵌入式存储与模组解决方案,为多领域客户提供高可靠性产品。随着AI、5G等新兴应用兴起,国产存储厂商有望迎来新一轮增长。存储芯片分类与应用易失性与非易失性存储芯片易失性存储芯片(Volatile
    贞光科技 2025-05-12 16:05 123浏览
  • 在 AI 浪潮席卷下,厨电行业正经历着深刻变革。AWE 2025期间,万得厨对外首次发布了wan AiOS 1.0组织体超智能系统——通过AI技术能够帮助全球家庭实现从健康检测、膳食推荐,到食材即时配送,再到一步烹饪、营养总结的个性化健康膳食管理。这一创新之举并非偶然的个案,而是整个厨电行业大步迈向智能化、数字化转型浪潮的一个关键注脚,折射出全行业对 AI 赋能的热切渴求。前有标兵后有追兵,万得厨面临着高昂的研发成本与技术迭代压力,稍有懈怠便可能被后来者赶
    用户1742991715177 2025-05-11 22:44 163浏览
  • 在印度与巴基斯坦的军事对峙情境下,歼10C的出色表现如同一颗投入平静湖面的巨石,激起层层涟漪,深刻印证了“质量大于数量”这一铁律。军事领域,技术优势就是决定胜负的关键钥匙。歼10C凭借先进的航电系统、强大的武器挂载能力以及卓越的机动性能,在战场上大放异彩。它能够精准捕捉目标,迅速发动攻击,以一敌多却毫不逊色。与之形成鲜明对比的是,单纯依靠数量堆砌的军事力量,在面对先进技术装备时,往往显得力不从心。这一现象绝非局限于军事范畴,在当今社会的各个领域,“质量大于数量”都已成为不可逆转的趋势。在科技行业
    curton 2025-05-11 19:09 218浏览
  • ‌磁光克尔效应(Magneto-Optic Kerr Effect, MOKE)‌ 是指当线偏振光入射到磁性材料表面并反射后,其偏振状态(偏振面旋转角度和椭偏率)因材料的磁化强度或方向发生改变的现象。具体表现为:1、‌偏振面旋转‌:反射光的偏振方向相对于入射光发生偏转(克尔旋转角 θK)。2、‌椭偏率变化‌:反射光由线偏振变为椭圆偏振(克尔椭偏率 εK)。这一效应直接关联材料的磁化状态,是表征磁性材料(如铁磁体、反铁磁体)磁学性质的重要非接触式光学探测手段,广泛用于
    锦正茂科技 2025-05-12 11:02 238浏览
  •   电磁数据管理系统深度解析   北京华盛恒辉电磁数据管理系统作为专业的数据处理平台,旨在提升电磁数据的处理效率、安全性与可靠性。以下从功能架构、核心特性、应用场景及技术实现展开分析:   应用案例   目前,已有多个电磁数据管理系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据管理系统。这些成功案例为电磁数据管理系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与接入:实时接收天线、频谱仪等设备数据,兼容多协议接口,确保数据采集的全面性与实时性
    华盛恒辉l58ll334744 2025-05-13 10:59 139浏览
  • 文/Leon编辑/cc孙聪颖‍2025年1月至今,AI领域最出圈的除了DeepSeek,就是号称首个“通用AI Agent”(智能体)的Manus了,其邀请码一度被炒到8万元。很快,通用Agent就成为互联网大厂、AI独角兽们的新方向,迅速地“卷”了起来。国外市场,Open AI、Claude、微软等迅速推出Agent产品或构建平台,国内企业也在4月迅速跟进。4月,字节跳动、阿里巴巴、百度纷纷入局通用Agent市场,主打复杂的多任务、工作流功能,并对个人用户免费。腾讯则迅速更新腾讯元器的API接
    华尔街科技眼 2025-05-12 22:29 46浏览
  •   定制软件开发公司推荐清单   在企业数字化转型加速的2025年,定制软件开发需求愈发多元复杂。不同行业、技术偏好与服务模式的企业,对开发公司的要求大相径庭。以下从技术赛道、服务模式及行业场景出发,为您提供适配的定制软件开发公司推荐及选择建议。   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转
    华盛恒辉l58ll334744 2025-05-12 15:55 271浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦