基于FPGA视网膜机理的色调映射处理器

FPGA技术江湖 2024-05-24 07:57

大侠好,欢迎来到FPGA技术江湖,江湖偌大,相见即是缘分。大侠可以关注FPGA技术江湖,在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源,或者一起煮酒言欢。



概述


图像作为当前人工智能技术发展当中的重要组成部分,已经得到越来越多学者的重视和研究。在人脸识别、图像分类、目标跟踪等神经网络的应用场合,图像中的信息提取是实现相关技术的基础。因此如何将弱光或者局部过暗的图像中的信息更好的提取出来,是当前众多学者的研究的一个方向。

在目前现有的文献研究中主要有色调映射及其改进的相关算法和直方图均衡算法。色调映射是在有限动态范围媒介上近似显示高动态范围图像的一项计算机图形学技术。目前国内外对于数学算法层面的色调映射技术进行了深入的研究,其中阿兰·霍尔等人提出了基于数学指数型运算的色调映射算法,该算法使用局部和全局图像信息来改善对比度并增加色调映射图像的亮度,根据原图像中的不同区域亮度信息不同的特点来均衡的改善图像的亮度,使得处理后的图像看起来更加自然.同时安巴拉桑迪等人使用FPGA在硬件上实现了该基于数学指数型运算的色调映射算法,在硬件上能够获得良好的视觉质量并具有良好亮度和对比度的图像.在处理 1024*768 的彩色图像时可以达到每秒 126 帧的实时速率,并且将其硬件处理后的图像有软件处理后的相比较,峰值信噪比PSNR)为 57.30、只略微超过了正常值,说明其硬件架构在处理数据精度上存在着一定的问题。

除此之外,还有众多色调映射相关的图像处理算法被相关学者提出来,如奥菲利等人在基于数学指数型运算的色调映射算法的基础上,添加了自动参数选择器,可以根据每个待处理的图像自动调节算法中的相关系数,以便达到更好的处理效果,该文献实现了实时处理的效果,但是容易产生光晕,影响视觉效果。此外拉克尔·乌雷尼亚等人还将人眼视网膜中的双极细胞的部分原理与传统的直方图均衡算法相结合起来,它以比传统方法更自然的方式改善图像细节。同时在GPU以及FPGA上实现该算法,达到了实时处理效果。 

目前来看,较多的色调映射以及直方图均衡算法的改进基础都是在传统的数学原理层面上的改进,缺少人眼视网膜处理图像的自然感觉.虽然采用了人眼视网膜的原理,但是也和传统的直方图均衡算法结合起来,没有全部运用人眼视网膜的原理。同时目前已有的色调映射处理器存在着以下问题。首先是处理速度,虽然部分文献中的处理速度可以实现实时的效果,但处理速度仍然有限,难以用于自动车辆和无人机监控等高清视频流的处理应用之中。其次在功耗优化方面也投入较少,使得已有的一些色调映射处理器难以应用到一些嵌入式设备之中。



主要创新点

 

1、视网膜算法的采用

针对当前已有的色调映射相关的图像增强处理器,本作品的处理器设计思路来源于人眼视网膜能够有效地处理HDR图像以及弱光条件下图像。因而将人眼视网膜中的水平细胞和细胞功能首先算法化,软件上实现功能,然后再实现到硬件上,从而可以真正实现实用的效果.据我们所知,这是第一款完全采用人眼视网膜机理的色调映射处理器。


2、高速低功耗

所设计的处理器在以XC7Z020芯片为基础的PYNQ-Z2的平台上处理256*180的高清图像,可以达到700帧的实时速率,并且能效比(每秒钟每毫瓦可处理的像素点数)为146452的性能,在以Virtex-7芯片为基础的VC707平台上处理1280*768的高清图像,可以达到189帧的实时速率,150 MHz的电路工作频率,功耗0.819W并且能效比为544453,在目前已有的色调映射处理器中,性能最佳。


3、多种硬件技术的设计

本篇所设计的处理器根据所应用的人眼视网膜算法的特性,创新性的设计了几种硬件技术,从而提升处理器整体的处理速度并降低功耗。以下简要介绍技术内容,后文将会详细介绍技术的细节内容。

1) 采用S形卷积核滑动的基于并行处理的数据分块技术。用于减少在进行卷积时从内存中提取图片数据的功耗,并提升提取图片数据的速度,从而提升整体速度和降低功耗。

2) 相邻帧特征共享技术。在处理器使用的人眼视网膜算法中,对于待处理的图像帧需要计算其均值和标准差,根据视频流相邻帧具有相似均值和特征值,从而设计相邻帧特征共享技术,从而降低功耗和提升速度。

3) 多层卷积流水技术。本文所设计的处理器中共有两层卷积,占据主要的处理时间和功耗,因而设计了多层卷积流水技术,进一步提升速度和降低整体功耗。

4) 卷积核滤波器压缩技术。处理器中的卷积部分的卷积核,其数据中含有大量的零元素以及其非零元素具有中心对称的特性,因而采用该技术,压缩卷积核数据,减少RAM存储空间以及降低从RAM中提取卷积核数据的功耗。



系统架构


1.整体设计方案

如图2-1所示,本系统主要是由硬件部分组成,核心部分是基于FPGA的处理器芯片。本系统的主要是由硬件组成外加两个显示和收集图像设备组成,硬件部分主要是采用Xilinx公司的FPGA芯片,本文的处理器目前是采用XC7Z020或Virtex-7芯片作为处理器核心。系统总共有脱机和非脱机两种工作方式,脱机方式是通过处理器外接高清摄像头获取当前所在环境的图像,并发送到核心处理器中进行处理。非脱机方式是采用处理器外接PC端,可以将互联网上的高清视频流发送到处理器进行处理。本系统的核心是硬件处理器模块,同时为了验证图片处理后对边缘检测和人脸识别效果等技术的改善,在PC端软件部分附加了人脸识别和边缘检测模块可以用来说明基于视网膜机理的色调映射处理器模块处理后图像的优越性。

图2-1系统整体结构图

2.基于视网膜机理的色调映射算法原理概述

这一部分,我们简单介绍下我们使用硬件实现的受视网膜启发而改进的色调映射算法。算法整体的基本原理框图2-2所示。

基本原理是三部分:

1)光感受器:首先是利用光感受器将视网膜感受到的光图像转化为电讯号,并传输到后面接下来的处理层。如图2-2中的“受体”层所示,网膜水平细胞的原理

2)水平细胞:然后是利用水平细胞的原理,对视网膜光感受器输出的信号进行亮度调节,实现视觉的亮度适应,并增强边缘对比度,突出景物轮廓。如图2-2中的“水平细胞”层所示。

3)双极细胞最后是利用双极细胞原理,整合水平细胞的输出信号,并传递至神经节细胞和无长突细胞,最后输出到中枢视觉处理区域。如图2-2中的“双极细胞”层所示。

2-2人眼视网膜算法整体原理框图

因此该算法作者将上述处理过程整合成如下的数学处理模型。

1)光感受器采集输入图像的均值和方差。

2)水平细胞的调整区域的计算公式:

 

其中n∈{1,2,3,4},代表rgb三通道,*是卷积操作(15*15卷积),𝐻𝐶𝑖𝑛𝑛(𝑥,𝑦)是对应输入图像(𝑥,𝑦)处的像素,𝑔(𝑥,𝑦;𝜎𝑛(𝑥,𝑦))是(𝑥,𝑦)处像素对应的卷积核.此处滤波器标准差𝜎𝑛(𝑥,𝑦)是一个动态值.根据当前像素点的取值区间来判断选择相应的标准差,从而不同的像素点可能会得到不同的卷积核.如表1所示,其中s,m分别为整个输入图像的标准差和均值。

3)双极细胞调整区域计算公式:


其中𝑓𝑛(𝑥,𝑦)为原始输入图像,n∈{R,G,B},𝐷𝑜𝑔(𝑥,𝑦)是双极细胞处理部分的卷积核(7*7卷积),是一个确定值.)BCou𝑡𝑛(𝑥,𝑦)即为图像处理算法的最终输出。


3.处理器硬件整体架构电路方案设计
本系统的整体硬件架构如下图2-3所示。处理器根据算法特性,并分析算法本身可以并行处理的点,在设计硬件架构时进行了深度的流水线和并行设计。利用FPGA的优势,尽可能的加速算法整体的运算,并尽可能的降低功耗,达到更高速、更低功耗的优秀处理器性能。

图2-3硬件总体架构图

整体硬件架构电路图主要分为五大部分:图像预处理部分、15*15的卷积部分、7*7卷积部分、原图边缘检测部分、图像增强后的边缘检测部分。

1)图像预处理部分:该部分功能主要是实现算法当中的光感受器部分的功能.该部分功能主要是用来预先计算出输入图像的均值和方差,并将结果输出到后面模块。

2)15*15卷积部分:该部分功能主要是实现算法当中的水平细胞处理部分的功能.内部采用了数据分块技术,从而提升速度并降低功耗。

3)7*7卷积部分:该部分主要是实现算法当中的双极细胞部分的功能.内部同样采用了和15*15卷积部分一样的分块功能,从而提升速度并降低功耗。

4)原图边缘检测和图像增强后的边缘检测部分:该部分主要是用来从硬件层面上检验处理器处理后图像的处理的效果.通过边缘检测来比较处理后的图像相较于原图未处理图像的优势。

 


设计演示


为了对比处理器硬件处理后的效果.我们用常用的PSNR(峰值信噪比)和ssim(结构相似性)来把硬件处理器处理后的图像和软件处理后的图像作为对比,从而测试硬件处理器处理后的效果是否相比较软件处理后的更有实际优势)。同时,在该部分中我们还采用了边缘检测效果作对比,以及人脸识别方法来对比增强后的图像对边缘检测的效果和人脸识别准确率提升的帮助。

1.psnr与ssim测试结果分析

峰值信噪比(峰值信噪比,一种全参考的图像质量评价指标,是最普遍和使用最为广泛的一种图像客观评价指标,用来评价图像数据处理后的质量)。结构相似(SIM)结构相似性,也是一种全参考的图像质量评价指标,它分别从亮度、对比度、结构三方面度量图像相似性。

如图3-8所示,图a、b、c分别是原图,软件处理后的图片以及硬件处理后的图片,从视觉效果上来看,软硬件处理后的图像相较于原图上来说,亮度以及对比度均有明显的改善。由于原本显示场景中图像的亮度范围较大,即hdr图像,会造成在一般显示设备中,出现局部过暗或过亮的情况,即如图3-8中的原图所示,因而在经过处理后,过亮或者过暗的地方均得到了改善,使得整幅图像看起来更加柔和。

图3-8三种亮度不足或者局部过暗图像的软硬件处理结果

除此之外,从视觉上来看,硬件处理后的图像和软件处理后的图像相比几乎没有任何区别。表4-1表示了三张图像硬件处理后的PSNR和ssim值。PSNR值一般正常值是在20~40 dB之间,而本处理器处理后的图像的之间,而本处理器处理后的图像的值达到了80 dB以上,说明了我们硬件处理器处理后的图像相比软件后处理后的图像相比,数据损失降到了极小,硬件电路设计的较为完善。其次,ssim值在0~1之间,1为最大值,1表示两幅图片一模一样,结构上相同,几近原图,在我们的比较中,ssim值均接近1,表示我们硬件处理器处理后的图像相比软件后处理后的图像相比,结构相似性几乎相同,硬件处理后的图像损失降到最小。


如图3-9所示,为夜间处理效果的对比图左原右器所示,为夜间处理效果的对比图左原右器处理。

图3-9夜间图像处理效果对比

2.边缘检测测试结果与分析

边缘检测部分的处理效果已经设计集成到了处理器上,可以在硬件上输出显示边缘检测后的效果,从而从侧面反映出,处理后的图像对边缘检测效果的提升。

图3-12第一组原图(左)及对原图进行边缘检测图(右)

图3-13第二组原图亮度增强后的图(左)及亮度增强后边缘检测图(右)

如图3-12和3-13所示,经过处理器处理后的图像,再进行边缘检测后的效果相比较于原图的边缘检测的效果有了比较大的提升,更多的细节被检测出来,侧面反映出本系统处理器的优越性。

3.视频流处理效果性能与技术优势

对于高清视频流的处理,本处理器在XC7Z020 FPGA资源的基础上,处理256*180的高清彩色图像,可以达到每秒700帧的实时速率(电路工作频率70 MHz),以及881 mW的较低功耗。在Virtex 7资源平台的基础上,处理1024*768的高清彩色图像,可以达到每秒189帧的实时速率,以及819毫瓦的低功耗。

该处理器的各项性能参数与现有的相关比较有优势的文献相比,本处理器均表现出优异的性能,如表4-2所示。

- THE END -

🍁


往期精选 

 
 

【免费】FPGA工程师人才招聘平台

FPGA人才招聘,企业HR,看过来!

系统设计精选 | 基于FPGA的实时图像边缘检测系统设计(附代码)

基于原语的千兆以太网RGMII接口设计

时序分析理论和timequest使用_中文电子版

求职面试 | FPGA或IC面试题最新汇总篇

资料汇总|FPGA软件安装包、书籍、源码、技术文档…(2024.01.06更新)

FPGA就业班,05.04开班,新增课程内容不加价,高薪就业,线上线下同步!

FPGA技术江湖广发江湖帖

无广告纯净模式,给技术交流一片净土,从初学小白到行业精英业界大佬等,从军工领域到民用企业等,从通信、图像处理到人工智能等各个方向应有尽有,QQ微信双选,FPGA技术江湖打造最纯净最专业的技术交流学习平台。


FPGA技术江湖微信交流群

加群主微信,备注姓名+学校/公司+专业/岗位进群


FPGA技术江湖QQ交流群

备注姓名+学校/公司+专业/岗位进群

FPGA技术江湖 任何技术的学习就好比一个江湖,对于每一位侠客都需要不断的历练,从初入江湖的小白到归隐山林的隐世高人,需要不断的自我感悟自己修炼,让我们一起仗剑闯FPGA乃至更大的江湖。
评论
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 155浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 69浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 117浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 40浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 96浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 48浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 102浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 135浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 82浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 22浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 107浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦