OpenMV-AGAST算法代码阅读

原创 云深之无迹 2023-08-06 20:48

我以前研究过一段时间的OpenMV的源码,当时的功力太浅,看不大懂,现在又重新的翻出来看。

先确定代码在哪里,OpenMV是在资源受限的情况下执行视觉算法,所以里面的很多写法都是高效的,被优化过的,这也是我读的一个原因。

第一先读第一个文件,是一个角点的快速查找算法。图像基础的操作都被封装在了我现在展示的这个文件里面。

什么是角点?

角点通常被定义为两条边的交点,或者说,角点的局部邻域应该具有两个不同区域的不同方向的边界。角点检测(Corner Detection)是计算机视觉系统中获取图像特征的一种方法,广泛应用于运动检测、图像匹配、视频跟踪、三维重建和目标识别等,也可称为特征点检测。

这张图可以说是非常的简单明了。

角点的基本算法:选取一个局部窗口,将这个窗口沿着各个方向移动,计算移动前后窗口内像素的差异的多少进而判断窗口对应的区域是否是角点。

这个就是数学上的描述

我们寻找的角点就是去滑动判断。

这个就是我说的常见操作被打包的地方

  • 它提供了低级图像处理操作的定义和函数。像素格式,基本图像统计,滤波,边缘检测,形状检测,条码识读等。

  • 它针对嵌入式设备和微控制器设计,侧重效率和代码体积小。

  • 使用定点数代替浮点数。直接对原始像素缓冲区进行操作。

  • 支持常见的图像格式,像BMP,PPM,JPEG等。以及基本的机器视觉功能,比如模板匹配,QR码识读。

  • 有在图像上绘制基本形状,线条,文字等的函数。

  • 在可用时使用DMA和SIMD指令做硬件加速。不可用时回退到C实现。

  • 使用C语言编写,但可以通过FFI在更高级语言如MicroPython或Arduino中使用。

  • OpenMV开源开发,作为他们的机器视觉相机模块的一部分。但可以独立使用。

这个是要看的算法的函数

这个算法现在讨论的很少,我就简单的说下:自适应通用角点检测(Adaptive and Generic Accelerated Segment Test,AGAST)算法,该算法是对FAST算法的一种改进主要提升了速度与亮度变化下的鲁棒性,但没有解决尺度不变性。

现在接着看代码。上面的代码里面大体是实现了:

  1. init5_8_pattern() 函数:

  • 初始化像素横竖方向偏移量,用于后续快速访问周围像素。

  1. agast58_detect() 函数:

  • 使用5x5个像素组成的模板匹配算法扫描图像,找到角点。

  • 像素值大于或小于中心点像素值的偏移量编码成一个64位的特征码。

  • 如果匹配了角点模板,记录下角点坐标。

  1. agast58_score() 函数:

  • 使用二分法找到最佳的阈值,进一步提高角点质量。

  • 周围5x5像素值和该阈值进行比较,如果匹配角点模板,说明是角点。

  • 不断调整阈值,找到使得匹配模板的像素数最多的阈值。

  1. nonmax_suppression() 函数:

  • 应用非极大值抑制进一步提炼角点。

  • 抑制掉像素梯度较小的不明显角点。

  1. alloc_keypoint() 函数:

  • 将检测到的角点包装成 keypoints 数据结构。

第一次见这种写法

该变量是用于储存图像像素的偏移量,用于快速访问像素周围的像素灰度值。

s_offset0 表示相对于当前像素的左上方像素的偏移量。

具体来说:

  • s_offset0 表示相对于(x,y)的(x-1, y-1)像素

  • s_offset1 表示相对于(x,y)的(x-1, y)像素

  • s_offset2 表示相对于(x,y)的(x, y-1)像素

  • 以此类推

通过预先计算好这些固定的偏移量,就可以通过 指针偏移 的方式,快速获取周围像素的值,而不需要每次都计算坐标关系,从而提高效率。所以,这个 s_offset0 变量就是一个优化手段,用来加速周围像素访问。

我们看第一个函数的签名,有个*,这里就要写一下C语言的知识了。


先说这个函数的作用-agast58_detect() 是AGAST算法中用于检测角点的主要函数。

它的主要功能是:

  1. 在输入图像img上,使用一个5x5像素模板滑动扫描。

  2. 将中心像素与周围像素进行比较,大于或小于阈值b的编码成一个特征码。

  3. 如果特征码与角点的模板匹配,则记录该像素为角点候选。

  4. 所有检测到的角点候选保存在 corner_t 结构体数组 corners 中。

  5. num_corners 为输出参数,用于返回检测到的角点总数。

  6. roi 参数用于指定只检测图像的某个区域。

其中corner_t结构体包含了每个检测到角点的x,y坐标和score明显性分数。

agast检测依赖于一个经过优化的像素访问顺序以及二值比较来实现高效运算。


在C语言中,函数名前面的*代表该函数返回一个指针类型。

对于agast58_detect这个函数:

  • 返回值的类型是corner_t*,是一个指向corner_t结构体的指针。

  • 这个指针指向一个动态分配的数组,用于存储检测到的所有角点。

加上*的原因:

  1. 返回一个指针,函数可以返回一个数组或对象,不仅仅是一个scalar值。

  2. 指针访问内存速度快,不需要拷贝整个数组。

  3. 函数执行结束后,指针变量还可以被外部代码访问,相当于函数可以修改外部变量。

  4. 把返回数组的内存管理交给调用者,函数执行完就可以释放内部内存,不用维护资源。

总结一下:

  • *表示返回一个指针

  • 可以返回动态数组/对象

  • 提高效率,不拷贝大数组

  • 指针可修改外部变量

  • 内存管理交给调用者


程序的实现里面大量的使用了指针的偏移,基本思想是:


  • 直接通过指针运算获取相邻像素,而不用每次计算坐标。

  • 预先计算好偏移量,例如左上角像素的偏移量是 -1行 -1列。

  • 将这些固定偏移量存储在变量中,比如s_offset0。

  • 在访问像素时,直接基于指针偏移这个固定的值,这样就跳过了坐标计算。

例如,当前指针指向像素 (x, y):

uint8_t *imgPtr = &img[y * width + x];

获取左上角像素,不用偏移:

uint8_t leftUp = img[ (y-1) * width + (x-1) ]; // 需要计算坐标

使用偏移:

int offset0 = -width - 1; // 预先计算偏移量 uint8_t leftUp = imgPtr[offset0]; // 基于指针偏移

通过指针偏移,避免每次获取相邻像素时重复计算偏移量,这样可以明显减少计算量,从而加速像素访问。

再看这个函数,这个alloc_keypoint()函数是用于分配和初始化一个关键点结构kp_t的。

它做了以下几件事:

  1. 使用xalloc0()在堆上分配一个kp_t结构的内存,并初始化为0。

  2. 将传入的x,y坐标及score分数存入kp_t中。

  3. 注释里提到必须将描述子descriptor数组初始化为0。这里通过xalloc0()预先设置为0实现。

  4. 返回这个kp_t指针。


这样调用者就可以拿到一个堆上分配的、坐标与分数填充了、描述子初始化为0的关键点结构kp_t。


需要注意的是:

  • 必须初始化描述子数组,后续的特征描述算子会填充描述子。

  • 使用xalloc0()而不是malloc,可以自动初始化内存为0。

  • 返回 kp_t 指针,调用者可以进一步访问关键点数据。

综上,这是一个辅助函数,用于根据坐标分数快速创建一个关键点结构.

它自己又重写了一次这个malloc的函数,xalloc0()是一种自定义的内存分配函数,与malloc()类似,但是有一些额外的功能:

  1. 当size为0时,直接返回NULL,而不报错。这与malloc的行为不同。

  2. 使用gc_alloc在堆上分配内存,这是MaixPy特有的 gc 堆内存分配函数。

  3. 分配成功后用memset清零内存。这是xalloc0的关键功能之一。

  4. 如果分配失败,调用xalloc_fail导致程序异常。

  5. 返回清零后的内存指针。

这样使用xalloc0比malloc好在:

  • SIZE为0时不会错误。

  • 自动清零内存,不需再memset。

  • 与MaixPy的GC堆内存管理兼容。

  • 出错时终止程序,不需要额外判断返回NULL情况。

这个init5_8_pattern()函数是用于初始化图像像素的8方向偏移量,这是AGAST算法的一个优化。

它的作用是:

  1. 接收图像的宽度width作为参数。

  2. 如果当前宽度与已保存的s_width相同,直接返回,不再初始化,避免重复计算。

  3. 如果宽度变了,更新s_width为新宽度。

  4. 计算8个方向相对当前像素点的偏移量:

  • s_offset0 (-1, -1) 左上角

  • s_offset1 (-1, 0) 正上方

  • ...

  • s_offset7 (-1, 1) 左下角

  1. 偏移量根据图像宽度width调整,即乘以width。

这样,在后续检测角点时,可以直接用这些预计算偏移访问周围像素,不需要每次都计算坐标偏移,加速了像素访问。通过一次初始化,减少重复计算,从而提升检测效率。充分利用了图像具有固定尺寸的特点。

这个agast_detect()函数实现了AGAST角点检测的完整流程:

  1. 初始化5x5窗口的偏移量init5_8_pattern()

  2. 调用agast58_detect()函数进行角点检测,返回检测到的角点数组

  3. 对每一个角点调用agast58_score()计算明显性分数

  4. 进行非极大值抑制nonmax_suppression(),过滤掉弱角点

  5. 将剩下的角点保存在输出的keypoints数组中

  6. 释放临时的角点内存fb_free()

所以这个函数将角点检测、评分和滤波三个阶段包装起来,实现了一个完整的AGAST角点检测器。

它接受输入图像,检测参数(threshold),区域等,最终输出经过优化的高质量角点集。

其实还没有完全说完,这个函数很长:

大概是这样的

  1. 初始化循环边界 - xsizeB, ysizeB 定义了只在图像有效区域内循环

  2. 分配内存 - 使用 fb_alloc 在内存池中分配 corner_t 数组

  3. 双重循环 - 外层循环 y 方向,内层循环 x 方向扫描每个像素

  4. 像素比较 - 在 homogeneous 和 structured 两个标签下,使用偏移像素比较中心像素,判断是否匹配角点模式

  5. 记录角点 - 如果匹配就记录下角点坐标到 corners 数组

  6. 返回结果 - 将检测到的角点数量赋值给 num_corners,并返回角点数组

里面的循环做的这个事情比较多。

同样下头的还有一个函数, agast58_score() 函数主要实现了A-GAST算法中使用二分法搜索最佳阈值的步骤。

主要流程是:

  1. 初始化阈值的上下限 bmin、bmax。

  2. 不断循环,将当前阈值 b 代入角点模式比较。

  3. 如果匹配了角点模式,则把 b 作为新的下限 bmin。

  4. 如果不匹配角点模式,则把 b 作为新的上限 bmax。

  5. 通过二分不断逼近使得角点模式匹配的像素数最多的阈值。

  6. 当上下限只差1时,返回最佳阈值 bmin。

关键点:

  • 使用二分搜索提升角点明显性。

  • 像素比较使用偏移访问提速。

  • 通过不断调整阈值 b 寻找最佳角点模式匹配。

  • 返回最佳阈值,作为该像素角点的分数。

看下这个检测算法里面的这个句子,

  1. 循环遍历所有检测到的角点 corners

  2. 计算每个角点的像素指针 - 通过角点的 x,y 坐标,计算在图像像素数组中的偏移量

  3. 调用 agast58_score() 并传入像素指针和阈值threshold

  4. agast58_score() 将返回0-255范围的分数,记录在 corner[i].score 中

  5. 最后每个角点除了有坐标x,y之外,还有一个分数score表示角点的明显程度。

所以这个过程对每一个角点候选运行了二分搜索,找到了最佳的阈值,作为该点的分数。分数高的角点匹配度更好,更明显,更稳定,这样后续就可以基于分数进行非极大值抑制来过滤掉弱角点。这种为每个角点单独密集计算的方式也是AGAST算法区别于FAST算法的主要特点之一。

这个非极大值抑制(non-maximum suppression)函数的作用是去除重复或边缘响应较弱的非极大值角点,只保留每个局部区域响应最强的角点。

主要步骤是:

  1. 计算每一行的起始角点索引,用于快速查找上下行角点。

  2. 对每个角点,检查其上下左右4邻域是否存在更高分数的角点。

  3. 如果存在,则抑制该角点,不将其录入最终角点集。

  4. 只保留每个局部区域分数最高的角点。

  5. 检查内存是否足够,不足则试图释放内存使能继续录入角点。

  6. 将抑制后的角点保存到输出数组中。

这通过只保留局部最大值点,去除了边缘响应较弱的重复角点,提升了角点质量。

AGAST算法相比FAST算法加入了这个非极大值抑制步骤,可以有效提升角点的重复性和分布均匀性。

里面有一个这样的句子,是初始化 row_start 数组,row_start 数组用来记录每一行的第一个角点在 corners 数组中的索引。

具体地:

  1. row_start 的大小是图像总行数+1,即 last_row + 1

  2. 使用 -1 来表示该行没有检测到角点

  3. 初始化所有值为 -1,表示刚开始还没有任何角点

  4. 后面在检测到角点时会记录:

row_start[角点所在行] = 角点在corners数组中的索引

  1. 所以row_start[y] = x 表示:

第y行的第一个角点在corners数组中的索引为x

这样初始化row_start为-1VeryAmerican,在后续的非极大值抑制中,就可以通过row_start数组快速获取上下行的角点信息,从而高效实现非极大值抑制。


真复杂啊,操。

评论
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 149浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 209浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 233浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 54浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 140浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 282浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 113浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 143浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 407浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 116浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 289浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 186浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 186浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 616浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦