基于FPGA和麦克风阵列的高速高精度声源定位系统设计

FPGA技术江湖 2024-07-24 07:01

大侠好,欢迎来到FPGA技术江湖,江湖偌大,相见即是缘分。大侠可以关注FPGA技术江湖,在“闯荡江湖”、"行侠仗义"栏里获取其他感兴趣的资源,或者一起煮酒言欢。“煮酒言欢”进入IC技术圈,这里有近50个IC技术公众号。


第一部分 设计概述 / Design Introduction

1.1 设计目的

频繁杂乱的鸣笛声,不但给周边居民的生活质量造成很大影响,而且增加了驾驶员的疲劳,影响行驶安全,并使乘客和行人在出行时倍感烦躁不安。在大多 数城市的道路上,时常出现禁止鸣笛的标志,然而并不是所有人都能自觉地遵守 规则,对鸣笛之人进行适当的处罚是确保这项规定能够顺利实施的必要举措。

我们决定利用麦克风阵列获取声音信号,使用 FPGA 技术计算声音的位置, 使用 OPENMV 实现图像的抓拍,最终实现对鸣笛车辆的准确定位。

1.2 应用领域

本作品实际应用前景广泛。

用于民用领域:在交通监控中,对违规鸣笛的车辆进行定位并拍照取证,提高监控效率;在音视频会议系统中,采集会议发言人的语音信号,并进行实时处 理来确定发言人的当前位置坐标;在安防系统中,利用声源定位系统来辅助传统 摄像头,从而调整监控方向,弥补了普通的运动识别在光线昏暗条件下的不足, 提升安防效果;等等。

用于军事领域:既可以有效的发现敌方目标所在的位置,又可以充分的隐藏 自身。

1.3 主要技术特点

(1)采用麦克风阵列来获取声音信号 相较于传统麦克风,麦克风阵列具有空间选择性,能明显抑制干扰;可以用 于获取多个声源或移动声源信号,也可以用在一些特殊场合,该系统对于远处和 近处的声源,均可以正常工作。

(2)利用 FFT 算法和 CORDIC 算法计算相位 前者是离散傅氏变换(DFT)的快速算法,是有限长序列傅里叶变换的有限 点离散采样,从而实现了频域离散化,使频域采样按照数字运算的方法进行。后者是一个“化繁为简”的算法,将许多复杂的运算转化为一种“仅需要移位和加 法”的迭代操作。

(3)用 verilog 语言编码并利用 FPGA 实现 本作品用 FPGA 作处理器处理声音信号,利用了 FPGA 硬件并行的优势,在 每个时钟周期内完成更多的处理任务,超越了数字信号处理器的运算能力。

1.4 关键性能指标

(1)完成对实验室等室内环境的静止的鸣笛声源定位,并用摄像头以及舵 机云台对鸣笛者进行抓拍,抓拍成功率超过 90%,并且每次抓拍得到的鸣笛者偏 离照片中心不超过 50%.

(2)完成对实验室等室内环境的缓慢移动的持续鸣笛声源定位,并用摄像 头以及舵机云台对鸣笛者进行跟拍,跟拍成功率超过 90%,并且在跟拍过程中摄 像头内不丢失鸣笛者图像。

(3)完成对实验室等室内环境的快速移动的持续鸣笛声源定位,并用摄像 头以及舵机云台对鸣笛者进行跟拍,跟拍成功率超过 80%,并且在跟拍过程中摄 像头出现鸣笛者的时间超过跟拍总时间的 80%.

(4)对上述指标(1)中的抓拍在鸣笛开始的 0.5 秒内完成抓拍

1.5 主要创新点

(1)所有过程完全采用数字化的信号处理方式,所有通信均为数字通信, 所有处理的信号都为数字信号,相比于易受各种干扰的模拟信号系统,数字信号 处理抗干扰能力更强,通过多路信号并行处理来实现。

(2)利用了 FPGA 硬件并行的优势,打破了顺序执行的模式,在每个时钟周 期内完成更多的处理任务,超越了数字信号处理器(DSP)的运算能力。通过使 用尽可能多的麦克风通道,来提高定位的精确度。

(3)FPGA 良好的运算性能允许建立实时性良好的定位系统,可以做到追踪 高速行驶的鸣笛汽车。

(4)本项目将定位的空间由原有的二维空间拓展为三维空间,提高了追踪 定位的灵活性和准确性。

第二部分 系统组成及功能说明 / System Construction & Function Description

2.1 整体介绍

system_diagram 本系统由声源定位系统和图像抓拍系统两部分组成,其中声源定位系统 由麦克风阵列模块、PDM 解码模块、相位计算模块组成,后两个模块通过 FPGA 板实现,图像抓拍系统通过 OPENMV 实现。

声源产生声音信号,传送给麦克风阵列,编码产生 PDM 波,再通过接收 PDM 波的缓冲区,送入高阶 fir 滤波器实现对 PDM 的解码,然后将结果传入 相位计算模块,即先通过 FFT 算法进行频谱分析,再利用 CORDIC 算法计算 相位得到声源的坐标,最后通过基于 OPENMV 的图像抓拍系统显示声源位置 并抓拍。

2.2 各模块介绍

2.2.1 麦克风阵列模块

我们用到的硅麦型号为 SPW0690LM4H-1,这是一种小型、高性能、低功耗, 底部端口硅数字麦克风与单位 PDM 输出。包括一个声传感器,一个低噪声输入缓冲器和 sigma-delta 调制器。

它具有的特性:低失真/高 AOP、高信噪比、低功耗模式下低电流消耗、平 坦的频率响应、高驱动能力、射频屏蔽、支持双多路通道、极稳定的性能、全指 向性等等。在采集声音方面,在很宽的频带内增益保持一致,高保真的采集语音 信号,灵敏度高,能够检测到环境中微弱的声音信号。它的全指向性可以拾取各 方向的声音,对来自四面八方的声音同样敏感,特别适合用在本项目中。

2.2.2 处理器

本作品使用 Ego1 开发板作为处理器,型号为 Xilinx Artix-7 系列的 XC7A35T-1CSG324C FPGA。

Xilinx 7系列的FPGA芯片内部集成了两个12bit位宽、采样率为1MSPS的ADC, 拥有多达 17 个外部模拟信号输入通道,为用户的设计提供了通用的、高精度的模拟输入接口。

2.2.3 PDM 解码模块——基于高阶 fir 低通滤波器

PDM 的解码采用高阶 fir 滤波器的算法。PDM 编码虽然只有 0 和 1 两种电平, 但 PDM 编码保留了原始的未编码数据的所有频率分量,同时增加了高频噪声成 分 FIR 滤波器是数字信号处理系统中最基本的元件,它可以在保证任意幅频特征的同时具有严格的线性相频特性,其单位抽样响应是有限长的,此系统稳定。根据自顶向下的层次化、模块化的设计思想,将整个滤波器的设计划分为多个模块, 利用硬件描述语言 Verilog 进行各个模块的功能设计,并用 Matlab 软件设计 98阶滤波器各抽头系数。

对 PDM 编码进行傅里叶变换,得到的频率响应如下图:

由于声音定位系统是为了得到人耳可分辨的声音,或得到清晰的骑车鸣笛声音,并且人耳可以分辨的声音频率为 20-20000Hz,而高于 20000Hz 的声音信号是我们不需要的,所以我们的低通滤波器的通带频率设置为 0-20000Hz,截止频率设置为 48000Hz,阻带频率设置为 100000Hz。PDM 信号经过该滤波器, 不仅可以实现 PDM 信号向 PCM 信号的解码,还顺带滤除了我们不需要的高频声音信号。

该 fir 滤波器的差分方程表达式为:

将原始信号进行编码,并经过 97 阶 fir 低通滤波器的信号与原始信号的对比图如图 9、10 所示,其中绿色的为解码后的信号,蓝色的为原始信号。

由图可知,设计的滤波器较好的将编码后的信号还原为原始信号,并且原始信号所包含的频率分量受到的影响较小。

用 VIVADO 软件编写 verilog 语言实现该 97 阶的数字滤波器,由于需要大量 的串行浮点运算,所以所消耗的时间较多,但通过硬件,可用并行运算进行处理。通过计算,我们设计的 97 阶滤波器需要 97 个乘法器和 98 个加法器,具体代码见附录。

2.2.4 相位计算模块

通过 FFT 算法进行频谱分析

FFT 是离散傅氏变换(DFT)的快速算法,是有限长序列傅里叶变换的有限点 离散采样,从而实现了频域离散化,使频域采样按照数字运算的方法进行。

使用 Xilinx Vivado 内置的 Fast FourierTransform IP core 进行快速傅里叶变换, 配置使用 Radix-2 架构,使用 8 通道,每个通道一帧包含 512 个数据点。输入的数据位宽为 16 位,输出则采用 Fixed Point、Unscale,同时为顺序输出,配置如图 12。

运用 CORDIC 算法计算相位

CORDIC 算法是一个“化繁为简”的算法,将许多复杂的运算转化为一种“仅 需要移位和加法”的迭代操作。

假设在 xy 坐标系中有一个点 P1(x1,y1),将 P1 点绕原点旋转θ角后得到 点 P2(x2,y2)。

于是可以得到 P1 和 P2 的关系:

2.2.5 图像抓拍系统

在本作品中,使用分辨率为 640*480 的以数字图像传感器为核心的摄像头, 并使用具有角度不断变化并可以保持的舵机,构成图像抓拍系统。

OPENMV 通过接收 FPGA 串口发送的声源位置信息,从而控制舵机转向声源 的方向,使得我们使用的摄像头可以准确的对准声源,并下达指令给上位机(PC) 进行拍照或录像。照片将存储在上位机的内存中。

第三部分 完成情况及性能参数 / Final Design & Performance Parameters

(1)完成了在实验室对静止的鸣笛声源进行定位,并用摄像头以及舵机云 台对鸣笛者进行抓拍,抓拍成功率超过 95%,并且每次抓拍得到的鸣笛者偏离照 片中心不超过 30%,抓拍延时在 0.5 秒以内。照片效果如下图所示。

(2)完成对实验室的快速移动的持续鸣笛声源的定位,并用摄像头以及舵 机云台对鸣笛者进行实时跟拍,跟拍成功率超过 80%,并且在跟拍过程中摄像头 出现鸣笛者的时间超过跟拍总时间的 95%,跟拍效果如下图所示。

(3)上位机屏幕能够实时显示摄像头的情况,并且储存了抓拍到的鸣笛者 照片,以及持续鸣笛跟拍的视频。

第四部分 总结 / Conclusions

4.1 可扩展之处

(1)我们使用的 4 路数字麦克风阵列 PCB 板预留了额外的 28 个空焊的麦克 风接口,可以扩展至 32 路。从而可以尽可能地减小数字麦克风接收的误码率, 并且再次提高定位的精度。

(2)我们用来控制舵机云台的 OPENMV 拥有自带的摄像头,并且具有图像 识别等功能,将来可以使用 OPENMV 进行图像处理并配合声源定位系统进行综 合跟拍以及抓拍,从而提高跟拍的成功率以及抓拍的准确度。

(3)我们使用了高性能的上位机对跟拍和抓拍的图像进行实时显示,并保 存到上位机中。上位机将来可以对保存下来的照片进行二次分析,对抓拍到的车 辆进行车牌识别,并将违章记录上传到云端,并利用大数据进行监管,对一些违 章次数较多的车辆进行处罚。

(4)本项目使用到的 FPGA 芯片型号仅仅为 XILINX 的 A 系列入门级的 XC7A35T,如果更换为板载资源更多的型号,将会进一步提高声源定位运算的速 度。

END


往期精选 

 
 

【免费】FPGA工程师招聘平台

今日说“法”:FPGA芯片如何选型?

SANXIN-B01开发板verilog教程V3电子版

学员笔记连载 | FPGA Zynq 千兆以太网回环

就业班学员学习笔记分享:FPGA之HDMI、以太网篇

求职面试 | FPGA或IC面试题最新汇总篇

FPGA项目开发:204B实战应用-LMK04821代码详解(二)

项目合作 | 承接FPGA项目公告

资料汇总|FPGA软件安装包、书籍、源码、技术文档…(2024.01.06更新)

FPGA就业班,07.20开班,新增课程内容不加价,高薪就业,线上线下同步!

FPGA技术江湖广发江湖帖

无广告纯净模式,给技术交流一片净土,从初学小白到行业精英业界大佬等,从军工领域到民用企业等,从通信、图像处理到人工智能等各个方向应有尽有,QQ微信双选,FPGA技术江湖打造最纯净最专业的技术交流学习平台。


FPGA技术江湖微信交流群

加群主微信,备注姓名+公司/学校+岗位/专业进群


FPGA技术江湖QQ交流群

备注姓名+公司/学校+岗位/专业进群

FPGA技术江湖 任何技术的学习就好比一个江湖,对于每一位侠客都需要不断的历练,从初入江湖的小白到归隐山林的隐世高人,需要不断的自我感悟自己修炼,让我们一起仗剑闯FPGA乃至更大的江湖。
评论 (0)
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 403浏览
  • 2024年初,OpenAI公布的Sora AI视频生成模型,震撼了国产大模型行业。随后国产厂商集体发力视频大模型,快手发布视频生成大模型可灵,字节跳动发布豆包视频生成模型,正式打响了国内AI视频生成领域第一枪。众多企业匆忙入局,只为在这片新兴市场中抢占先机,却往往忽视了技术成熟度与应用规范的打磨。以社交平台上泛滥的 AI 伪造视频为例,全红婵家人被恶意仿冒博流量卖货,明星们也纷纷中招,刘晓庆、张馨予等均曾反馈有人在视频号上通过AI生成视频假冒她。这些伪造视频不仅严重侵犯他人权
    用户1742991715177 2025-05-05 23:08 92浏览
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 217浏览
  • Matter协议是一个由Amazon Alexa、Apple HomeKit、Google Home和Samsung SmartThings等全球科技巨头与CSA联盟共同制定的开放性标准,它就像一份“共生契约”,能让原本相互独立的家居生态在应用层上握手共存,同时它并非另起炉灶,而是以IP(互联网协议)为基础框架,将不同通信协议下的家居设备统一到同一套“语义规则”之下。作为应用层上的互通标准,Matter协议正在重新定义智能家居行业的运行逻辑,它不仅能向下屏蔽家居设备制造商的生态和系统,让设备、平
    华普微HOPERF 2025-05-08 11:40 111浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 215浏览
  • 文/郭楚妤编辑/cc孙聪颖‍相较于一众措辞谨慎、毫无掌舵者个人风格的上市公司财报,利亚德的财报显得尤为另类。利亚德光电集团成立于1995年,是一家以LED显示、液晶显示产品设计、生产、销售及服务为主业的高新技术企业。自2016年年报起,无论业绩优劣,董事长李军每年都会在财报末尾附上一首七言打油诗,抒发其对公司当年业绩的感悟。从“三年翻番顺大势”“智能显示我第一”“披荆斩棘幸从容”等词句中,不难窥见李军的雄心壮志。2012年,利亚德(300296.SZ)在深交所创业板上市。成立以来,该公司在细分领
    华尔街科技眼 2025-05-07 19:25 192浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 256浏览
  • 后摄像头是长这个样子,如下图。5孔(D-,D+,5V,12V,GND),说的是连接线的个数,如下图。4LED,+12V驱动4颗LED灯珠,给摄像头补光用的,如下图。打开后盖,发现里面有透明白胶(防水)和白色硬胶(固定),用合适的工具,清理其中的胶状物。BOT层,AN3860,Panasonic Semiconductor (松下电器)制造的,Cylinder Motor Driver IC for Video Camera,如下图。TOP层,感光芯片和广角聚焦镜头组合,如下图。感光芯片,看着是玻
    liweicheng 2025-05-07 23:55 128浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 293浏览
  • 某国产固态电解的2次和3次谐波失真相当好,值得一试。(仅供参考)现在国产固态电解的性能跟上来了,值得一试。当然不是随便搞低端的那种。电容器对音质的影响_电子基础-面包板社区  https://mbb.eet-china.com/forum/topic/150182_1_1.html (右键复制链接打开)电容器对音质的影响相当大。电容器在音频系统中的角色不可忽视,它们能够调整系统增益、提供合适的偏置、抑制电源噪声并隔离直流成分。然而,在便携式设备中,由于空间、成本的限
    bruce小肥羊 2025-05-04 18:14 246浏览
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 391浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 154浏览
  • 5小时自学修好BIOS卡住问题  更换硬盘故障现象:f2、f12均失效,只有ESC和开关机键可用。错误页面:经过AI的故障截图询问,确定是机体内灰尘太多,和硬盘损坏造成,开机卡在BIOS。经过亲手拆螺丝和壳体、排线,跟换了新的2.5寸硬盘,故障排除。理论依据:以下是针对“5小时自学修好BIOS卡住问题+更换硬盘”的综合性解决方案,结合硬件操作和BIOS设置调整,分步骤说明:一、判断BIOS卡住的原因1. 初步排查     拔掉多余硬件:断开所有外接设备(如
    丙丁先生 2025-05-04 09:14 119浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦