单光子激光雷达+机器学习算法,实现遮挡场景的3D建模

MEMS 2024-06-20 00:01

这项技术有望实现更安全的自动驾驶、更高效的增强现实/虚拟现实(AR/VR)设备以及更快的仓库机器人。

通常我们驾驶汽车行进在隧道中,当隧道出口前方发生事故时,如果前方车辆没有采取刹车制动,我们是无法提前预知的。这种情况下,如果车辆能够“看到”人类驾驶员视线以外的区域并更快地踩下刹车,将大大提高车辆的安全性。

据麦姆斯咨询报道,麻省理工学院(MIT)和Meta公司的研究人员开发了一种基于单光子激光雷达(LiDAR)的计算机视觉技术,或能在未来帮助自动驾驶汽车做到这一点。

他们引入了一种新方法,可以利用单个激光雷达位置获取的信息,创建整个场景物理精确的3D模型,包括视线遮挡的区域。他们在这项技术中利用阴影来确定场景中被遮挡部分的情境。

他们将这种方案称为“PlatoNeRF”,基于希腊哲学家柏拉图的洞穴寓言,这是其著作《理想国》中的一段,故事中被锁在洞穴中的囚犯,根据投射在洞穴墙壁上的阴影来辨别外部世界的真实情况。

通过将单光子激光雷达技术与机器学习相结合,PlatoNeRF可以生成比某些现有AI技术更准确的3D几何重建。此外,PlatoNeRF在平滑地重建阴影难以分辨的场景时表现更为出色,例如环境光高亮或背景较暗的场景。

除了提高自动驾驶汽车的安全性,PlatoNeRF还可以使用户无需走动测量,即可对房间的几何形状进行建模,从而提高AR/VR设备的效率。它还可以帮助仓库机器人更快地在杂乱的环境中找到物品。

“这一概念的关键是将之前在不同学科完成的两件成果结合在一起:多重反射单光子激光雷达和机器学习算法。事实证明,两者的结合,带来了很多新的探索机遇。”麻省理工学院媒体艺术与科学专业的研究生、PlatoNeRF论文主要作者Tzofi Klinghoffer说道。

揭示问题

从一个激光雷达视角重建完整的3D场景是一个很复杂的问题。

一些机器学习算法采用生成式人工智能模型,试图猜测遮挡区域中的物体,但这些模型可能会幻想出并不存在的物体。还有其它方法尝试使用彩色图像中的阴影来推断隐藏物体的形状,但当阴影难以辨别时可能会遇到困难。

对于PlatoNeRF,麻省理工学院的研究人员利用了一种称为单光子激光雷达的新传感模态。激光雷达通过发射光脉冲并测量光反射回传感器所需的时间来测绘3D场景。由于单光子激光雷达可以检测单个光子,因此它们可以提供更高分辨率的数据。

研究人员使用单光子激光雷达中的激光器照亮场景中的目标点。一些光从该点反射并直接返回传感器。然而,大部分光线在返回传感器之前会被其它物体散射和反射。PlatoNeRF正是利用了这些二次光反射。

通过计算光线反射两次然后返回激光雷达传感器所需的时间,PlatoNeRF捕获有关场景的其它信息,包括深度。第二次反射的光还包含有关阴影的信息。


实验方案:PlatoNeRF通过单视角二次反射激光雷达的飞行时间学习3D场景几何形状,并使用NeRF建模。

系统追踪二次反射光,以确定哪些点位于阴影中。根据这些阴影的位置,PlatoNeRF可以推断出隐藏物体的几何形状。


研究人员采用的激光雷达系统包含位置Xs的SPAD和位置Xl的脉冲激光器。SPAD视角保持不变,而激光器依次照亮场景中的不同点(从I1到IK),对于每个照明点,测量光传播的飞行时间。

单光子激光雷达中的激光器依次照亮16个点,以捕获多个图像,用于重建整个3D场景。

“每次我们照亮场景中的一个点时,都会创建新的阴影。由于多个不同的照亮点,周围有很多传输的光线,所以我们可以划出被遮挡位于可见范围之外的区域。”Klinghoffer说。

成功的组合

PlatoNeRF的关键是将多重反射单光子激光雷达与被称为神经辐射场(NeRF)的特殊机器学习模型相结合。NeRF将场景的几何形状编码为神经网络的权重,这使模型具有强大的插值(或估算)能力,能够预测场景的新视图。

Klinghoffer说,当与多重反射激光雷达结合使用时,这种插值能力还可以实现高精度的场景重建。

“最大的挑战是弄清楚如何将它们结合起来。我们必须考量光如何通过多重反射单光子激光雷达传输的物理原理,以及如何通过机器学习对其进行建模。”他说。

他们将PlatoNeRF与两种常见的替代方法进行了比较,一种仅使用单光子激光雷达,另一种仅通过利用一张彩色图像的NeRF。

他们发现,他们的方案优于这两种技术,特别是当激光雷达传感器分辨率较低时。这将使他们的方案在现实世界更实用,因为在商业设备中,低分辨率的传感器更为常见。

“大约15年前,我们的团队发明了第一台能够‘看到’拐角后方的激光雷达,它的工作原理是利用多次光反射或‘光回声’。这些技术使用了特殊的激光器和传感器,并使用了三次光反射。从那时起,激光测距技术变得更加主流,这促使我们研究能够透过雾气的激光雷达。这项新工作仅使用两次光反射,这意味着信噪比非常高,并且3D重建质量很喜人。”研究人员介绍说。

未来,研究人员希望尝试跟踪两次以上的光反射,看看这将如何改善场景重建。此外,他们有兴趣应用更多的深度学习技术,并将PlatoNeRF与彩色图像测量相结合来捕捉纹理信息。

“尽管研究阴影图像作为3D重建的手段已有多年历史,但这项工作利用单光子激光雷达重新审视了这个问题,在重建隐藏几何体的准确性方面获得了显著提高。这项研究展示了巧妙的算法如何与普通传感器(许多人随身携带的iPhone智能手机就包含了激光雷达系统)相结合,进而实现非凡的功能。”多伦多大学计算机科学系助理教授David Lindell说道。

MEMS 中国首家MEMS咨询服务平台——麦姆斯咨询(MEMS Consulting)
评论 (0)
  • 在嵌入式语音系统的开发过程中,广州唯创电子推出的WT588系列语音芯片凭借其优异的音质表现和灵活的编程特性,广泛应用于智能终端、工业控制、消费电子等领域。作为该系列芯片的关键状态指示信号,BUSY引脚的设计处理直接影响着系统交互的可靠性和功能拓展性。本文将从电路原理、应用场景、设计策略三个维度,深入解析BUSY引脚的技术特性及其工程实践要点。一、BUSY引脚工作原理与信号特性1.1 电气参数电平标准:输出3.3V TTL电平(与VDD同源)驱动能力:典型值±8mA(可直接驱动LED)响应延迟:语
    广州唯创电子 2025-03-26 09:26 72浏览
  •       知识产权保护对工程师的双向影响      正向的激励,保护了工程师的创新成果与权益,给企业带来了知识产权方面的收益,企业的创新和发明大都是工程师的劳动成果,他们的职务发明应当受到奖励和保护,是企业发展的重要源泉。专利同时也成了工程师职称评定的指标之一,专利体现了工程师的创新能力,在求职、竞聘技术岗位或参与重大项目时,专利证书能显著增强个人竞争力。专利将工程师的创意转化为受法律保护的“无形资产”,避免技术成果被他人抄袭或无偿使
    广州铁金刚 2025-03-25 11:48 125浏览
  • 人形机器人产业节奏预估:2024年原型机元年,2025年小规模量产元年。当宇树科技H1人形机器人以灵动的手部动作在春晚舞台上演创意融合舞蹈《秧Bot》,舞出"中国智造"时,电视机前十几亿观众第一次深刻意识到:那个需要仰望波士顿动力的时代正在落幕。*图源:宇树科技短短数周后,宇树G1机器人又用一段丝滑的街舞在网络收割亿级播放量,钢铁之躯跳出赛博朋克的浪漫。2月11日,宇树科技在其京东官方旗舰店上架了两款人形机器人产品,型号分别为Unitree H1和G1。2月12日,9.9万元的G1人形机器人首批
    艾迈斯欧司朗 2025-03-22 21:05 134浏览
  • 在智能终端设备开发中,语音芯片与功放电路的配合直接影响音质表现。广州唯创电子的WTN6、WT588F等系列芯片虽功能强大,但若硬件设计不当,可能导致输出声音模糊、杂音明显。本文将以WTN6与WT588F系列为例,解析音质劣化的常见原因及解决方法,帮助开发者实现清晰纯净的语音输出。一、声音不清晰的典型表现与核心原因当语音芯片输出的音频信号存在以下问题时,需针对性排查:背景杂音:持续的“沙沙”声或高频啸叫,通常由信号干扰或滤波不足导致。语音失真:声音断断续续或含混不清,可能与信号幅度不匹配或功放参数
    广州唯创电子 2025-03-25 09:32 66浏览
  • 在智慧城市领域中,当一个智慧路灯项目因信号盲区而被迫增设数百个网关时,当一个传感器网络因入网设备数量爆增而导致系统通信失效时,当一个智慧交通系统因基站故障而导致交通瘫痪时,星型网络拓扑与蜂窝网络拓扑在构建广覆盖与高节点数物联网网络时的局限性便愈发凸显,行业内亟需一种更高效、可靠与稳定的组网技术以满足构建智慧城市海量IoT网络节点的需求。星型网络的无线信号覆盖范围高度依赖网关的部署密度,同时单一网关的承载设备数量有限,难以支撑海量IoT网络节点的城市物联系统;而蜂窝网络的无线信号覆盖范围同样高度依
    华普微HOPERF 2025-03-24 17:00 177浏览
  • 无论你是刚步入职场的新人,还是已经有几年经验的职场老手,培养领导力都是职业发展中一个至关重要的环节。拥有良好的领导能力不仅能让你从人群中脱颖而出,也能让你在团队中成为一个值得信赖、富有影响力的核心成员。什么是领导力?领导力并不仅仅意味着“当老板”或者“发号施令”。它更多地是一种能够影响他人、激发团队潜能,并带领大家实现目标的能力。一位优秀的领导者需要具备清晰的沟通能力、解决问题的能力,以及对人心的深刻理解。他们知道如何激励人心,如何在压力下保持冷静,并能在关键时刻做出正确的决策。如何培养领导力?
    优思学院 2025-03-23 12:24 91浏览
  • 在智能终端设备快速普及的当下,语音交互已成为提升用户体验的关键功能。广州唯创电子推出的WT3000T8语音合成芯片,凭借其卓越的语音处理能力、灵活的控制模式及超低功耗设计,成为工业控制、商业终端、公共服务等领域的理想选择。本文将从技术特性、场景适配及成本优势三方面,解析其如何助力行业智能化转型。一、核心技术优势:精准、稳定、易集成1. 高品质语音输出,适配复杂环境音频性能:支持8kbps~320kbps宽范围比特率,兼容MP3/WAV格式,音质清晰自然,无机械感。大容量存储:内置Flash最大支
    广州唯创电子 2025-03-24 09:08 191浏览
  • WT588F02B是广州唯创电子推出的一款高性能语音芯片,广泛应用于智能家电、安防设备、玩具等领域。然而,在实际开发中,用户可能会遇到烧录失败的问题,导致项目进度受阻。本文将从下载连线、文件容量、线路长度三大核心因素出发,深入分析烧录失败的原因并提供系统化的解决方案。一、检查下载器与芯片的物理连接问题表现烧录时提示"连接超时"或"设备未响应",或烧录进度条卡顿后报错。原因解析接口错位:WT588F02B采用SPI/UART双模通信,若下载器引脚定义与芯片引脚未严格对应(如TXD/RXD交叉错误)
    广州唯创电子 2025-03-26 09:05 74浏览
  • 今年全国两会期间,“体重管理”和“育儿”整体配套政策引发了持久广泛关注。从“吃”到“养”,都围绕着国人最为关心的话题:健康。大家常说“病从口入”,在吃这件事上,过去大家可能更多是为了填饱肚子,如今,消费者从挑选食材到厨电都贯彻着健康的宗旨,吃得少了更要吃得好了。这也意味着在新消费趋势下,谁能抓住众人的心头好,就能带起众人的购买欲望,才能在新一轮竞争中脱颖而出。作为家电行业的风向标,在2025年中国家电及消费电子博览会(AWE)上,这两个话题也被媒体和公众频繁提及。深耕中国厨房三十余年的苏泊尔再次
    华尔街科技眼 2025-03-22 11:42 82浏览
  • 在人工智能与物联网技术蓬勃发展的今天,语音交互已成为智能设备的重要功能。广州唯创电子推出的WT3000T8语音合成芯片凭借其高性能、低功耗和灵活的控制方式,广泛应用于智能家居、工业设备、公共服务终端等领域。本文将从功能特点、调用方法及实际应用场景入手,深入解析这款芯片的核心技术。一、WT3000T8芯片的核心功能WT3000T8是一款基于UART通信的语音合成芯片,支持中文、英文及多语种混合文本的实时合成。其核心优势包括:高兼容性:支持GB2312/GBK/BIG5/UNICODE编码,适应不同
    广州唯创电子 2025-03-24 08:42 156浏览
  • 核心板简介创龙科技 SOM-TL3562 是一款基于瑞芯微 RK3562J/RK3562 处理器设计的四核 ARM C ortex-A53 + 单核 ARM Cortex-M0 全国产工业核心板,主频高达 2.0GHz。核心板 CPU、R OM、RAM、电源、晶振等所有元器件均采用国产工业级方案,国产化率 100%。核心板通过 LCC 邮票孔 + LGA 封装连接方式引出 MAC、GMAC、PCIe 2.1、USB3.0、 CAN、UART、SPI、MIPI CSI、MIPI
    Tronlong 2025-03-24 09:59 181浏览
  •        当今社会已经步入了知识经济的时代,信息大爆炸,新鲜事物层出不穷,科技发展更是一日千里。知识经济时代以知识为核心生产要素,通过创新驱动和人力资本的高效运转推动社会经济发展。知识产权(IP)应运而生,成为了知识经济时代竞争的核心要素,知识产权(Intellectual Property,IP)是指法律赋予人们对‌智力创造成果和商业标识等无形财产‌所享有的专有权利。其核心目的是通过保护创新和创意,激励技术进步、文化繁荣和公平竞争,同时平衡公共利益与
    广州铁金刚 2025-03-24 10:46 68浏览
  • 文/Leon编辑/cc孙聪颖‍“无AI,不家电”的浪潮,正在席卷整个家电行业。中国家电及消费电子博览会(AWE2025)期间,几乎所有的企业,都展出了搭载最新AI大模型的产品,从电视、洗衣机、冰箱等黑白电,到扫地机器人、双足机器人,AI渗透率之高令人惊喜。此番景象,不仅让人思考:AI对于家电的真正意义是什么,具体体现在哪些方面?作为全球家电巨头,海信给出了颇有大智慧的答案:AI化繁为简,将复杂留给技术、把简单还给生活,是海信对于AI 家电的终极答案。在AWE上,海信发布了一系列世俱杯新品,发力家
    华尔街科技眼 2025-03-23 20:46 72浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦