一本讲解目标检测技术的书

一起学嵌入式 2024-02-06 14:15

扫描关注一起学嵌入式,一起学习,一起成长

Part.1

自动驾驶汽车是怎么“看路”的?

车内无人的自动驾驶出租车,你敢坐吗?
不用担心,北京亦庄的自动驾驶示范区经过了三年的运营,自动驾驶出租车的商业化旅程达到了 960 万公里,其中无人驾驶就有 210 万公里。
事实证明,无人驾驶技术是可以做到安全行驶的。那机器是怎么“看到”路面情况,知道哪儿有红绿灯,或者有行人正穿过斑马线呢?
答案是目标检测技术,这是计算机视觉领域的一项核心技术,用于在图像或视频中定位和识别多个不同类别的目标物体。
它的主要任务是确定图像中目标的位置,并将其与特定的目标类别关联起来。
此外,目标检测还可以用于视频监控、人脸识别、物体识别等领域。所以,自动驾驶车辆安装上目标检测系统,就像拥有了眼睛一样,能够“看见”复杂的路况。
那么目标检测技术会不会很复杂,难以使用?不会,《YOLO 目标检测》这本书就是基于业界流行的目标检测算法框架 YOLO,讲解目标检测领域的基本概念和原理,以及实践方法。
点击下方,即可购书

只要有兴趣,零基础也能看懂这本书。我们先从了解 YOLO 框架开始学习吧。

Part.2

YOLO 框架初探

YOLO(You Only Look Once)是由 Joseph Redmon 等人于 2015年提出的目标检测算法。原始的 YOLO 算法被称为 YOLOv1,它采用了全卷积神经网络(Fully Convolutional Network)来同时预测物体的位置和类别。
YOLOv1 将输入图像分割成网格,并为每个网格预测多个边界以及对应的类别概率,这种单次前向传播的设计使得 YOLOv1 非常快速。然而,YOLOv1 在检测小物体和定位精度上存在一些问题。
为了改进 YOLOv1 的不足,于 2016 年提出了 YOLOv2,对网络结构进行了改进,并引入了一些技术来提高检测性能。随着研究的不断进展,于 2018 年又发布了 YOLOv3。
YOLOv3 在 YOLOv2 的基础上进一步改进,采用了更深更宽的网络结构,引入了多尺度预测和特征融合机制,并使用了更多的 Anchor Boxes 来提高边界的拟合度。
此外,还出现了一些基于 YOLO 的变体和改进版本,例如 YOLOv4、YOLOv5 等,它们在网络结构、训练策略和性能方面进行了进一步的创新和改进。
YOLO 如此热门,但《YOLO 目标检测》的作者杨建华在当初从事研究工作时,却连一本较为系统的、理论与实践相结合讲 YOLO 的入门书都找不到。他边学边总结,积极分享学习成果,于是就有了这本注重实战的 YOLO 入门书。
杨建华目前是哈尔滨工业大学在读博士,主要研究方向是基于视觉的目标检测与人体时空行为分析,活跃在多个知识专栏上。众多 AI 技术爱好者通过杨建华的文章,走进了 YOLO 的世界。
本书另一位作者李瑞峰是哈尔滨工业大学教授、机器人研究所副所长,中国人工智能协会智能机器人专业委员会秘书长,黑龙江省机器人学会理事长。李瑞峰教授也是杨建华的导师,在他的指导下,给本书打下了坚实的理论基础。
现在让我们开始 YOLO 学习之旅。

Part.3

玩转 YOLO 目标检测

《YOLO 目标检测》为同学们规划了一条从入门到进阶的学习路径,分为四个部分介绍了相关背景知识、YOLO 框架入门、较新的 YOLO 技术,以及其他流行的目标检测框架

目标检测技术原理

首先介绍了自深度学习时代以来目标检测的发展,列举了若干经典的目标检测框架,如 R-CNN 系列和 YOLO 系列。然后讲述了目标检测领域当前的两大技术流派:两阶段和单阶段。
目标检测网络的组成
接着介绍了当前流行的目标检测架构,包含主干网络、颈部网络和检测头三大部分。对目标检测领域常用的两大数据集进行了说明:PASCAL VOC 数据集和 MS COCO 数据集。
了解这些数据集的基本情况是入门目标检测领域的基本功之一,有助于读者开展后续工程或学术方面的工作。

YOLO 框架入门

这部分内容是本书重点,先以经典的 YOLOv1 为例讲解技术原理,包括网络结构、检测原理、训练中的标签分配策略、训练模型的策略以及前向推理的细节。
接下来通过对 YOLOv1 的网络结构做适当的改进,着手编写相关的网络结构代码,搭建 YOLOv1 的网络环境。再进一步编写 YOLOv1 的项目代码,主要实现读取数据、预处理数据、搭建模型、实现标签匹配、实现训练和测试代码,以及可视化检测结果等诸多代码实现内容。
YOLOv1 “网格划分”思想的实例
在讲清楚 YOLOv1 的基础上,书中又对 YOLOv2、YOLOv3、YOLOv4 分别做了详细的介绍,说明每一代相较于上一代的技术改进,帮助同学们清晰地理解 YOLO 框架的根本,使大家具备自主学习新一代 YOLO 框架的能力。

较新的 YOLO 框架技术

先介绍新一代的 YOLO 框架,讲解 YOLOX 对 YOLOv3 的改进以及新型的动态标签分配,并实现了一款简单的 YOLOX 检测器。再介绍 YOLOv7 检测框架的技术原理,主要是其所提出的高效网络架构的实现细节,并实现了一款简单的 YOLOv7 检测器。

其他流行的目标检测框架

首先介绍 DETR,它在计算机视觉领域掀起了 Transformer 的研究浪潮。讲解 DETR 的网络结构,并通过讲解相关的开源代码来展现 DETR 的技术细节。
其次介绍新型的单级目标检测网络,讲解 YOLOF 独特的网络结构特点和所提出的标签匹配,并通过代码实现的方式复现 YOLOF。
最后介绍 FCOS 检测器,它掀起了无先验框检测架构研究的浪潮。FCOS 是这一架构的经典之作,也是常用的基线模型。
FCOS网络
同学们认真学习这四个部分后,会发现不仅理解了目标检测的技术原理,还能掌握 YOLO 框架的使用方法,并了解多个主流目标检测框架。

Part.3

结语

YOLO 框架是一种高效、实时性强且适用于多尺度目标检测任务的算法。YOLO 框架在未来的目标检测领域必将发挥重要作用,让机器“看得”更加“清楚”。
《YOLO 目标检测》可以帮助计算机视觉领域的读者快速“看清楚”目标检测技术的原理,并上手实践 YOLO 框架。本书最大的亮点就是注重实战,提供了完整、可复现的开源代码,其中绝大部分代码都是作者亲自编写的。
作者本着严谨治学的态度,保证每一次代码实现环节都对应一份完整的目标检测项目代码,让同学们能够一次又一次地建立起对完整的目标检测项目的认识。
本书翔实地讲解了自 YOLOv1 到 YOLOv4 的发展状况和相关技术细节。这样同学们既可以在宏观上对 YOLO 框架的发展有足够清晰的认识,同时又在微观上了解和掌握相关的技术细节,为日后自学更新的 YOLO 检测器做好知识储备。
本书行文简洁易懂,力求在准确的前提下让同学们迅速掌握技术细节。书中还提供了丰富的图示,有助于同学们直观地理解 YOLO 系列。
书中并没有止步于 YOLO,还介绍了其他流行的目标检测框架,这有助于同学们将从 YOLO 项目中学到的知识横向地泛化到其他检测框架中。同时还能够纵向地摸清、看清目标检测领域的发展趋势,掌握更多的技术概念。
学会 YOLO,同学们就能给机器装上“眼睛”,去探索更广泛的应用吧!

点击下方,即可购书



关注【一起学嵌入式】,回复加群进技术交流群。



觉得文章不错,点击“分享”、“”、“在看” 呗!

一起学嵌入式 公众号【一起学嵌入式】,RTOS、Linux编程、C/C++,以及经验分享、行业资讯、物联网等技术知
评论 (0)
  • 网约车,真的“饱和”了?近日,网约车市场的 “饱和” 话题再度引发热议。多地陆续发布网约车风险预警,提醒从业者谨慎入局,这背后究竟隐藏着怎样的市场现状呢?从数据来看,网约车市场的“过剩”现象已愈发明显。以东莞为例,截至2024年12月底,全市网约车数量超过5.77万辆,考取网约车驾驶员证的人数更是超过13.48万人。随着司机数量的不断攀升,订单量却未能同步增长,导致单车日均接单量和营收双双下降。2024年下半年,东莞网约出租车单车日均订单量约10.5单,而单车日均营收也不容乐
    用户1742991715177 2025-04-29 18:28 170浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 141浏览
  • 一、gao效冷却与控温机制‌1、‌冷媒流动设计‌采用低压液氮(或液氦)通过毛细管路导入蒸发器,蒸汽喷射至样品腔实现快速冷却,冷却效率高(室温至80K约20分钟,至4.2K约30分钟)。通过控温仪动态调节蒸发器加热功率,结合温度传感器(如PT100铂电阻或Cernox磁场不敏感传感器),实现±0.01K的高精度温度稳定性。2、‌宽温区覆盖与扩展性‌标准温区为80K-325K,通过降压选件可将下限延伸至65K(液氮模式)或4K(液氦模式)。可选配475K高温模块,满足材料在ji端温度下的性能测试需求
    锦正茂科技 2025-04-30 13:08 147浏览
  • 文/郭楚妤编辑/cc孙聪颖‍越来越多的企业开始蚕食动力电池市场,行业“去宁王化”态势逐渐明显。随着这种趋势的加强,打开新的市场对于宁德时代而言至关重要。“我们不希望被定义为电池的制造者,而是希望把自己称作新能源产业的开拓者。”4月21日,在宁德时代举行的“超级科技日”发布会上,宁德时代掌门人曾毓群如是说。随着宁德时代核心新品骁遥双核电池的发布,其搭载的“电电增程”技术也走进业界视野。除此之外,经过近3年试水,宁德时代在换电业务上重资加码。曾毓群认为换电是一个重资产、高投入、长周期的产业,涉及的利
    华尔街科技眼 2025-04-28 21:55 121浏览
  • 随着电子元器件的快速发展,导致各种常见的贴片电阻元器件也越来越小,给我们分辨也就变得越来越难,下面就由smt贴片加工厂_安徽英特丽就来告诉大家如何分辨的SMT贴片元器件。先来看看贴片电感和贴片电容的区分:(1)看颜色(黑色)——一般黑色都是贴片电感。贴片电容只有勇于精密设备中的贴片钽电容才是黑色的,其他普通贴片电容基本都不是黑色的。(2)看型号标码——贴片电感以L开头,贴片电容以C开头。从外形是圆形初步判断应为电感,测量两端电阻为零点几欧,则为电感。(3)检测——贴片电感一般阻值小,更没有“充放
    贴片加工小安 2025-04-29 14:59 168浏览
  • 文/Leon编辑/cc孙聪颖‍2023年,厨电行业在相对平稳的市场环境中迎来温和复苏,看似为行业增长积蓄势能。带着对市场向好的预期,2024 年初,老板电器副董事长兼总经理任富佳为企业定下双位数增长目标。然而现实与预期相悖,过去一年,这家老牌厨电企业不仅未能达成业绩目标,曾提出的“三年再造一个老板电器”愿景,也因市场下行压力面临落空风险。作为“企二代”管理者,任富佳在掌舵企业穿越市场周期的过程中,正面临着前所未有的挑战。4月29日,老板电器(002508.SZ)发布了2024年年度报告及2025
    华尔街科技眼 2025-04-30 12:40 150浏览
  • 贞光科技代理品牌紫光国芯的车规级LPDDR4内存正成为智能驾驶舱的核心选择。在汽车电子国产化浪潮中,其产品以宽温域稳定工作能力、优异电磁兼容性和超长使用寿命赢得市场认可。紫光国芯不仅确保供应链安全可控,还提供专业本地技术支持。面向未来,紫光国芯正研发LPDDR5车规级产品,将以更高带宽、更低功耗支持汽车智能化发展。随着智能网联汽车的迅猛发展,智能驾驶舱作为人机交互的核心载体,对处理器和存储器的性能与可靠性提出了更高要求。在汽车电子国产化浪潮中,贞光科技代理品牌紫光国芯的车规级LPDDR4内存凭借
    贞光科技 2025-04-28 16:52 205浏览
  • 你是不是也有在公共场合被偷看手机或笔电的经验呢?科技时代下,不少现代人的各式机密数据都在手机、平板或是笔电等可携式的3C产品上处理,若是经常性地需要在公共场合使用,不管是工作上的机密文件,或是重要的个人信息等,民众都有防窃防盗意识,为了避免他人窥探内容,都会选择使用「防窥保护贴片」,以防止数据外泄。现今市面上「防窥保护贴」、「防窥片」、「屏幕防窥膜」等产品就是这种目的下产物 (以下简称防窥片)!防窥片功能与常见问题解析首先,防窥片最主要的功能就是用来防止他人窥视屏幕上的隐私信息,它是利用百叶窗的
    百佳泰测试实验室 2025-04-30 13:28 186浏览
  • 在智能硬件设备趋向微型化的背景下,语音芯片方案厂商针对小体积设备开发了多款超小型语音芯片方案,其中WTV系列和WT2003H系列凭借其QFN封装设计、高性能与高集成度,成为微型设备语音方案的理想选择。以下从封装特性、功能优势及典型应用场景三个方面进行详细介绍。一、超小体积封装:QFN技术的核心优势WTV系列与WT2003H系列均提供QFN封装(如QFN32,尺寸为4×4mm),这种封装形式具有以下特点:体积紧凑:QFN封装通过减少引脚间距和优化内部结构,显著缩小芯片体积,适用于智能门铃、穿戴设备
    广州唯创电子 2025-04-30 09:02 172浏览
  • 在CAN总线分析软件领域,当CANoe不再是唯一选择时,虹科PCAN-Explorer 6软件成为了一个有竞争力的解决方案。在现代工业控制和汽车领域,CAN总线分析软件的重要性不言而喻。随着技术的进步和市场需求的多样化,单一的解决方案已无法满足所有用户的需求。正是在这样的背景下,虹科PCAN-Explorer 6软件以其独特的模块化设计和灵活的功能扩展,为CAN总线分析领域带来了新的选择和可能性。本文将深入探讨虹科PCAN-Explorer 6软件如何以其创新的模块化插件策略,提供定制化的功能选
    虹科汽车智能互联 2025-04-28 16:00 158浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦