OpenVINO2023异步回调流水线提升推理吞吐率

原创 OpenCV学堂 2023-11-20 23:15

点击上方蓝字关注我们

微信公众号:OpenCV开发者联盟

关注获取更多计算机视觉与深度学习知识

同步模式推理流程

OpenVINO2023版本的SDK支持同步与异步推理模式相比之前OpenVINO2021版本更加的简洁,易用。同时支持创建多个Requst然后基于多个Requst实现流水线方式的推理从而提升CPU推理的吞吐率。同步模式下OpenVINO2023 SDK的推理方式如下:

推理的流程如下:
while(true) {  // capture frame  // populate CURRENT InferRequest  // Infer CURRENT InferRequest  //this call is synchronous  // display CURRENT result}
以YOLOv5s的模型为例,在OpenVINO C++上同步推理的代码实现如下:
// 创建IE插件, 查询支持硬件设备ov::Core core;std::string model_onnx = "D:/python/yolov5-7.0/yolov5s.onnx";auto model = core.read_model(model_onnx);ov::CompiledModel cmodel = core.compile_model(model, "CPU");

// create infer requestauto request = cmodel.create_infer_request();cv::Mat frame;while (true) { bool ret = cap.read(frame); if (frame.empty()) { break; } image_detect(frame, request); char c = cv::waitKey(1); if (c == 27) { // ESC break; }}
其中image_detect方法包含模型的图像前处理、同步推理、后处理。其中同步推理:
// 前处理// 开启同步request.infer();// 后处理
运行结果如下:


异步模式推理流程

当使用OpenVINO2023提供的Request对象的回调功能以后,我们可以把模型的后处理直接放到回调中去,这样异步推理方式就变成只有图像前处理+模型推两个步骤了,然后通过创建两个Request基于流水线方式,实现异步流水线模式推理方式,这个时候推理流程如下:

推理的流程如下:

while(true) {  // capture frame  // populate NEXT InferRequest  // start NEXT InferRequest  // this call is async and returns immediately  // wait for the CURRENT InferRequest  // display CURRENT result  // swap CURRENT and NEXT InferRequests}
首先需要创建两个Request,然后分别设置它们的Callback部分代码,主要是在Callback中完成后处理操作。这部分的代码如下:
 1// 创建IE插件, 查询支持硬件设备
2ov::Core core;
3std::string model_onnx = "D:/python/yolov5-7.0/yolov5s.onnx";
4auto model = core.read_model(model_onnx);
5ov::CompiledModel cmodel = core.compile_model(model, "AUTO");
6
7// create infer request
8auto request = cmodel.create_infer_request();
9auto next_request = cmodel.create_infer_request();
10std::exception_ptr exception_var;
11request.set_callback([&](std::exception_ptr ex) {
12    if (ex) {
13        exception_var = ex;
14        return;
15    }
16    det_boxes.clear();
17    det_ids.clear();
18    ov::Tensor output = request.get_output_tensor();
19    const float* prob = (float*)output.data();
20    const ov::Shape outputDims = output.get_shape();
21    size_t numRows = outputDims[1];
22    size_t numCols = outputDims[2];
23
24    // 后处理, 1x25200x85
25    std::vector boxes;
26    std::vector<int> classIds;
27    std::vector<float> confidences;
28    cv::Mat det_output(numRows, numCols, CV_32F, (float*)prob);
29    for (int i = 0; i < det_output.rows; i++) {
30        float confidence = det_output.at<float>(i, 4);
31        if (confidence < 0.45) {
32            continue;
33        }
34        cv::Mat classes_scores = det_output.row(i).colRange(5, numCols);
35        cv::Point classIdPoint;
36        double score;
37        minMaxLoc(classes_scores, 0, &score, 0, &classIdPoint);
38
39        // 置信度 0~1之间
40        if (score > 0.25)
41        {
42            float cx = det_output.at<float>(i, 0);
43            float cy = det_output.at<float>(i, 1);
44            float ow = det_output.at<float>(i, 2);
45            float oh = det_output.at<float>(i, 3);
46            int x = static_cast<int>((cx - 0.5 * ow) * x_factor);
47            int y = static_cast<int>((cy - 0.5 * oh) * y_factor);
48            int width = static_cast<int>(ow * x_factor);
49            int height = static_cast<int>(oh * y_factor);
50            cv::Rect box;
51            box.x = x;
52            box.y = y;
53            box.width = width;
54            box.height = height;
55
56            boxes.push_back(box);
57            classIds.push_back(classIdPoint.x);
58            confidences.push_back(score);
59        }
60    }
61
62    // NMS
63    std::vector<int> indexes;
64    cv::dnn::NMSBoxes(boxes, confidences, 0.250.45, indexes);
65    for (size_t i = 0; i < indexes.size(); i++) {
66        int index = indexes[i];
67        det_ids.emplace_back(classIds[index]);
68        det_boxes.emplace_back(boxes[index]);
69    }
70});

依据上述的推理流程,最终调用执行的代码如下:
 1cv::Mat frame, next_frame;
2// do first frame
3cap.read(frame);
4async_image_detect(frame, request);
5std::chrono::milliseconds tout{ 50 };
6int cnt = 0;
7while (true) {
8    bool ret = cap.read(next_frame);
9    if (next_frame.empty()) {
10        break;
11    }
12
13    int64 start = cv::getTickCount();
14    // 继续异步
15    if (cnt % 2 == 0) {
16        async_image_detect(next_frame, next_request);
17        request.wait_for(tout);
18    }
19    if (cnt % 2 == 1) {
20        async_image_detect(next_frame, request);
21        next_request.wait_for(tout);
22    }
23    for (size_t t = 0; t < det_boxes.size(); t++) {
24        int idx = det_ids[t];
25        cv::rectangle(frame, det_boxes[t], colors_table[idx % 6], 280);
26        putText(frame, classNames[idx].c_str(), det_boxes[t].tl(), cv::FONT_HERSHEY_PLAIN, 1.0, cv::Scalar(25500), 18);
27    }
28
29    // 计算FPS render it
30    float t = (cv::getTickCount() - start) / static_cast<float>(cv::getTickFrequency());
31    putText(frame, cv::format("FPS: %.2f"1.0 / t), cv::Point(2040), cv::FONT_HERSHEY_PLAIN, 2.0, cv::Scalar(25500), 28);
32    cv::imshow("OpenVINO2023 - YOLOv5 7.0 异步推理", frame);
33    char c = cv::waitKey(1);
34    if (c == 27) { // ESC
35        break;
36    }
37    next_frame.copyTo(frame);
38    cnt++;
39}
40cv::waitKey(0);
41cv::destroyAllWindows();
42return 0;

其中async_image_detect方法中实现了YOLOv5模型推理的图像前处理与启动异步推理模式
preprocess(frame)// 开启异步request.start_async();
最终运行效果如下:

可以看出,帧率比原来轻松提升了大概1.5倍左右。


推荐阅读

YOLOv8修改+注意力模块 训练与部署

普通PC上CPU运行YOLOv5推理 400+FPS

Ubuntu系统下编译OpenCV4.8源码记录

Pytoorch轻松学 – RetinaNet自定义对象检测

基于OpenCV实现精准线线间距测量


扫码查看深度学习系统化学习路线图


OpenCV学堂 专注计算机视觉开发技术分享,技术框架使用,包括OpenCV,Tensorflow,Pytorch教程与案例,相关算法详解,最新CV方向论文,硬核代码干货与代码案例详解!作者在CV工程化方面深度耕耘15年,感谢您的关注!
评论
  • 国际标准IPC 标准:IPC-A-600:规定了印刷电路板制造过程中的质量要求和验收标准,涵盖材料、外观、尺寸、焊接、表面处理等方面。IPC-2221/2222:IPC-2221 提供了用于设计印刷电路板的一般原则和要求,IPC-2222 则针对高可靠性电子产品的设计提供了进一步的指导。IPC-6012:详细定义了刚性基板和柔性基板的要求,包括材料、工艺、尺寸、层次结构、特征等。IPC-4101:定义了印刷电路板的基板材料的物理和电气特性。IPC-7351:提供了元件封装的设计规范,包括封装尺寸
    Jeffreyzhang123 2025-01-02 16:50 198浏览
  • 影像质量应用于多个不同领域,无论是在娱乐、医疗或工业应用中,高质量的影像都是决策的关键基础。清晰的影像不仅能提升观看体验,还能保证关键细节的准确传达,例如:在医学影像中,它对诊断结果有着直接的影响!不仅如此,影像质量还影响了:▶ 压缩技术▶ 存储需求▶ 传输效率随着技术进步,影像质量的标准不断提高,对于研究与开发领域,理解并提升影像质量已成为不可忽视的重要课题。在图像处理的过程中,硬件与软件除了各自扮演着不可或缺的基础角色,有效地协作能够确保图像处理过程既高效又具有优异的质量。软硬件各扮演了什么
    百佳泰测试实验室 2025-01-03 10:39 137浏览
  • 本文继续介绍Linux系统查看硬件配置及常用调试命令,方便开发者快速了解开发板硬件信息及进行相关调试。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。查看系统版本信息查看操作系统版本信息root@ido:/# cat /etc/*releaseDISTRIB_ID=UbuntuDISTRIB_RELEASE=20.04DISTRIB_CODENAME=focalDIS
    Industio_触觉智能 2025-01-03 11:37 138浏览
  • 物联网(IoT)的快速发展彻底改变了从智能家居到工业自动化等各个行业。由于物联网系统需要高效、可靠且紧凑的组件来处理众多传感器、执行器和通信设备,国产固态继电器(SSR)已成为满足中国这些需求的关键解决方案。本文探讨了国产SSR如何满足物联网应用的需求,重点介绍了它们的优势、技术能力以及在现实场景中的应用。了解物联网中的固态继电器固态继电器是一种电子开关设备,它使用半导体而不是机械触点来控制负载。与传统的机械继电器不同,固态继电器具有以下优势:快速切换:确保精确快速的响应,这对于实时物联网系统至
    克里雅半导体科技 2025-01-03 16:11 164浏览
  • 在快速发展的能源领域,发电厂是发电的支柱,效率和安全性至关重要。在这种背景下,国产数字隔离器已成为现代化和优化发电厂运营的重要组成部分。本文探讨了这些设备在提高性能方面的重要性,同时展示了中国在生产可靠且具有成本效益的数字隔离器方面的进步。什么是数字隔离器?数字隔离器充当屏障,在电气上将系统的不同部分隔离开来,同时允许无缝数据传输。在发电厂中,它们保护敏感的控制电路免受高压尖峰的影响,确保准确的信号处理,并在恶劣条件下保持系统完整性。中国国产数字隔离器经历了重大创新,在许多方面达到甚至超过了全球
    克里雅半导体科技 2025-01-03 16:10 121浏览
  • 车身域是指负责管理和控制汽车车身相关功能的一个功能域,在汽车域控系统中起着至关重要的作用。它涵盖了车门、车窗、车灯、雨刮器等各种与车身相关的功能模块。与汽车电子电气架构升级相一致,车身域发展亦可以划分为三个阶段,功能集成愈加丰富:第一阶段为分布式架构:对应BCM车身控制模块,包含灯光、雨刮、门窗等传统车身控制功能。第二阶段为域集中架构:对应BDC/CEM域控制器,在BCM基础上集成网关、PEPS等。第三阶段为SOA理念下的中央集中架构:VIU/ZCU区域控制器,在BDC/CEM基础上集成VCU、
    北汇信息 2025-01-03 16:01 173浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 161浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 155浏览
  • 从无到有:智能手机的早期探索无线电话装置的诞生:1902 年,美国人内森・斯塔布菲尔德在肯塔基州制成了第一个无线电话装置,这是人类对 “手机” 技术最早的探索。第一部移动手机问世:1938 年,美国贝尔实验室为美国军方制成了世界上第一部 “移动” 手机。民用手机的出现:1973 年 4 月 3 日,摩托罗拉工程师马丁・库珀在纽约曼哈顿街头手持世界上第一台民用手机摩托罗拉 DynaTAC 8000X 的原型机,给竞争对手 AT&T 公司的朋友打了一个电话。这款手机重 2 磅,通话时间仅能支持半小时
    Jeffreyzhang123 2025-01-02 16:41 167浏览
  • 【工程师故事】+半年的经历依然忧伤,带着焦虑和绝望  对于一个企业来说,赚钱才是第一位的,对于一个人来说,赚钱也是第一位的。因为企业要活下去,因为个人也要活下去。企业打不了倒闭。个人还是要吃饭的。企业倒闭了,打不了从头再来。个人失业了,面对的不仅是房贷车贷和教育,还有找工作的焦虑。企业说,一个公司倒闭了,说明不了什么,这是正常的一个现象。个人说,一个中年男人失业了,面对的压力太大了,焦虑会摧毁你的一切。企业说,是个公司倒闭了,也不是什么大的问题,只不过是这些公司经营有问题吧。
    curton 2025-01-02 23:08 290浏览
  • Matter加持:新世代串流装置如何改变智能家居体验?随着现在智能家庭快速成长,串流装置(Streaming Device,以下简称Streaming Device)除了提供更卓越的影音体验,越来越多厂商开始推出支持Matter标准的串流产品,使其能作为智能家庭中枢,连结多种智能家电。消费者可以透过Matter的功能执行多样化功能,例如:开关灯、控制窗帘、对讲机开门,以及操作所有支持Matter的智能家电。此外,再搭配语音遥控器与语音助理,打造出一个更加智能、便捷的居家生活。支持Matter协议
    百佳泰测试实验室 2025-01-03 10:29 143浏览
  • 在测试XTS时会遇到修改产品属性、SElinux权限、等一些内容,修改源码再编译很费时。今天为大家介绍一个便捷的方法,让OpenHarmony通过挂载镜像来修改镜像内容!触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,树莓派卡片电脑设计,支持开源鸿蒙OpenHarmony3.2-5.0系统,适合鸿蒙开发入门学习。挂载镜像首先,将要修改内容的镜像传入虚拟机当中,并创建一个要挂载镜像的文件夹,如下图:之后通过挂载命令将system.img镜像挂载到sys
    Industio_触觉智能 2025-01-03 11:39 113浏览
  • 前言近年来,随着汽车工业的快速发展,尤其是新能源汽车与智能汽车领域的崛起,汽车安全标准和认证要求日益严格,应用范围愈加广泛。ISO 26262和ISO 21448作为两个重要的汽车安全标准,它们在“系统安全”中扮演的角色各自不同,但又有一定交集。在智能网联汽车的高级辅助驾驶系统(ADAS)应用中,理解这两个标准的区别及其相互关系,对于保障车辆的安全性至关重要。ISO 26262:汽车功能安全的基石如图2.1所示,ISO 26262对“功能安全”的定义解释为:不存在由于电子/电气系统失效引起的危害
    广电计量 2025-01-02 17:18 218浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦