yolov5 v7.0转ncnn时问题解决

yolov5 v7.0转ncnn时遇到很多问题,ncnn版本20231027以下仅做记录:

1.通过官方代码,export.py 转onnx,指定–dynamic --simplify参数

2.编译并安装ncnn,通过onnx2ncnn将onnx转化为ncnn.bin和ncnn.param

3.加载ncnn模型(该部分坑很多)

直接加载,构造输入,获取输出,直接挂掉了,经过排查发现问题,如下图:

在这里插入图片描述

  通过节点输出,发现当获取到Slice算子时,输出错误,因此初步判定Slice算子有问题,通过文档查看,发现ncnn中Slice的参数1=3(这里的1是axis),由于ncnn最多支持4维度(忽略掉batch,就只剩3维),因此这里的维度越界了,改为1=2就可以正常运行了。

  修改后接着往下运行,又挂掉了,定位到发现是后边的Concate算子报错了,同样也是维度问题,将0=3改为0=2。

  通过netron观察onnx模型,发现yolov5s 7.0中有三个这样的结构,全部按照上述两个操作更改,如下:

在这里插入图片描述

  运行成功,不会报错了

  然而,ncnn模型输出与onnxruntime推理的模型输出不一致,不仅仅是不一致,里边全是-nan,也就是中间某些层的参数一定是出了问题。

  最开始怀疑是推理模型是的问题,可能是fp32使用int8或fp16推理等,通过文档查看,ncnn推理时默认是使用fp32,而且转模型是默认也是fp32,排除这一想法。

  由于最终模型结构没有问题,那么问题肯定是出在模型参数上了,再次通过各个节点的部分结果与onnxruntime对比,在同样输入时,第一层(Convelution)的结果就不对,肯定是权重或偏置不对。

  于是在ncnn/src/lays/convelution.cpp的load_model中添加输出信息,重新编译安装ncnn,运行代码发现卷积层的weight不对,通过查看ncnn.param文件,发现convelution算子的前边还有6个MemoryData,如下图:

在这里插入图片描述

  查阅文档发现ncnn中参数读取是按照顺序,果然卷积层的错误的权重来自391节点,也就是说MemoryData定义有问题,文档中MemoryData的参数有三个,whc,默认值都是0:
在这里插入图片描述

因此也就是说,ncnn读取权重的时候,MemoryData的大小被误认为是0了,所以就没有读取,直接到Convelution了,所以这里将MemoryData的参数补齐(需要对照Metron的参数维度以及这些节点的使用位置),如下图:

在这里插入图片描述

然后重新运行程序,运行成功,贴一张图展示下:

在这里插入图片描述
  总结一下:

  通过这一波操作下来,发现onnx2ncnn这个工具目前还有很多操作需要完善,单个算子可能没问题,但是多个算子的组合可能就有问题(主要原因是不支持更多维度)。

如果模型转换后遇到模型推理失败:

1.获取节点返回值或输出节点维度,定位到出错节点,然后根据出错节点的参数排查问题

如果推理结果和预期不符:

1.由于ncnn输出的结果都是以ncnn::Mat,因此可以根据各个节点输出与onnxruntime对比,从最开始不一致的节点分析,如果ncnn.param参数没问题,那肯定就是权重问题。

2.切记,不要随意删除有权重信息的中间节点,因为ncnn权重加载是按顺序的,如果含有权重信息的参数被删除,后续的算子参数就是错乱。

如果是算子不支持:

1.通过自定义算子,将代码放在ncnn/src/lays中,重新编译

2.通过自定义算子,在代码运行时注册进去

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/156968.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python进程

进程的定义和常用方法 import os from multiprocessing import Process from time import sleepm 1 list1 []def task1(s, name):global mwhile True:sleep(1)m 1print("进程1", m)list1.append(str(m) "task1")print(list1)print("------------…

Python的网络编程一篇学透,使用Socket打开新世界

目录 1.网络概念 2.网络通信过程 2.1.TCP/IP 2.2.网络协议栈架构 3.TCP/IP介绍 3.1.ip地址 3.2.端口号 3.3.域名 4.Python网络编程 4.1.TCP/IP 4.2.socket的概念 4.3.Socket类型 4.4.Socket函数 4.5.Socket编程思想 5.客户端与服务器 5.1.tcp客户端 6.网络调试…

对比解析php和go对JSON处理的区别

一、go 转化php数组代码 php程序 $str <<<EOF {"操作源":"任意","数据库":"任意","语句类型":"CREATE DATABASE&#xff1b;DROP DATABASE&#xff1b;ALTER DATABASE","影响行数":"不…

stm32 定时器中断

目录 定时器分类 通用定时器框图 时钟源 内部时钟&#xff08;CK_INT&#xff09; 外部时钟模式 1&#xff08; TI1、 TI2&#xff09; 时钟信号输入引脚 滤波器 如果来自外部的时钟信号的频率过高或者混杂有高频干扰信号的话&#xff0c;我们就需要使用滤波器对信号重新…

解决pycharm中,远程服务器上文件找不到的问题

一、问题描述 pycharm中&#xff0c;当我们连接到远程服务器上时。编译器中出现报错问题&#xff1a; cant open file /tmp/OV2IRamaar/test.py: [Errno 2] No such file or directory 第二节是原理解释&#xff0c;第三节是解决方法。 二、原理解释 实际上这是由于我们没有设置…

Debian或Ubuntu静态交叉编译arm和aarch64

Debian或Ubuntu静态交叉编译arm和aarch64 介绍术语ARM架构前置条件从源代码编译一个简单的C程序configure和make交叉编译关于静态链接和依赖关系使用 musl libc 实现与 configure 和 make 进行交叉编译 ARM 正在获得越来越多的关注&#xff0c;并且越来越受欢迎。直接在这些基于…

【广州华锐互动】牛顿运动定律VR虚拟教学软件

在科技日新月异的今天&#xff0c;虚拟现实&#xff08;VR&#xff09;技术已经逐渐渗透到各个领域&#xff0c;为我们带来了前所未有的沉浸式体验。在教育领域&#xff0c;VR技术的应用也日益广泛&#xff0c;尤其是在物理教学中&#xff0c;牛顿运动定律VR虚拟教学软件为学生…

云安全—K8S API Server 未授权访问

0x00 前言 master节点的核心就是api服务&#xff0c;k8s通过REST API来进行控制&#xff0c;在k8s中的一切都可以抽象成api对象&#xff0c;通过api的调用来进行资源调整&#xff0c;分配和操作。 通常情况下k8s的默认api服务是开启在8080端口&#xff0c;如果此接口存在未授…

Variations-of-SFANet-for-Crowd-Counting可视化代码

前文对Variations-of-SFANet-for-Crowd-Counting做了一点基础梳理&#xff0c;链接如下&#xff1a;Variations-of-SFANet-for-Crowd-Counting记录-CSDN博客 本次对其中两个可视化代码进行梳理 1.Visualization_ShanghaiTech.ipynb 不太习惯用jupyter notebook, 这里改成了p…

人工智能AI 全栈体系(十一)

第一章 神经网络是如何实现的 这些神经网络越来越复杂&#xff0c;都是用BP算法求解。网络有些变化就可能需要重新推导&#xff0c;而在实验过程中可能会做很多尝试&#xff0c;这样每次都重新推导BP算法太麻烦了。 十、深度学习框架 现在有了很多深度学习框架&#xff0c;这…

AQS面试题总结

一&#xff1a;线程等待唤醒的实现方法 方式一&#xff1a;使用Object中的wait()方法让线程等待&#xff0c;使用Object中的notify()方法唤醒线程 必须都在synchronized同步代码块内使用&#xff0c;调用wait&#xff0c;notify是锁定的对象&#xff1b; notify必须在wait后执…

QT5交叉编译保姆级教程(arm64、mips64)

什么是交叉编译&#xff1f; 简单说&#xff0c;就是在当前系统平台上&#xff0c;开发编译运行于其它平台的程序。 比如本文硬件环境是x86平台&#xff0c;但是编译出来的程序是在arm64架构、mips64等架构上运行 本文使用的操作系统&#xff1a;统信UOS家庭版22.0 一、安装…