YOLOv5-小知识记录(三)

0. 写在前面

        本篇介绍SPP模块、FPN模块模块,主要也是对YOLOv5的内容的补充:

Yolo系列算法-理论部分-YOLOv4-CSDN博客

Yolo系列算法-理论部分-YOLOv5-CSDN博客

        上一篇:

        YOLOv5-小知识记录(二)-CSDN博客

1. SPP模块

        Spatial Pyramid Pooling,设计该模块的目的是,确保输入全连接层之间的特征向量feature vector是固定尺寸。feature vector 是feature maps的展开,常规的做法是对输入的数据进行剪裁和变形操作,这两种操作可能引发裁剪区域没包含物体的全部或者目标无用,是真严重等问题;而SPP则是将不同feature maps展开为固定尺寸的feature vector。

        工作原理:对每个特征图,使用三种不同尺寸的池化核进行最大池化,分别得到预设的特征尺寸,最后将所有特征图展开为特征向量并融合。

        以经过了5次卷积模块运算后的Tensor[1,256,10,10],运用SPP原理倒推最大池化层信息

        步骤:

  1.  明确全连接层的输入参数尺寸:107521 = 21*256 = 16*256+4*256+1*256;
  2.  明确三种池化后的特征图尺寸,4*4,2*2,1*1;
  3.  求出三种的kernel、stride和padding:
    1. 4*4对应的kernel = 10/4 = 3;stride = 10/3 = 3;padding = [(3*4-10+1)/2] = 1;
    2. 2*2对应的kernel = 10/2 = 5 ; stride =  10/2 = 5;padding = [(5*2 -10 +1)/2] = 0;
    3. 1*1对应的kernel = 10/1 = 10; stride = 10/1 = 10;padding = [(10*1 - 10 +1)/2] =0。

        优点:可以忽略输入尺寸并产生固定长度的输出;利用不同池化核尺寸提取特征的方式可以获得丰富的特征信息,有利于提高网络的识别精度。

2. FPN模块

        Feature pyramid network,在目标检测中加入特征金字塔,提高目标检测的准确率,尤其是在小物体的检测上。

        特征金字塔的高(深)层特征包含丰富的语义信息(利于分类),但分辨率低,很难准确地保存物体的位置信息;低(浅)层特征虽然语义信息较少,但分辨率高,包含准确地物体位置信息(有利于检测和分割)。

        FPN将低层特征和高层特征融合起来,得到一个识别和定位都准确地目标检测结构。

        主要包括:Bottom-up、Top-down和Lateral connection。

        (1)Bottom-up:就是将图片输入到backbone中提取特征的过程

        (2)Top-down:就是将高层得到的feature map进行上采样然后往下传递,将深层包含语义信息传到低层特征上,使低层特征也能包含丰富语义信息;

        (3)Lateral connection:是一个特征融合过程,P1是C1经过1*1卷积后的特征与P2上采样后的特征进行融合(add方式,直接相加,不增加维度)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/576394.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

探索数据库--------------mysql主从复制和读写分离

目录 前言 为什么要主从复制? 主从复制谁复制谁? 数据放在什么地方? 一、mysql支持的复制类型 1.1STATEMENT:基于语句的复制 1.2ROW:基于行的复制 1.3MIXED:混合类型的复制 二、主从复制的工作过程 三个重…

地物波谱库共享网站汇总

ENVI自5.2版本重新梳理了原有的标准波谱库,新增一些物质波谱,在ENVI5.6中存放在…\Harris\ENVI56\ resource\speclib,分别存放在四个文件夹中,储存为ENVI波谱库格式,有两个文件组成:.sli和.hdr。 ENVI保留…

2014年认证杯SPSSPRO杯数学建模B题(第二阶段)位图的处理算法全过程文档及程序

2014年认证杯SPSSPRO杯数学建模 B题 位图的处理算法 原题再现: 图形(或图像)在计算机里主要有两种存储和表示方法。矢量图是使用点、直线或多边形等基于数学方程的几何对象来描述图形,位图则使用像素来描述图像。一般来说&#…

|行业洞察·有色金属|《2000年以来各国黄金储备分析:金砖国家增持一有望持续助推金价中枢抬升》

报告内容的详细解读: 1. 全球央行黄金储备趋势 2011年以来,全球央行持续增加黄金储备,年均增持超过1000吨,成为黄金需求的重要一极。截至2023年,央行黄金储备占比不足5%的国家数量占比达到45%,而美国、德…

AI面试工具:为你的招聘需求选择正确的解决方案

如果你是一名招聘经理,那么考虑到市场上有多种AI面试工具,你完全有理由感到困惑。在这种情况下,人们通常会选择谷歌上排名靠前的单向视频面试工具,这都要归功于SEO。但我们不希望你随波逐流,在投资了数万元的招聘工具后…

day56 动态规划part13

300. 最长递增子序列 中等 给你一个整数数组 nums ,找到其中最长严格递增子序列的长度。 子序列 是由数组派生而来的序列,删除(或不删除)数组中的元素而不改变其余元素的顺序。例如,[3,6,2,7] 是数组 [0,3,1,6,2,2,…

云原生架构(微服务、容器云、DevOps、不可变基础设施、声明式API、Serverless、Service Mesh)

前言 读完本文,你将对云原生下的核心概念微服务、容器云、DevOps、Immutable Infrastructure、Declarative-API、Serverless、Service Mesh 等有一个相对详细的了解,帮助你快速掌握云原生的核心和要点。 因题主资源有限, 这里会选用部分云服务商的组件进…

vant checkbox 复选框 样式改写

修改前 修改后 基于 vant&#xff1a; 4.8.3 unocss: 0.53.4 <van-checkbox-group v-model"query.zczb" shape"square" class"text-16 w-100% flex flex-wrap"><template v-for"item in registerCapitalOption"><v…

git配置SSH 密钥

git配置SSH 密钥 1.window配置ssh1.安装ssh2.安装 Git&#xff08;安装教程参见安装Git&#xff09;并保证版本大于 1.9![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/e59f4e16b83c45649f1d9d7bd6bf92c0.png)3.SSH 尽量保持最新&#xff0c;6.5之前的版本由于使用…

12.路由安装

路由安装 安装vscode https://code.visualstudio.com/ 使用vscode打开后台系统项目 在终端运行npm run dev即可运行项目 src/assets中存放静态资源 src/components中存放组件 app.vue是主界面&#xff08;入口页面&#xff09; 注释main.ts中的import ./style.css package.j…

经纬恒润AUTOSAR产品成功适配芯来RISC-V车规内核

近日&#xff0c;经纬恒润AUTOSAR基础软件产品INTEWORK-EAS&#xff08;ECU AUTOSAR Software&#xff0c;以下简称EAS&#xff09;在芯来提供的HP060开发板上成功适配芯来科技的RISC-V处理器NA内核&#xff0c;双方携手打造了具备灵活、可靠、高性能、强安全性的解决方案。这极…

工业智能网关如何与设备连接?-天拓四方

随着工业4.0时代的来临&#xff0c;智能化、自动化已成为工业生产的标配。在这样的背景下&#xff0c;工业智能网关应运而生&#xff0c;成为连接工业设备、实现数据交互与管理的关键节点。本文将阐述工业智能网关如何与设备连接&#xff0c;旨在为读者提供一套清晰、实用的解决…