深度学习（24）——YOLO系列（3）

news/2025/3/13 9:28:36/文章来源:https://blog.csdn.net/qq_43368987/article/details/131269639

深度学习（24）——YOLO系列（3）

文章目录

深度学习（24）——YOLO系列（3）
- 1. BOF(bag of freebies)
- 2. Mosaic data augmentation
- 3. 数据增强
- 4. self-adversarial-training（SAT）
- 5. dropblock
- 6. label smoothing
- 7. 损失函数
- - a. IOU损失
  - b.GIOU
  - c. DIOU
  - d.CIOU
- 8. SPPNet（spatial pyramid pooling）
- 9. CSPNet（cross stage partial network）【更快】
- 10.CBAM & SAM
- 11.YOLO中的attention链接机制
- 12. PAN
- 13. PAN的连接方式
- 14. 激活函数
- 15. 网络结构
- 16.优点

今天YOLOv4理论版

1. BOF(bag of freebies)

只增强训练成本，但是能显著提高精度，但是不影响推理速度
数据增强：调整亮度，对比度，色调，随机缩放…
网络正则化的方法：dropout，dropblock
类别不平衡——>损失函数设计

2. Mosaic data augmentation

参考cutmix，以前就存在，将增强的四张图像拼接在一张进行训练（相当于间接增加batch）

3. 数据增强

random erase：随机遮挡或擦除
hide and seek:根据概率随机隐藏补丁

4. self-adversarial-training（SAT）

在原始图像中增加噪音点干扰

5. dropblock

dropout是随机选择一些点遮住（游戏难度增加不大），dropblock现在遮住一个区域（游戏难度增大）
在这里插入图片描述

6. label smoothing

神经网络最大的缺点，标签绝对，容易过拟合
使用之后，簇内更紧密，簇间更分离

7. 损失函数

a. IOU损失

相同的IOU却反映不出实际情况到底是怎么样的
当交集为0时，没有梯度无法计算（梯度消失）

b.GIOU

在这里插入图片描述

引入最小封闭框C（C可以把A,B包含在内）
在不重叠的情况下可以使预测框尽可能靠近真实框
解决了梯度下降的问题，但是重叠的时候失灵

c. DIOU

在这里插入图片描述

附加项的分子项：预测框与真实框中心点的欧氏距离
附加项的分母项：最小封闭框的对角线长度C
直接优化距离，速度更快，并解决GIOU

d.CIOU

在这里插入图片描述

考虑三个几何因素：
- 重叠面积
- 中心点距离
- 长宽比（v）

8. SPPNet（spatial pyramid pooling）

为了更好满足不同输入大小，训练的时候要改变输入数据的大小
SPP其实就是用最大池化来满足最终输入特征一致即可

9. CSPNet（cross stage partial network）【更快】

在这里插入图片描述

每个block 按照特征图的channel维度拆分成两部分
一份正常走网络，另一份直接concat到这个block的输出

10.CBAM & SAM

在这里插入图片描述

计算量太大！所以在V4中，引入SAM ，没有channel之间的attention，只有spatial空间attention（attention可以让模型更好学习特征）

11.YOLO中的attention链接机制

在这里插入图片描述

12. PAN

FPN是自顶向下的模式，将高层特征传下来，高层逐层向下兼容下层（单向）
缺少底层到高层，PAN登场
引入自底向上的路径，使得底层信息更容易传到顶部
还是一个捷径，红色的可能要走100+层，绿色只需要几层就OK

13. PAN的连接方式

在这里插入图片描述

14. 激活函数

在这里插入图片描述

15. 网络结构

在这里插入图片描述

16.优点

使用单个GPU就可以训练很好
量大核心方法：数据层面+网络层面
消融实验
速度快，性能高！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/2863.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Mysql的SQL性能分析【借助EXPLAIN分析】

Mysql的SQL性能分析【借助EXPLAIN分析】

性能分析要说sql有问题，需要拿出证据，因此需要性能分析 Mysql查询优化器（Mysql Query Optimizer） Mysql中有专门负责优化SELECT语句的优化器模块，主要功能：通过计算分析系统中收集到的统计信息&#xf…

阅读更多...

Spring的存储与获取Bean

Spring的存储与获取Bean

Spring的存储与获取Bean 🔎Spring—存储Bean配置扫描路径利用类注解进行存储添加注解存储Bean关于Id为什么需要五个类注解类注解之间的关系利用方法注解进行存储关于Id 🔎Spring—获取Bean属性注入Set注入构造方法注入总结(Spring的注入方式? 它们之间…

阅读更多...

An unexpected connection driver error occured

An unexpected connection driver error occured

安装下载好rabbitmq，我在springboot整合mq，启动的时候报错了 An unexpected connection driver error occured 后来又报 Failed to check/redeclare auto-delete queue(s). 综合就是连接问题，端口有问题我试过添加账户，提高权限&…

阅读更多...

【架构】领域驱动设计（DDD）的几种典型架构介绍

【架构】领域驱动设计（DDD）的几种典型架构介绍

文章目录前言一、专业术语二、架构演变三、限界上下文四、领域驱动设计的四重边界五、整洁分层架构六、六边形架构七、洋葱架构总结前言我们生活中都听说了DDD，也了解了DDD，那么怎么将一个新项目从头开始按照DDD的过程进行划分与架构设计呢&#xff…

阅读更多...

解决页面等比缩放问题

解决页面等比缩放问题

近些年可视化数据大屏技术早已成熟，在市场上相关技术也是五花八门；通常情况是自行开发，要不找技术比较成熟大厂定制，或者使用较成熟的低代码平台实现。技术门槛比较低，不过在数据大屏项目实施过程中会发现&#xff0c…

阅读更多...

深入理解深度学习——BERT派生模型：BART（Bidirectional and Auto-Regressive Transformers）

深入理解深度学习——BERT派生模型：BART（Bidirectional and Auto-Regressive Transformers）

分类目录：《深入理解深度学习》总目录 UniLM和XLNet都尝试在一定程度上融合BERT的双向编码思想，以及GPT的单向编码思想，同时兼具自编码的语义理解能力和自回归的文本生成能力。由脸书公司提出的BART（Bidirectional and Auto-Regre…

阅读更多...

CDH 之 Hive 中文乱码平定通用法则

CDH 之 Hive 中文乱码平定通用法则

一、乱象 1.1 中文注释乱码 hive> DESCRIBE test; OK # col_name data_type comment id string ??ID ?? pcs string ????? …

阅读更多...

uniapp中uni-popup的用法——实例讲解

uniapp中uni-popup的用法——实例讲解

uni-pop弹出层组件，在应用中弹出一个消息提示窗口、提示框等,可以设置弹出层的位置，是中间、底部、还是顶部。如下图效果所示：白色区域则为弹出的pop层。一、创建一个自定义组件： 1.项目中安装下载uni-pop插件。 2.把pop内容…

阅读更多...

C# wpf 附加属性实现任意控件拖动调整大小

C# wpf 附加属性实现任意控件拖动调整大小

摘自这里 https://blog.csdn.net/u013113678/article/details/121719278 调试效果如下 using System; using System.Collections.Generic; using System.Diagnostics; using System.Linq; using System.Text; using System.Threading.Tasks; using System.Windows; using Syst…

阅读更多...

CISSP证书考试难度大吗？本文教你如何轻松拿下CISSP

CISSP证书考试难度大吗？本文教你如何轻松拿下CISSP

主题：CISSP含金量、CISSP考试经验、CISSP备考、CISSP考试大纲 CISSP含金量高 CISSP注册信息系统安全师认证是信息安全领域被全球广泛认可的IT安全认证，一直以来被誉为业界的“金牌标准”。CISSP认证不仅是对个人信息安全专业知识的客观评估&#xff0c…

阅读更多...

OpenCV 笔记_5

OpenCV 笔记_5

文章目录笔记_5特征点匹配DMatch 存放匹配结果DescriptorMatcher::match 特征点描述子（一对一）匹配DescriptorMatcher::knnMatch 特征点描述子（一对多）匹配DescriptorMatcher::radiusMatch 特征点描述子（一对多&#…

阅读更多...

VS2022编译运行VS2015的项目

VS2022编译运行VS2015的项目

最近新装了VisualStudio2022，有一些VS2015老的项目需要运行，但不想再安装VS2015，就想能否直接在VS2022编译运行，研究一下发现可行，记录一下。 1. 直接升级VS2015项目到2022使用windows sdk 10.0 发现老代码里的一些语…

阅读更多...

推荐文章

最新文章