yolo笔记

目录

  • 输入端
    • Mosaic数据增强
    • 数据增强Copy-paste
    • 数据增强- MixUp
    • 数据增强- Albumentations
    • 数据增强- Augment HSV (Hue, Saturation, Value)色度、饱和度、浓度
    • 数据增强- Random horizontal flip
    • 自适应锚框计算
    • 自适应图片缩放
  • Backbone
    • Focus结构
    • CSP结构
    • CSP结构
    • Neck
  • 损失函数
    • IOU_Loss
    • GIOU_Loss
    • DIOU_Loss
    • CIOU_loss
  • 训练策略
  • 消除Grid敏感度

在这里插入图片描述

输入端

参考:https://zhuanlan.zhihu.com/p/172121380

Mosaic数据增强

随机的仿射变换
在这里插入图片描述

数据增强Copy-paste

有分割数据集时
在这里插入图片描述

数据增强- MixUp

在这里插入图片描述
按一定的透明程度混合生成一张图片;

数据增强- Albumentations

参考:https://blog.csdn.net/weixin_45942927/article/details/124529291
空域滤波
为图像平滑(去噪声)和图像锐化(突出轮廓)
均值滤波:图像去噪的同时也破坏了图像的细节部分
中值滤波:可以保护图像尖锐的边缘,选择适当的点来替代污染点的值,所以处理效果好,对椒盐噪声表现较好,对高斯噪声表现较差。
在这里插入图片描述

直方图均衡化
可提高图像的对比度
在这里插入图片描述

以及改变图片质量等等

数据增强- Augment HSV (Hue, Saturation, Value)色度、饱和度、浓度

数据增强- Random horizontal flip

随机水平翻转

自适应锚框计算

自适应图片缩放

在这里插入图片描述

Backbone

在这里插入图片描述

Focus结构

在这里插入图片描述
将Focus模块替换成了6x6的普通卷积层。
两者功能相同,但后者效率更高。
在这里插入图片描述
在这里插入图片描述

CSP结构

在这里插入图片描述

CSP结构

在这里插入图片描述

Neck

在这里插入图片描述

损失函数

在这里插入图片描述
在这里插入图片描述
小目标
中等目标
大目标
小型目标更难预测,所以将小型目标的超参设置大一些

参考:https://zhuanlan.zhihu.com/p/143747206

IOU_Loss

在这里插入图片描述
当预测框和目标框不相交时,IOU=0,无法反应两个框距离的远近,此时损失函数不可导,IOU_Loss无法优化两个框不相交的情况。

GIOU_Loss

在这里插入图片描述
在这里插入图片描述

DIOU_Loss

在这里插入图片描述
在这里插入图片描述

CIOU_loss

在这里插入图片描述

训练策略

➢Multi-scale training(0.5~1.5x) 320大小图片会缩放为0.5到1.5倍
➢AutoAnchor(For training custom data)

➢Warmup and Cosine LR scheduler
学习率从一个非常小的值慢慢增长到设置的初始的学习率
用cos的方法去降低学习率

➢EMA(Exponential Moving Average)
将学习率加上一个动量

➢Mixed precision
混合精度训练
➢Evolve hyper- parameters

消除Grid敏感度

在这里插入图片描述
在这里插入图片描述
梯度爆炸
在这里插入图片描述

匹配正样本

在这里插入图片描述
anchor_t最大为4(缩放因子设置为0~4)
在0.25~4的区间内就算匹配成功

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/81137.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用 Feature Flags 与可观测工具实现数据库灰度迁移

场景描述 很多企业会遇到数据库升级、或数据库迁移的情况,尤其是在自建数据库服务向云数据库服务、自建机房向云机房、旧数据库向新数据库迁移等场景。 然而,我们需要在整个移植过程中保证其稳定性、避免数据遗失、服务宕机等情况,最常见的移…

【项目 计网6】 4.17 TCP三次握手 4.18滑动窗口 4.19TCP四次挥手

文章目录 4.17 TCP三次握手4.18滑动窗口4.19TCP四次挥手 4.17 TCP三次握手 TCP 是一种面向连接的单播协议,在发送数据前,通信双方必须在彼此间建立一条连接。所谓的“连接”,其实是客户端和服务器的内存里保存的一份关于对方的信息&#xff…

从其他地方复制的内容无法粘贴到idea中

问题描述 提示:这里描述项目中遇到的问题: 使用 idea 开发的时候,从其他地方复制的内容无法粘贴到 idea中,idea的版本是 2023.2 解决方案: 提示:这里填写该问题的具体解决方案: 网上查找资料…

搭建Tomcat HTTP服务:在Windows上实现外网远程访问的详细配置与设置教程

文章目录 前言1.本地Tomcat网页搭建1.1 Tomcat安装1.2 配置环境变量1.3 环境配置1.4 Tomcat运行测试1.5 Cpolar安装和注册 2.本地网页发布2.1.Cpolar云端设置2.2 Cpolar本地设置 3.公网访问测试4.结语 前言 Tomcat作为一个轻量级的服务器,不仅名字很有趣&#xff0…

vue3——递归组件的使用

该文章是在学习 小满vue3 课程的随堂记录示例均采用 <script setup>&#xff0c;且包含 typescript 的基础用法 一、使用场景 递归组件 的使用场景&#xff0c;如 无限级的菜单 &#xff0c;接下来就用菜单的例子来学习 二、具体使用 先把菜单的基础内容写出来再说 父…

点亮社交新篇章:探索 WeTalk 新增的头像与群聊功能

目录 引言&#xff1a; 引入头像功能&#xff1a; 头像功能的优势&#xff1a; 引入群聊功能&#xff1a; 群聊功能的优势&#xff1a; 引入头像功能&#xff1a; 查看头像&#xff1a; ​编辑 上传头像&#xff1a; 引入群聊功能&#xff1a; 创建群聊&#xff1a…

村口的人家排放污水,污水浸染了整个村子,怎么办

从前有一个很不错的村子里&#xff0c;村子里有很多户人家&#xff0c;随着生活水平越来越好&#xff0c;房子也修起来了&#xff0c;柏油马路也宽敞了&#xff0c;大家进出村子&#xff0c;都要走那条马路&#xff0c;要不就出不去。 目录 1. 修厕所 2. 村口的日家 3. 告诉…

免费虚拟主机,免费域名。新手小白建站保姆级教程【完全免费】

本篇博文将从0开始教小白搭建自己的博客网站 如果是大佬&#xff0c;有自己的服务器&#xff0c;那么可以跳过该篇阅读哈哈哈哈 如果是小白&#xff0c;想自己折腾一下博客&#xff0c;练练手&#xff0c;就可以使用免费的虚拟主机搞一个练练手&#xff0c;后面就可以自己再买个…

C++day4(拷贝赋值函数、匿名对象、友元、常成员函数和常对象、运算符重载)

一、Xmind整理&#xff1a; 二、上课笔记整理&#xff1a; 1.day3作业订正&#xff1a;设计一个Per类&#xff0c;类中包含私有成员&#xff1a;姓名、年龄、指针成员身高... #include <iostream>using namespace std;//封装人 类 class Person { private:string name;…

第3篇:vscode搭建esp32 arduino开发环境

第1篇:Arduino与ESP32开发板的安装方法 第2篇:ESP32 helloword第一个程序示范点亮板载LED 1.下载vscode并安装 https://code.visualstudio.com/ 运行VSCodeUserSetup-x64-1.80.1.exe 2.点击扩展&#xff0c;搜索arduino,并点击安装 3.点击扩展设置&#xff0c;配置arduino…

Elasticsearch 处理地理信息

1、GeoHash ​ GeoHash是一种地理坐标编码系统&#xff0c;可以将地理位置按照一定的规则转换为字符串&#xff0c;以方便对地理位置信息建立空间索引。首先要明确的是&#xff0c;GeoHash代表的不是一个点而是一个区域。GeoHash具有两个显著的特点&#xff1a;一是通过改变 G…

无涯教程-PHP - 常量数组

现在可以使用 define()函数定义数组常量。在PHP 5.6中&#xff0c;只能使用 const 关键字定义它们。 <?php//define a array using define functiondefine(animals, [dog,cat,bird]);print(animals[1]); ?> 它产生以下浏览器输出- cat PHP - 常量数组 - 无涯教程网无…