【YOLO系列】yolo V1 ,V3,V5,V8 解释

文章目录

  • yolo V1 模型结构图
    • 通道数 的 物理意义是什么?
    • 输出 7×7×30 怎么理解?
    • YOLO v1 损失函数LOSS
  • yolo V3
  • yolo V5
  • yolo V8

视频来源:https://www.bilibili.com/video/BV13K411t7Zs/


AI视频小助理
一、YOLO系列的目标检测算法,其中详细讲解了U6V1的网络结构,包括卷积层、池化层、通道数等基础知识。
00:01 - 介绍YOLO系列的目标检测算法
01:36 - 详细介绍yolo V1的网络结构,包括卷积层和池化层
05:17 - 解释通道数的意思和物理意义,以及卷积神经网络中的卷积核和通道数的关系
二、卷积神经网络的基本概念和结构,以及如何通过网络输出预测图像中的目标检测结果,详细解释了网络中各个参数的意义。
06:15 - 192个卷积核对应192个特征,对应原图表达。
07:18 - 特征图通道数为1024,经过4096全连接后转化为输出形状77×30。
08:22 - 输出结果为774×30的数字向量,每个数字代表原图小格子的预测结果。
三、目标检测模型的预测过程和输出结果,以及该模型的损失函数设计。其中,置信度和类别概率等概念被提及。
12:29 - 每个格子预测两个物体,但大量的预测是背景。
14:29 - 每个格子的置信度代表该位置是物体的概率
17:46 - YOLO的损失函数包含四个加号,其中第一个加号涉及到数学计算。
四、YOLO系列算法中的损失函数,包括中心坐标、宽高等预测结果的调整以及置信度的拟合,最后还介绍了YOLOv3的复杂结构和计算方法。
18:43 - 损失函数中加入中心坐标点,使其越来越准确
19:38 - 损失函数中加入宽高拟合,让预测结果与真实结果越接近越好
23:53 - YOLO v3模型有三个通路,经过卷积、批量归一化和激活函数处理
五、CBL、RESNET等深度学习中的小零件,以及这些零件如何拼接成复杂的结构,从而提取不同尺寸的信息,提高预测效果。
24:56 - CBL、卷积、批量规划、激活函数等深度学习小零件的拼接搭建整个网络结构。
26:40 - 不同尺寸信息提取可以提高预测效果,V3、V5、V8结构设计相似,但V8使用了更新数据进行训练。
28:56 - yolo V5和V8的网络结构复杂,越靠近输入层获取到的特征越细节,越靠上的特征越宏观
–本内容由AI视频小助理生成,关注解锁AI助理,由@Triticale21 召唤发送


yolo V1 模型结构图

在这里插入图片描述

通道数 的 物理意义是什么?

每一个通道 都是 由 1个卷积核 经过卷积运算 获得的输出结果
192个通道 对应 192个卷积核,这192个卷积核在训练过程中彼此独立,参数都是各自更新的,所以这192个卷积核 可以看作是 192个小特征!

输出 7×7×30 怎么理解?

只要物体的中心点落在这个格子内,就交给这个格子 来 预测!

每个格子要 预测两个物体,所以有两份 xywhc,xywhc,c 是置信度,20是类别概率

在这里插入图片描述

YOLO v1 损失函数LOSS

理解 意义
在这里插入图片描述

yolo V3

理解:提取 不同 尺寸 信息,让yolo 适用于 大尺寸的物体 和 小尺寸的 物体

越靠近输入,特征越细节;
越靠近输出,特征越宏观,越具体(高层语义)

在这里插入图片描述

yolo V5

模型 更复杂了,但还是3个分支
在这里插入图片描述

yolo V8

这个输出 是 3分支 检测吗?【有点像 自己任务想的输出了?】
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/312542.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idea 出现Cannot resolve symbol ‘springframework‘解决方法

Maven手动重新加载 1)File–>Invalidate Caches / Restart… 清理缓存,重启idea客户端 2)File–>Maven–>Reload project重新从maven中加载工程依赖的组件

zabbix通过自动发现-配置监控项、触发器(小白教程)

自动发现配置参考链接(不小白,不友好) zabbix-get介绍 1配置 zabbix server:版本7(不影响),IP地址:192.168.0.60zabbix agent:版本agent1(不影响)&#xff…

ES6之Reflect详解

✨ 专栏介绍 在现代Web开发中,JavaScript已经成为了不可或缺的一部分。它不仅可以为网页增加交互性和动态性,还可以在后端开发中使用Node.js构建高效的服务器端应用程序。作为一种灵活且易学的脚本语言,JavaScript具有广泛的应用场景&#x…

LSTM Siamese neural network

本文中的代码在Github仓库或Gitee仓库中可找到。 Hi, 你好。我是茶桁。 大家是否还记得,在「核心基础」课程中,我们讲过CNN以及LSTM。 卷积神经网络(CNN)已经在计算机视觉处理中得到广泛应用,不过,2017年…

对比学习简介

1. 引言 在本教程中,我们将介绍对比学习领域中的相关概念。首先,我们将讨论这种技术背后相关的理论知识;接着,我们将介绍最常见的对比学习的损失函数和常见的训练策略。 闲话少说,我们直接开始吧! 2. 举…

MP4文件中mvhd容器中的“下一个track ID”字段的作用是什么?(下一个轨道id)(新轨道id)

文章目录 mvhd容器中有以下字段其中有个“下一个track ID”字段不知道是干什么用的,它被放在这个mvhd容器的最后“下一个track ID”什么是“下一个track ID”“下一个track ID”的作用唯一性标识轨道管理 “下一个track ID”的必要性命令/代码演示 新轨道ID的含义和…

HarmonyOS4.0系统性深入开发10卡片事件能力说明

卡片事件能力说明 ArkTS卡片中提供了postCardAction()接口用于卡片内部和提供方应用间的交互,当前支持router、message和call三种类型的事件,仅在卡片中可以调用。 接口定义:postCardAction(component: Object, action: Object): void 接口…

ES6之生成器(Generator)

✨ 专栏介绍 在现代Web开发中,JavaScript已经成为了不可或缺的一部分。它不仅可以为网页增加交互性和动态性,还可以在后端开发中使用Node.js构建高效的服务器端应用程序。作为一种灵活且易学的脚本语言,JavaScript具有广泛的应用场景&#x…

穷举vs暴搜vs深搜vs回溯vs剪枝

欢迎来到Cefler的博客😁 🕌博客主页:那个传说中的man的主页 🏠个人专栏:题目解析 🌎推荐文章:题目大解析(3) 目录 👉🏻全排列👉&#…

【ES】es介绍,使用spring-boot-starter-data-elasticsearch整合的ES来进行操作Es

文章目录 倒排索引(Inverted Index)和正排索引(Forward Index)es和MySQL对比IK分词器的总结mapping映射使用springboot整合的ES来进行操作Es1. 实体类中添加注解2. 编写Repository层3. 通过Repository进行增删改查 倒排索引&#…

java零拷贝zero copy MappedByteBuffer

目录 调用操作系统的 mmap 未使用 mmap 的文件通过网络传输的过程 使用 mmap 的文件通过网络传输的过程 使用例子 调用操作系统的 sendfile() 在 java 中的具体实现 mmap的优劣 mmap 的不足 mmap 的优点 mmap 的使用场景 对于零拷贝(zero copy&#xff09…

MCS接口技术----定时/计数,中断

目录 一.中断系统相关寄存器 1.51单片机中断系统的总体结构: 2.中断源的中断级别(由高到低): 3.与中断有关的四个寄存器: (1)TCON---定时控制寄存器 (2)IE---中断允…