yolov8学习笔记(一)网络结构

一、yolov8.yaml

YOLOv8详解 【网络结构+代码+实操】:

YOLOv8详解 【网络结构+代码+实操】-CSDN博客文章浏览阅读10w+次,点赞559次,收藏2.9k次。YOLOv8 算法的核心特性和改动可以归结为如下:提供了一个全新的 SOTA 模型,包括 P5 640 和 P6 1280 分辨率的目标检测网络和基于 YOLACT 的实例分割模型。和 YOLOv5 一样,基于缩放系数也提供了 N/S/M/L/X 尺度的不同大小模型,用于满足不同场景需求Backbone骨干网络和 Neck 部分可能参考了 YOLOv7 ELAN 设计思想,将 YOLOv5 的C3结构换成了梯度流更丰富的C2f结构,并对不同尺度模型调整了不同的通道数。_yolov8https://blog.csdn.net/zyw2002/article/details/128732494

YOLOv8源码逐行解读(yolov8.yaml):

YOLOv8源码逐行解读(yolov8.yaml)(更新中)-CSDN博客

yolov8官方文档:

主页 -Ultralytics YOLOv8 文档

yolov8.yaml是一个用于目标检测的模型配置文件,使用了YOLOv8算法。

该文件定义了网络的结构、超参数、输入输出等信息。

nc指定了目标检测任务中要识别的物体类别数,

scales定义了不同规模的模型参数,

backbone定义了模型【主干网络结构】,

head定义了目标检测任务的【头部网络结构】,

最后通过Detect函数输出检测结果。

这个模型可以根据不同的scale参数选择不同大小的模型进行训练和预测。

1、backbone

骨干网络和 Neck 部分可能参考了 YOLOv7 ELAN 设计思想,将 YOLOv5 的 C3 结构换成了梯度流更丰富的 C2f 结构,并对不同尺度模型调整了不同的通道数。

  # [from, repeats, module, args] 

from本层的来源,也就是输入。-1表示将上层的输出作为本层的输入。

repeats本层的重复次数。

module本层的名称。

args本层的参数。

Backbone和Neck的具体变化

a) 第一个卷积层的 kernel 从 6x6 变成了 3x3

b) 所有的 C3 模块换成 C2f,结构如下所示,可以发现多了更多的跳层连接和额外的 Split 操作

(1)特征图(计算公式)

(2)9层操作——卷积、C2f、SPPF

(2)C2f 

去掉了 Neck 模块中的 2 个卷积连接层

 

Bottleneck

YOLOv8的C2F使用了Bottleneck单元,但需要注意的是,Darknet所引入的Bottleneck不同于ResNet的Bottleneck。

此处大家记住一点即可,Bottleneck可以大大减少参数,降低计算量。

(2)SPPF

暂无

2、head

(1)10~21层

(1)22层——detect层

[15, 18, 21]代表将第15、18、21层的输出(分别是80*80*256、40*40*512、20*20*1024)作为本层的输入。

nc是数据集的类别数。

3、scales

4、网络模型解析

(1)Conv

  • 功能: 标准的卷积
  • 参数:输入通道数(c1), 输出通道数(c2), 卷积核大小(k,默认是1), 步长(s,默认是1), 填充(p,默认为None), 组(g, 默认为1), 扩张率(d,默认为1), 是否采用激活函数(act ,默认为True, 且采用SiLU为激活函数)

(1)Loss

Loss 计算过程包括 2 个部分: 正负样本分配策略和 Loss 计算。

笔记下载

https://wwm.lanzout.com/isyZD1p3puyj
密码:hoab

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/492764.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新手如何在视频号中提取视频,看完这2个步骤你就懂了!

视频号已经成为许多用户分享生活、表达自我、获取信息的重要平台。 对于新手来说,理解并掌握如何在视频号中提取视频内容是至关重要的一步,很多人由于不知道平台的规则,导致视频号中不知怎么保存和提取。 本文将详细解析这一过程&#xff0…

TF-IDF,textRank,LSI_LDA 关键词提取

目录 任务 代码 keywordExtract.py TF_IDF.py LSI_LDA.py 结果 任务 用这三种方法提取关键词,代码目录如下, keywordExtract.py 为运行主程序 corpus.txt 为现有数据文档 其他文件,停用词,方法文件 corpus.txt 可以自己…

【IDEA】java 项目启动偶现Kotlin 版本问题 error:Kotlin:module was

一、问题描述: error:Kotlin:module was compiled with an incompatible version of kotlin the binary version of its metadata is二、问题原因: jar包版本冲突 三、解决方式: 1、Rebuild Project(推荐☆) 重新构…

【Vue3】学习watch监视:深入了解Vue3响应式系统的核心功能(下)

💗💗💗欢迎来到我的博客,你将找到有关如何使用技术解决问题的文章,也会找到某个技术的学习路线。无论你是何种职业,我都希望我的博客对你有所帮助。最后不要忘记订阅我的博客以获取最新文章,也欢…

openGauss学习笔记-228 openGauss性能调优-系统调优-LLVM使用建议

文章目录 openGauss学习笔记-228 openGauss性能调优-系统调优-LLVM使用建议 openGauss学习笔记-228 openGauss性能调优-系统调优-LLVM使用建议 目前LLVM在数据库内核侧已默认打开,用户可结合上述的分析进行配置,总体建议如下: 设置合理的wor…

【论文精读】OS-Copilot: Towards Generalist Computer Agents with Self-Improvement

OS-Copilot: Towards Generalist Computer Agents with Self-Improvement 前言ABSTRACT1 INTRODUCTION2 THE OS-COPILOT FRAMEWORK2.1 PLANNER2.2 CONFIGURATOR2.2.1 DECLARATIVE MEMORY2.2.2 PROCEDURAL MEMORY2.2.3 WORKING MEMORY 2.3 ACTOR 3 THE FRIDAY AGENT3.1 A RUNNIN…

深入探索 JS 的提升机制、函数与块作用域以及函数表达式和声明(上)

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

《高考》期刊杂志投稿邮箱知网教育类期刊发表

《高考》杂志是由国家新闻出版总署批准的正规教育类期刊。主要宣传高中新课程改革的专业性,是教育管理工作者、高中一线教师交流经验、探讨问题的重要平台,期刊突出政策性、针对性、指导性,是一本以教育科研成果展示为主,兼具教育…

Sora 提示词每日分享 | 中英文对照

每日分享一个 sora 创意视频提示词之《冲浪者在历史大厅的巨浪中展现技艺》 sora提示词视频 prompt: In an ornate, historical hall, a massive tidal wave peaks and begins to crash. Two surfers, seizing the moment, skillfully navigate the face of the wave. 提示词…

变革中的容器技术

容器化技术的优点 容器化是一种将应用程序和其所需的依赖项,封装在一个可在任何基础架构上一致运行的轻量级可执行文件(即容器)的技术。容器化技术可以大大简化应用程序的部署、管理和维护,提高运维效率和可靠性。 容器化技术有…

如何实现多账户管理?海外代理IP推荐

伴随着互联网的发展,目前越来越多的用户开始拥有不止一个社交媒体或者电商平台等类型的账号,但实际上不论是社交平台还是电商平台对于用户的多账号使用行为都十分的抵制。如果用户不采取任何措施直接长时间进行多账户操作的话,可能会遇到以下…

有那种试卷还原软件吗?分享3款一键还原空白的工具!

在数字化学习的浪潮中,试卷还原软件作为一种新型的学习工具,正逐渐受到广大学生和教育工作者的青睐。这类软件不仅能够帮助我们快速整理、分析试卷,还能通过智能识别技术,将纸质试卷转化为电子文档,极大地提高了学习效…