基于YOLOv8的河道漂浮物实时检测系统【训练和系统源码+Pyside6+数据集+包运行】

✨目录

    • 一、系统概述和展示🎄
      • 1.1 摘要 🎈
    • 二、一站式使用教程🎄
    • 三、YOLOv8原理剖析🎄
      • 3.1 YOLOv8背景和技术原理🎈
    • 四、模型训练、评估和推理🎄
      • 4.1 数据集介绍🎈
      • 4.2 模型训练🎈
      • 4.3 结果评估🎈
      • 4.4 模型推理🎈
    • 五、项目完整目录及获取方式介绍🎄
      • 5.1 项目完整目录🎈
      • 5.2 项目获取方式🎈
      • 5.3 作者介绍🎈

《往期经典回顾》
项目名称项目名称项目名称
1.口罩佩戴检测系统2.人员抽烟检测系统3.火焰烟雾检测系统
4.交通车辆检测系统5.人员跌倒检测系统6. 安全帽检测系统

一、系统概述和展示🎄

1.1 摘要 🎈

   河道漂浮物实时检测系统通过先进的图像处理和人工智能技术,及时探测和清除水面垃圾,以维护水体的生态平衡和环境卫生,有助于防止污染物扩散,确保河流的持续健康和清洁。本文基于YOLOv8算法框架,通过2400张训练图片(其中1920张训练集,480张验证集),训练出一个可用于检测河道漂浮物情况的有效模型。此外,为更好地展示算法效果,基于此模型开发了一款带GUI界面的基于YOLOv8的河道漂浮物实时检测系统,可用于实时检测河道漂浮物情况,以及时告警。该系统是基于Python和Pyside6开发,并支持以下功能特性

  • 系统背景和标题修改
  • 模型权重导入和初始化
  • 检测置信度和IOU调节
  • 检测目标的信息展示
  • 检测用时的统计展示
  • 图片导入、检测、结果展示、导出和结束
  • 视频导入、检测、结果展示、导出和结束
  • 摄像头导入、检测、结果展示、导出和结束
初始化界面

在这里插入图片描述

检测结果界面

在这里插入图片描述

下面将对部分核心功能进行简单展示
1. 更换背景和标题演示
  • 用户可通过点击更换背景,选择想要更换背景的图片,系统便会自动更换壁纸;
  • 用户可通过点击更换标题,然后在文字输入栏中输入想要更换的标题,然后点击确定,即可更改系统标题。

在这里插入图片描述

2. 模型选择和初始化演示
  • 用户可通过点击模型选择,选择想要加载的系统模型;然后点击权重初始化即可完成模型的准备工作。

在这里插入图片描述

3. 图片检测演示
  • 用户可通过点击图片中的选择,选择想要加载的图片文件;然后点击检测,等待弹出图片检测完成的提示框,再点击展示即可将对应的目标框展示在原始图片上,完成展示后,用户可手动点击导出将图片保存到指定位置,最后点击结束关闭图片展示区域。
  • 相关展示信息,如耗时、检测目标数量、位置信息等可在检测信息一栏查看。

在这里插入图片描述

4. 视频和摄像头检测演示
  • 用户可通过点击图片中的选择,选择想要加载的图片文件;然后点击检测,等待弹出图片检测完成的提示框,再点击展示即可将对应的目标框展示在原始图片上,完成展示后,用户可手动点击导出将图片保存到指定位置,最后点击结束关闭图片展示区域。
  • 相关展示信息,如耗时、检测目标数量、位置信息等可在检测信息一栏查看。
  • 对于摄像头检测模块和视频检测模块原理类似。
  • 注意摄像头检测会自动调用电脑摄像头来进行检测任务

在这里插入图片描述


二、一站式使用教程🎄

第一步:安装Anaconda Prompt、Pycharm(或者vscode),参考:anaconda点击 pycharm点击

第二步:创建python环境

conda create -n YOLOv8_My python=3.8.1

第三步:激活环境

conda activate YOLOv8_My

第四步:安装ultralytics和pytorch

pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116 -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install ultralytics==8.1.3 -i https://pypi.tuna.tsinghua.edu.cn/simple

第五步:安装图形化界面库

pip install pyside6==6.6.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

第六步:打开系统界面

python base_camera.py

注意:此环境可同时满足YOLOv8的训练以及系统的运行


三、YOLOv8原理剖析🎄

3.1 YOLOv8背景和技术原理🎈

   权重链接: 点击
   项目地址: 点击
   论文地址:(目前还在火速撰写中)

YOLOv8诞生背景

   YOLOv8是Ultralytics团队基于先前成功的YOLO系列模型推出的最新版本,适用于目标检测、分割、分类任务,以及处理大规模数据集的学习。这个模型不仅能够在多种硬件设备上运行,包括CPU和GPU,而且设计上追求快速、准确且用户友好。YOLOv8引入了一系列创新,包括新的骨干网络、无锚点(Ancher-Free)检测头和损失函数,旨在提升性能和灵活性。此外,该模型支持与早期YOLO版本的兼容,便于用户根据需求切换和比较不同版本。YOLOv8提供了五个不同规模的预训练模型,从n到x,每个模型在参数数量和精度之间取得了不同的平衡,其中较大的模型l和x在减少参数的同时显著提升了精度✅
在这里插入图片描述

YOLOv8技术特点

YOLOv5架构特点

  • Backbone:YOLOv5使用CSPDarknet作为主干网络,它是一种轻量级的Darknet架构,具有更高的速度和更好的性能。
  • PAN/FPN:YOLOv5使用PAN(Path Aggregation Network)来融合不同尺度的特征图,以提高检测性能。
  • Head:YOLOv5的检测头部由多个卷积层组成,用于预测目标的边界框和类别。
  • 样本分配策略:YOLOv5使用IoU阈值来分配正负样本,以平衡正负样本的数量。
  • Loss:包含分类损失(BCEWithLogitsLoss)、定位损失(BCEWithLogitsLoss)、置信度损失(GIOU)。

在这里插入图片描述

YOLOv8架构特点

  • Backbone:
    • 相同:CSP的思想(/梯度分流);并且使用SPPF模块
    • 不同:将C3模块替换为C2f模块
  • PAN/FPN:
    • 相同:PAN的思想
    • 不同:删除了YOLOv5中PAN-FPN上采样的CBS 1*1,将C3模块替换为C2f模块
  • Head:Decoupled head + Anchor-free
  • 样本分配策略:采用了TAL(Task Alignment Learning)动态匹配
  • Loss:
    • 相同:分类损失依然采用 BCE Los
    • 不同:1)舍去物体的置信度损失;2)回归分支loss: CIOU loss+Distribution Focal Loss

在这里插入图片描述

   两者推理过程的区别:在推理过程中,YOLOv5和YOLOv8的主要差异在于coupled head和decoupled head的使用。coupled head是YOLOv5中的一种推理方式,它将Distribution Focal Loss中的积分表示bbox形式进行解码,变成常规的4维度bbox,然后进行后续计算。而decoupled head是YOLOv8中的一种推理方式,它直接使用Distribution Focal Loss中的积分表示bbox形式进行计算,不需要解码过程。

   总结起来,YOLOv5和YOLOv8在架构和推理过程上有一些差异,包括主干网络、特征融合、检测头部、正负样本分配策略和损失函数等方面的差异。其中,在推理过程中,YOLOv5使用coupled head进行bbox解码,而YOLOv8使用decoupled head直接计算积分表示bbox。


四、模型训练、评估和推理🎄

4.1 数据集介绍🎈

   本文使用的是河道漂浮物数据集,通过网络采集并标注成YOLO格式,并对此数据集进行了划分,可直接用于训练。此数据集共包含2400张图片,类别包括[ball(球), grass(野草), bottle(塑料瓶), branch(树枝), milk-box(牛奶盒), plastic-bag(塑料袋), plastic-garbage(塑料垃圾), leaf(落叶)]八类,本文实验使用的训练集1920张,验证集480张。部分数据集及标注可视化信息如下:
在这里插入图片描述
在这里插入图片描述

   图片数据集的存放格式如下,在项目目录中新建datasets目录,同时将YOLO格式数据集images和labels放入指定目录下,然后修改”yolov8\my_file\object_detection\dataset_cfg”下的data.yaml文件中的path路径指向datasets文件夹(绝对路径)。

datasets:
- images- train(此文件夹全是图片)- val(此文件夹全是图片)- labels- train(此文件夹全是txt文件)- val(此文件夹全是txt文件)

4.2 模型训练🎈

   数据准备完成后,通过调用detection_train.py文件进行模型训练,data参数用于加载数据集的配置文件,epochs参数用于调整训练的轮数,workers参数用于调整系统的并发能力,batch参数用于调整训练的批次大小【根据内存大小调整,最小为1】,代码如下:

import os
from ultralytics import YOLO
​
current_path = os.path.dirname(os.path.realpath(__file__))
root_path = os.path.abspath(os.path.join(current_path, "../..")) + "/"# Load a mode
model = YOLO(root_path + 'ultralytics/cfg/models/v8/yolov8s.yaml').load(root_path + 'weights/det/yolov8s.pt') if __name__ == '__main__':results = model.train(data=root_path + 'my_file/object_detection/dataset_cfg/data.yaml', epochs=100, imgsz=416, batch=32, workers=16, lr0=0.01, amp=False, project=root_path+"runs/det")

4.3 结果评估🎈

   在深度学习中,我们通常用损失函数下降的曲线来观察模型训练的情况,避免过拟合和欠拟合现象。YOLOv8训练过程及结果文件保存在runs/det/目录下,我们可以在训练结束后进行查看,结果如下所示:
在这里插入图片描述

本文训练结果如下

在这里插入图片描述

4.4 模型推理🎈

   模型训练结束后,我们可在runs/det/目录下可以得到一个最新且最佳的训练结果模型best.pt文件,在runs/det/train/weights目录下。我们可使用该文件进行后续的推理检测。

在这里插入图片描述

模型推理代码如下
import os
from ultralytics import YOLO
current_path = os.path.dirname(os.path.realpath(__file__))
root_path = os.path.abspath(os.path.join(current_path, "../.."))+"/"
​
​
model = YOLO(root_path + 'runs/det/train/weights/best.pt')  # load a custom trained# Export the modelif __name__ == '__main__':model.predict(root_path + 'ultralytics/assets/test1.jpg', save=True, imgsz=416, conf=0.5)
图片推理结果如下

在这里插入图片描述


五、项目完整目录及获取方式介绍🎄

5.1 项目完整目录🎈

   本文涉及到的完整的程序文件:包括环境配置文档说明(训练和系统环境都适用)、模型训练源码、数据集、系统完整代码、系统UI文件、测试图片视频等,获取方式见文末

模型训练代码如下

在这里插入图片描述

系统完整代码如下

在这里插入图片描述

5.2 项目获取方式🎈

   面包多获取链接:https://mbd.pub/o/bread/ZZ6YlJ5x

5.3 作者介绍🎈

   哈喽大家好, AI应用视界工作室致力于深入探索人工智能算法与应用开发的交互,涵盖目标分类、检测、分割、跟踪、人脸识别等关键领域,以及系统架构的创新设计与实现。我们的目标是为广大人工智能研究者提供一个丰富、权威的参考资源,同时也期待与您共同交流,推动人工智能技术的进步。如有相关算法交流学习和技术需求,请关注下方公众号(或者搜索 AI-designer66)可与我们取得联系。
在这里插入图片描述


在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/616478.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

搭建个人智能家居 4 -WS2812B-RGB灯

搭建个人智能家居 4 - WS2812B-RGB灯 前言说明ESPHomeHomeAssistant 前言 上一篇文章我们已经完成了第一个外设的添加(一个LED灯),今天接着来“壮大”这个系统,添加第二个外设“RGB灯”。 环境搭建可以回顾前面的文章。前文回顾&…

OpenCV轻松入门(六)——简单图片处理【马赛克、毛玻璃、浮雕效果】

马赛克效果 马赛克指现行广为使用的一种图像(视频)处理手段,此手段将影像特定区域的色阶细节劣化并造成色块打乱的效果,因为这种模糊看上去有一个个的小格子组成,便形象的称这种画面为马赛克。其目的通常是使之无法辨…

【vue】跨组件通信--依赖注入

import { provide,inject } from vue provide&#xff1a;将父组件的数据传递给所有子组件&#xff08;子孙都有&#xff09;inject&#xff1a;接收provide 项目文件结构 App.vue是Header.vue的父组件&#xff0c;Header.vue是Nav.vue的父组件 传值过程 App.vue <tem…

从零实现诗词GPT大模型:专栏内容规划

一、前情介绍 本系列文章将从头编写一个类GPT的深度学习模型&#xff0c;并在诗词数据集上进行训练&#xff0c;从而可以进行诗词创作。 本次实现的类GPT模型&#xff0c;可以在kaggle上使用免费GPU进行训练&#xff0c;并可以在自己的电脑上进行推理&#xff0c;整个学习过程…

Visual Studio code无法正常执行Executing task: pnpm run docs:dev

最近尝试调试一个开源的项目&#xff0c;发现cmd可以正常启动&#xff0c;但是在vs中会报错&#xff0c;报错内容如下 Executing task: pnpm run docs:dev pnpm : 无法加载文件 E:\XXXX\pnpm.ps1&#xff0c;因为在此系统上禁止运行脚本。有关详细信息&#xff0c;请参阅 http…

【OTA】STM32新能源汽车OTA技术ymodem协议PC串口升级过程

【OTA】STM32新能源汽车OTA技术ymodem协议PC串口升级过程 文章目录 前言一、实验工具1.串口USB线——烧录APP2生成的BIN文件2.STLINK——烧录BOOT代码和APP1代码3.烧录工具——将BIN文件烧录到单片机中4.FLYMCU——清除芯片FLASH 二、硬件绘制1.原理图2.PCB 三、软件配置1.BOOT…

5.3 mybatis之autoMappingUnknownColumnBehavior作用

文章目录 1. NONE2. WARNING3. FAILING autoMappingUnknownColumnBehavior是< settings >配置下的属性&#xff0c;该属性是指定发现自动映射目标未知列&#xff08;或未知属性类型&#xff09;的行为。就是说当数据库中的字段找不到映射java对象的属性或者与java对象对应…

【Godot4.2】CanvasItem绘图函数全解析 - 6.TextLine和TextParagraph详解

概述 上一节讲述了CanvasItem内置文本绘制函数&#xff0c;以及TextLine和TextParagraph类&#xff0c;绘制单行和多行文本的基础内容。 但是实际上TextLine和TextParagraph类比我们想象的要功能丰富和强大的多。本节就来详细介绍一下。 系列目录 0.概述1.绘制简单图形2.设定…

【微信小程序——案例——本地生活(列表页面)】

案例——本地生活&#xff08;列表页面&#xff09; 九宫格中实现导航跳转——以汽车服务为案例&#xff08;之后可以全部实现页面跳转——现在先实现一个&#xff09; 在app.json中添加新页面 修改之前的九宫格view改为navitage 效果图&#xff1a; 动态设置标题内容—…

linux 部署安装mongodb教程

现在去官网下载mongodb的tar包,在本地创建文件夹 cd /home wget https://fastdl.mongodb.org/linux/mongodb-linux-x86_64-rhel70-4.2.17.tgz tar -zxvf mongodb-linux-x86_64-rhel70-4.2.17.tgz mv mongodb-linux-x86_64-rhel70-4.2.17 mongodb cd /home/mongodb mkdir log t…

计算机服务器中了360后缀勒索病毒怎么办?360后缀勒索病毒解密步骤

网络技术的不断应用与发展&#xff0c;为企业的生产运营提供了极大便利&#xff0c;利用网络可以开展各项工作业务&#xff0c;可以大大提高企业的生产效率&#xff0c;然而&#xff0c;网络是一把双刃剑&#xff0c;在为企业提供便利的同时&#xff0c;也为企业的数据安全带来…

机器学习——自动驾驶

本章我们主要学习以下内容: 阅读自动驾驶论文采集数据根据论文搭建自动驾驶神经网络训练模型在仿真环境中进行自动驾驶 论文介绍 本文参考自2016年英伟达发表的论文《End to End Learning for Self-Driving Cars》 📎end2end.pdf