YOLOV8:最新探测物体状态综合指南

YLOLV8是最新的以YOO为基础的物体检测模型,提供最先进的性能。

利用前几部《yolo》,yolov8更快速更准确,同时为训练模式提供统一的框架

  • 物体检测
  • 实例分割
  • 影像分类

到编写本文件时,许多功能还没有被添加到超催化剂YLOLV8存储库中。这包括训练有素的模型的一整套导出特性。此外,超级催化剂将发布一篇关于arxiv与其他最先进的视觉模型相比较的论文。

  • YLOV8建筑和什么是新的在YLOV8?
  • 提供的模型见
  • 如何使用YLov8?
  • YLOLV8目标检测模型的演变
  • 结论

YLOV8建筑和什么是新的在YLOV8?

超催化剂发布了一个全新的YOLOV8存储库。它是作为  训练对象检测、实例分割和图像分类模型的统一框架。
以下是新版本的一些主要特点:

  • 对用户友好的API(命令行+组)。
  • 更快更准确。
  • 支持
    • 物体检测,
    • 实例分割,
    • 影像分类。
  • 可扩展到所有以前的版本。
  • 新的主干网。
  • 新的无锚头。
  • 新的损失函数。

YLOLV8也是高效率和灵活的支持多个导出格式,该模型可以运行在CPU和GPS上。

在架构层面,根据 这个吉塔布问题 :

… C3模块 改为 C2F模块 .
第一次 6×6 Conv 被替换为 3×3 Conv 在…中 脊骨 .
使用脱钩头和删除 物体处 .
第一次 1×1 Conv in Backbone 被替换为 3×3 Conv .
提供的模型见
在YLOLV8模型的每个类别中,有5个模型用于检测、分割和分类。YLOLV8纳米是最快和最小的,而YLOLV8是最准确,也是最慢的。

YLOLV8与下列经过训练的模特捆绑在一起:

  • 对象检测检查站接受了关于可可检测数据集的培训,图像分辨率为640。
  • 实例分割检查站对可可分割数据集进行培训,图像分辨率为640。
  • 图像分类模型预先培训了伊马内特数据集的图像分辨率为224。

让我们来看看使用YLOLV8X检测和实例分割模型的输出。

如何使用YLov8?

要充分利用YLOLV8的潜力,就需要从存储库以及ultralytics 包裹。

要安装需求,我们需要首先克隆存储库。

安装需求

pip install -r requirements.txt

如何使用命令行接口(CLI)使用YLOLV8?

在安装了必要的包后,我们可以使用yolo 指挥官。下面是一个使用yolo 克里。

yolo task=detect \
mode=predict \
model=yolov8n.pt \
source="image.jpg"

task 国旗可以接受三个论点:detect ,classify ,以及segment .同样,这种模式可以是train ,val ,或predict .我们还可以通过模式export 在输出训练有素的模型时。

以下图片显示了所有可能的yolo CLI标志和争论。

如何使用组的API使用YLOLV8?

我们还可以创建一个简单的pygn文件,导入Yloo模块并执行我们选择的任务。

from ultralytics import YOLOmodel = YOLO("yolov8n.pt")  # load a pretrained YOLOv8n modelmodel.train(data="coco128.yaml")  # train the model
model.val()  # evaluate model performance on the validation set
model.predict(source="https://ultralytics.com/images/bus.jpg")  # predict on an image
model.export(format="onnx")  # export the model to ONNX format

例如,上述代码将首先在COCO128数据集上培训YLOLV8纳米模型,在验证集上对其进行评估,并对样本图像进行预测。

我们用这个yolo 使用对象检测、实例分割和图像分类模型进行推理.

使用YLOLV8进行物体检测的推断结果

下面的命令在一个视频上运行检测,使用YLOLV8纳米模型。

yolo task=detect mode=predict model=yolov8n.pt source='input/video_3.mp4' show=True

几乎可以推断 105 FPS on a laptop GTX 1060 GPU .我们得到以下输出。

夹1.用YLOLV8纳米模型进行检测推理 

YLOLV8纳米模型混淆了猫在几个框架中作为狗。让我们在同一视频上使用YLOLV8特大型运行检测,并检查输出。

	
yolo task=detect mode=predict model=yolov8x.pt source='input/video_3.mp4' show=True

 超大型的模型运行在平均17FPS在全球贸易交易1060GPS。

虽然这次的错误分类稍微少了一点,但是模型在一些框架中错误地发现了这个平台。

推断结果,例如使用YLOLV8进行分割

使用YLov8实例分割模型的运行推理同样简单。我们只需要改变task 以及model 名字在上面的命令。

	
yolo task=segment mode=predict model=yolov8x-seg.pt source='input/video_3.mp4' show=True

 由于实例分割与对象检测相耦合,这一次,平均FPS在13左右。

分割图在输出中看起来很清晰。甚至当猫在最后几帧中隐藏在块下时,模型也能够检测和分割它。

用YLOLV8进行图像分类的推断结果

最后,由于YLOLV8已经提供了预先训练的分类模型,让我们使用yolov8x-cls 做模特。这是存储库提供的最大的分类模型。

yolo task=classify mode=predict model=yolov8x-cls.pt source='input/video_3.mp4' show=True

默认情况下,该视频会被模型预测的前5类注释。没有任何后处理的注释直接匹配伊马涅特类名称。

用YLOLV8进行人体姿势估计

最新的YLOLV8系列的模型还包括能够极精确地检测人类关键点的姿态估计模型。您可以使用以下命令在视频上运行人体姿势估计。

	
yolo task=pose mode=predict model=yolov8x-pose.pt source=video.mp4 show=True

 以下是输出类型。夹5.用YLOLV8人体姿势模型进行人体姿势检测。

不仅如此,我们还可以很好地调整YLOLV8的造型 动物键点检测 .

就在此时,与以前的YLOLO模型相比,YLOV8模型的表现似乎要好得多。不仅YOLOV5型,还领先于YOLOV7型和YOLOV6型。 

与其他的YLOO模型相比,YLOO8模型的图像分辨率为640,所有的YOLOV8模型的吞吐量和参数数相似。

现在,让我们详细了解一下最新的YLOLV8型是如何用超级催化剂的YLOLV5型来表现的。下表全面比较了YLOV8和YLOV5。

全面比较

与YLOV5模型比较 

 目标检测比较

YOLOV8与YOLOV5物体探测模型 

实例分割比较

Y洛夫8与Y洛夫5实例分割模型。

 yolov5 和 yolov8实例分割模型

图像分类比较

YOLOV8与YOLOV5图像分类模型。

YOLOV8与YOLOV5图像分类模型

很明显,除了一个分类模型之外,最新的YLOV8模型比YLOV5模型要好得多。

YLOLV8目标检测模型的演变

这是一张图片,显示了约洛目标检测模型的时间线,以及YLov8的演变是如何发生的。

尤洛物体检测模型

所有YLOLO目标检测模型在YLOLV3之前都是使用C编程语言编写的,并使用了黑网框架。新来的人发现很难穿过代码栏,并对模型进行微调。

大约在YOLOV3的同时,超晶石公司发布了第一个使用POOOOO3框架实现的YOLOV3。它也更容易获得和用于转学。

在发表了《YLOLV3》后不久,约瑟夫·雷德蒙就离开了计算机视觉研究界。(由亚历克谢等人。)是最后一个用黑网书写的YLOO模型。在那之后,已经有了很多"约洛"物体的探测。有比例的YLOV4、YOLOX、PP-YLOO、YOLOV6和YOLOV7是其中一些突出的。

在YOLOV3之后,超催化剂也发布了YOLOV5,它比所有其他YOlo模型都更好、更快、更容易使用。

从现在(2023年1月n)起,在 超催化剂 可能是迄今为止最好的yolo模型。

结论

在这篇文章中,我们探讨了约洛模型的最新一期,即yolo8。我们介绍了新的模型,它们的性能,以及随包而来的命令行接口。与此同时,我们也对视频进行推理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/278395.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Trino权威指南(第二版)】Trino的架构、trino架构组件、 trino连接器架构的细节、trino的查询执行模型

文章目录 一. Trino架构1. 架构概览2. 协调器3. 发现服务4. 工作节点 二. 基于连接器的架构三. 查询执行模型1. 解析—>查询计划2. 查询计划 —> 分布式查询计划3. 运行阶段3.1. 基础概念切片:并行单元page 与 exchange算子pipeline切片的driverOperator 3.2.…

python每日学11:xpath的使用与调试

背景:最近在使用selenium 模拟浏览器作一些常规操作,在使用selenium的过程中接触到的一种定位方法,叫xpath, 这里说一下使用心得。 首先,我觉得如果只是简单使用的话是不用详细了解具体的语法规则的。 一、xpath怎么用&#xff1…

【FunASR】Paraformer语音识别-中文-通用-16k-离线-large-onnx

模型亮点 模型文件: damo/speech_paraformer-large-vad-punc_asr_nat-zh-cn-16k-common-vocab8404-pytorchParaformer-large长音频模型集成VAD、ASR、标点与时间戳功能,可直接对时长为数小时音频进行识别,并输出带标点文字与时间戳: ASR模型…

黑豹程序员-axios+springmvc传递数组

问题 奇怪的现象,axios在往后台传递数组时,springmvc竟然接收不到 解决 尝试多次无果,突然看一篇文章写vue中的数组不是真正的数组需要强转转化JSON.stringify 将信将疑下测试了一把,还真的传递成功了。 不光要JSON.stringify…

Nessus漏洞扫描报错:42873 - SSL Medium Strength Cipher Suites Supported (SWEET32)

个人搭建的windows server 2019服务器,被Nessus工具扫描出现三个漏洞,修复比较过程比较坎坷,特记录下 首先:报错信息: 42873 - SSL Medium Strength Cipher Suites Supported (SWEET32) 104743 - TLS Version 1.0 Protocol Detection 157288 - TLS Version 1.1 Protocol …

cgal教程 3D Alpha Wrapping

文章目录 3D Alpha Wrapping (3D alpha 包裹)1 介绍2 方法2.1 算法2.2 保证 3 接口4 选择参数4.1 alpha4.2 Offset4.3 关于“双面”包裹的注意事项 5 性能6 例子 3D Alpha Wrapping (3D alpha 包裹) 原文地址: https://doc.cgal.org/latest/Alpha_wrap_3/index.html#Chapter_3D…

eclipse连接mysql数据库(下载eclipse,下载安装mysql,下载mysql驱动)

前言: 使用版本:eclipse2017,mysql5.7.0,MySQL的jar建议使用最新的,可以避免警告! 1:下载安装:eclipse,mysql在我之前博客中有 http://t.csdnimg.cn/UW5fshttp://t.csdn…

JAVA对文档加密

当 Word 文档中包含无法公开的机密信息时,我们可以对其进行加密,使其在没有密码的情况下无法打开。本文将向您介绍如何使用 Spire.Doc for Java 加密 Word 文档和移除 Word 密码保护。 加密 Word 文档删除 Word 密码保护 安装 Spire.Doc for Java 首先…

C#上位机与欧姆龙PLC的通信01----项目背景

最近,【西门庆】作为项目经理负责一个70万的北京项目,需要在工控系统集成软件开发中和欧 姆龙PLC对接,考虑项目现场情况优先想到了采用FinsTCP通讯协议,接下来就是记录如何一步步实现这些通讯过程的,希望给电气工程师&…

Netty介绍

1. Netty介绍 是一个异步的、基于事件驱动的网络应用框架,用以开发高性能,高可靠性的网络io程序。Netty主要针对在TCP协议下,面向clients端的高并发应用,或者peer-to-peer场景下大量数据持续传输的应用。Netty本质上是一个NIO框架…

数据结构--稀疏矩阵及Java实现

一、稀疏 sparsearray 数组 1、先看一个实际的需求 编写的五子棋程序中,有存盘退出和续上盘的功能。 分析问题: 因为该二维数组的很多值是默认值 0, 因此记录了很多没有意义的数据.->稀疏数组。 2、稀疏数组基本介绍 当一个数组中大部分元素为0…

笔记本电脑如何安装爱快软路由

环境: dell3490 笔记本 装机U盘 问题描述: 笔记本电脑如何安装爱快软路由 解决方案: 1.电脑bios关闭 安全启动 2.下载官网镜像 3.UEFI引导 在PE下面 新建esp分区300M 把系统镜像里面全部文件,提取到这个分区 最后&…