【深度学习:视频注释】如何为机器学习自动执行视频注释

在这里插入图片描述

【深度学习:视频注释】如何为机器学习自动执行视频注释

    • #1:多目标跟踪 (MOT) 以确保帧与帧之间的连续性
    • #2:使用插值来填补空白
    • #3: 使用微模型加速人工智能辅助视频注释
    • #4: 自动目标分割提高目标分割质量

自动视频标记通过加快手动视频标记的速度和质量,并最终接管大部分视频注释工作,为公司节省了大量时间和金钱。

一旦你开始使用机器学习和基于人工智能的算法进行视频注释–使用大量的标记视频–并确保这些视频被准确标记,这对项目的成功至关重要。在视频注释过程中手动生成标签非常费力、耗时、花费大量资金,并且需要整个团队。

企业和组织经常将这项工作外包以节省成本。然而,这很少能使任务更快,并且经常会导致质量问题。自动视频注释可以解决其中的大部分问题,减少手动输入,节省时间和金钱,并确保您可以在保持质量一致的同时对更大的数据集进行注释和标记。

在这篇文章中,我们将探讨四种自动化视频注释的方法,同时确保标签的质量和一致性

#1:多目标跟踪 (MOT) 以确保帧与帧之间的连续性

自动跟踪对象是一项强大的自动视频注释功能。标记对象后,您需要确保从一帧到下一帧正确且一致地跟踪它,尤其是当它移动并改变方向或速度时。或者,如果背景和光线水平发生变化,例如从白天到黑夜的转变。

不仅如此,如果您标记了多个对象,您还需要一个基于 AI 的视频注释工具,能够跟踪其中的每一个对象。最强大的自动视频标记工具可跟踪注释中的像素从一帧到下一帧。即使您使用自动注释跟踪多个对象,这应该也不是问题。

在通过机器学习自动化工具处理视频时,多对象跟踪特别有用,在分析无人机镜头、监控视频以及医疗保健和制造业领域时,多目标跟踪是一种资产。医疗保健公司通常需要对手术或胃肠病学视频进行注释和分析,而制造商则需要更清晰、带注释的装配线视频。

在这里插入图片描述

在 Encord 中自动跟踪视频注释

#2:使用插值来填补空白

在自动视频注释或标记中,插值是在两个关键帧之间传播标签的行为。假设一个注释团队已经在视频的开头和结尾使用边界框或多边形手动标记了数百个关键帧中的对象。插值可加快注释过程,在未注释的帧中填充细节。

但是,您必须谨慎使用插值,至少在开始视频注释项目时是这样。速度和质量之间总是需要权衡取舍。当然,这取决于所应用标签的质量和模型训练阶段使用的标记剂的复杂性。

例如,应用于从一个帧移动到下一个帧的复杂多面对象的多边形可能不如一个周围有一个移动缓慢的边界框的简单对象那么容易插值。正如注释者所知,这完全取决于视频中从一帧到下一帧的变化程度。

当在视频中的对象上绘制多边形时,由专有算法支持,该算法在没有表示模型的情况下运行,它可以收紧多边形的周长,插值并跟踪移动对象(例如,人)中的各个部分(在本例中为衣服)。

在这里插入图片描述

插值以支持 Encord 中的视频注释

#3: 使用微模型加速人工智能辅助视频注释

在大多数情况下,机器学习 (ML) 模型和基于 AI 的算法需要大量数据才能产生有意义的结果。不仅如此,输入的数据也应该干净且一致。否则,整个项目可能会花费比预期更长的时间,或者不得不重新开始。

自动视频标记和注释很复杂。这种方法也称为模型辅助标记 (MAL) 或 AI 辅助标记 (AAL)。这种类型的标记比注释静态图像或将 ML 应用于庞大的 Excel 电子表格和其他数据源要复杂得多。

相反,微模型是功能强大、范围严格的方法,可以过度拟合数据模型来引导您的视频注释任务。使用微模型训练机器学习算法是一个迭代过程,需要在开始时进行手动注释和标记。但是,您不需要像使用其他视频注释平台那样多的手动工作或花费大量时间来训练模型。

在某些情况下,您可以在最少的五个标记帧上训练微模型。正如我们在另一篇文章中概述的那样,“微模型是特定于注释的模型,它们针对特定任务或特定数据进行了过度训练。

微模型最好应用于狭窄的领域,例如,在整个长视频中自动注释特定对象,并且所需的训练数据很少。训练一个微模型可能需要几分钟,而整个开发周期只需几分钟或几小时。微模型为医疗保健、制造或研究领域的组织节省了大量时间和金钱,尤其是在注释复杂的移动对象时。

#4: 自动目标分割提高目标分割质量

自动分割是在对象周围绘制轮廓,然后使用算法自动“捕捉”到对象的轮廓,使轮廓更紧密,更准确地与从一帧到下一帧跟踪的对象和标签对齐。

注释者可以使用多边形来执行此操作。例如,您可能需要在监控视频中对一个人所穿的衣服进行分割,以便您可以看到嫌疑人何时脱下一件衣服穿上其他衣服。

使用正确的视频注释工具,自动对象分割几乎适用于数十个扇区的任何用例。它适用于任意形状,插值可以跟踪数千帧中的对象段。在大多数情况下,结果是在整个视频注释项目中节省了大量的时间和成本,从而实现更快、更高质量的分割。

在这里插入图片描述

Encord 中的自动对象分割

自动视频注释的强大功能

根据我们的经验,在极少数情况下,自动视频注释在视频注释项目中不能发挥有用的作用。自动化使注释者能够更快、更有效地工作,并提供更高质量的项目输出。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/497839.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unity | 动态读取C#程序集实现热更新

目录 一、动态语言 二、创建C#dll 1.VS中创建一个C#语言的库工程 2.添加UnityEngine.dll的依赖 3.编写代码,生成dll 三、Unity使用dll 一、动态语言 计算机编程语言可以根据它们如何将源代码转换为可以执行的代码来分类为静态语言和动态语言。 静态语言&…

用Flutter开发App:助力您的移动业务腾飞

一、Flutter简介 Flutter是Google推出的用于构建多平台应用程序的开源UI框架。它使用Dart语言编写,可以编译为原生机器代码,从而提供卓越的性能和流畅的用户体验。 二、Flutter的优势 一套代码,多平台部署:Flutter可以使用一套代…

软信天成:一文详解拥有可观测性能力的数据目录

近年来,数据治理和数据可观测性被越来越多的企业广泛采用。现代数据系统为用户提供多项功能和精准服务,允许用户以不同形式自由存储和查询相关数据,但随着功能增加以及系统间快速产生的海量、可变化数据,可能会导致数据漂移、数据…

基于Redo log Undo log的MySQL的崩溃恢复

基于Redo log & Undo log的MySQL的崩溃恢复 Redo log Undo log Redo log 重做日志,记录,修改过的数据 Undo log 回滚日志,记录修改之前的数据 两个我不做详细的介绍了,redo log就是记录哪些地方被修改了 undo log是记录修改之前我们的数据长什么样 更新流程 我们来捋一…

实例:NX二次开发抽取平面以及标准柱面中心线

一、概述 最近体验许多外挂,包括胡波外挂、星空外挂及模圣等都有抽取面的中心线,由于刚刚学习,我尝试看看能不能做出来,本博客代码没有封装函数,代码有待改进,但基本可以实现相应的功能。 二、案例实现的功…

rtthread stm32h743的使用(三)uart串口设备使用

我们要在rtthread studio 开发环境中建立stm32h743xih6芯片的工程。我们使用一块stm32h743及fpga的核心板完成相关实验,核心板如图: 1.建立新工程,选择相应的芯片型号及debug引脚及调试器 2.打开cubemux,设置外部时钟及串口外设…

亚马逊云科技实时 AI 编程助手 Amazon CodeWhisperer,开发快人一步

​ ​ Amazon CodeWhisperer 是一款 AI 编码配套应用程序,可在 IDE 中生成 整行代码和完整的函数代码建议,以帮助您更快地完成更多工作。在本系列 文章中,我们将为您详细介绍 Amazon CodeWhisperer 的相关信息,敬请 关注&#xff…

c++之static的作用

目录 1、C语言 ​2、c(拓展) (1)static修饰成员变量 (I)static修饰变量之后成为静态变量,在编译时就会产生空间; (II)解决思路: a、目标要求: b、原则&am…

基于Java SSM springboot+VUE+redis实现的前后端分类版网上商城项目

基于Java SSM springbootVUEredis实现的前后端分类版网上商城项目 博主介绍:多年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 央顺技术团队 Java毕设项目精品实战案例《500套》 欢迎点赞 收藏 ⭐…

Python实现向量自回归移动平均与外生变量模型(VARMAX算法)项目实战

说明:这是一个机器学习实战项目(附带数据代码文档视频讲解),如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 向量自回归移动平均与外生变量模型(Vector Autoregression Moving Average with Exogenous…

金融行业专题|期货超融合架构转型与场景探索合集(2023版)

更新内容: 更新 SmartX 超融合在期货行业的覆盖范围、部署规模与应用场景。新增 CTP 主席系统实践与评测、容器云资源池等场景实践。更多超融合金融核心生产业务场景实践,欢迎下载阅读电子书《SmartX 金融核心生产业务场景探索文章合集》。 面对不断变…

【机器学习】线性回归模型(Linear Regression)

🌸博主主页:釉色清风🌸文章专栏:机器学习🌸今日语录:温柔的一半是知识,没有知识的涵养撑不起你想要的风骨。 ☘️0文章预览 本系列文章主要是根据吴恩达老师的机器学习课程以及自己的理解整合而成&#xf…