AI数据质量监控:数据质量的关键KPI都有哪些?

AI所支持的程序或设备成功实施的关键取决于用于训练模型的数据。使用低质量训练数据会导致模型训练不良,从而可能需要额外时间和预算进行重新训练和测试。为防止这种情况,最佳方法是在模型训练过程中实施质量检查。需要注意的是,不同质量度量的目的不尽相同,有些度量更适合各类数据。

这些度量包括:

  • 评分者间可信度——单审和双审、审计
  • F1分数——准确率、召回率
  • 准确性——黄金数据集、测试

数据各不相同,衡量标准也是如此。不同类型的度量适合不同的项目需求。

评分者间可信度

单审是由两名不同的标注者对同一条数据进行标注(一名负责标注,另一名负责确认标注正确性),检查标注是否一致。如果一致,则确定数据标注正确。如果两人标注不一致,则需要再次审核。引入第三名标注者处理这条数据。如果第三名标注者的结果与前两人中的任何一人一致,则认为所标注结果正确。如果标注结果都不一致,则丢弃数据,再次执行此过程。此过程只有两种情况,不是100%一致就是不一致。如果需要,可以允许部分一致。这即为何如果不满足准确性阈值要求,数据质量便不足以训练模型按预期运行的原因所在。

审核员可以结合单审和双审,也可以独自工作。审核员是经验丰富的标注人员,他们能够始终高质量工作,评估已完成标注的数据,检查标注是否正确。审核员还向数据处理人员提供反馈,告知他们错误之处。让多名审核员参与一个项目是明智之举,这样可以审核更多数据,并防止不良数据进入模型。

F1分数

F1分数通常用于分类数据集,它是基于所提供训练数据的模型预测准确性的分数。计算该分数有两个重要度量:召回率和准确率。召回率是指检索到的相关条目的百分数。准确率是指相关的检索项目的百分数。客户发现F1有助于在其数据标注中找到准确率和召回率之间的平衡。如果只追求准确率或召回率,F1并没有什么用。

准确性

基于测试的准确性通过项目前和项目期间所进行的测试予以衡量。预筛选是我们众包团队所经历的流程,旨在确保他们了解如何根据项目需求具体地标注数据。他们需要正确回答一系列问题才可获准工作。在整个项目中还会加试。

另一种测验方法是通过黄金数据集,它们是预标注数据片段,被集成到标注为测验的数据集中。在嵌入的测试由一个人标注后,将会提供准确性分数。如果标注者在任何一种测试方法中均达到一定的分数,则能够继续在项目中工作。这些类型的测试让项目负责人能轻松识别不符合项目需求的标注者,并从正在训练的模型中除去他们以及他们所处理的数据。

获取正确的数据

仅仅确保获得的数据按照项目要求准确标注是不够的;数据还必须对程序或设备有益并且完整。完整的数据涵盖了成功训练模型所需的所有可能用例。

数据获取有四种主要方式:

  • 手动采集
  • 使用技术结合人机协同
  • 使用预标注数据集(PLD)
  • 使用合成数据

如果没有预算或时间限制,手动获取所需的全部数据是个很好的选择。需要加快流程的企业可以使用PLD。我们的网站上有250多种PLD,随时可用。也可以使用混合模型,其中,预标注数据作为起点,然后通过人工处理剩余的数据为模型训练做好准备。

或者,如果数据本质上是敏感的(如医疗和金融行业),则宜使用生成式数据,其中数据值与真人无关。生成式数据称为合成数据,可以创建不含个人身份信息(PII)的数据,是难以实现的边缘案例的理想选择。我们与Mindtech合作,为客户提供这些合成数据解决方案。

高质量数据始于标注者

保证数据高质量的一种基本方法是使用专门的标注人员,他们能够准确标注数据,并严格遵守项目要求。在澳鹏,我们在全球各地拥有超过100万名众包人员。通过我们的托管服务,众包人员通过严格的预筛选标注测试,确保他们能够根据项目要求准确地标注数据。

为确认标注在整个过程中均可正确执行,还需要检查数据质量。数据检查通常通过审核流程进行。这个流程由审核员完成,他们遵循相同的预筛选过程,以证明他们可以合乎项目要求,并防止标注不良的数据被用于训练模型。

主观质量与客观质量

重要的是要注意质量度量并不总是明确的。它们可以分为两类,主观的和客观的。

以下是一些用例示例:

  • 客观用例:分类和细分
  • 主观用例:相关性排名和情绪分析

客观用例通常包含直接的答案。例如询问图像中是否包含炸薯条,或在自行车周围放置边界框。答案的差异在主观用例中很常见。例如,询问一个人他们看到的结果是否与他们搜索的主题相关,或者询问他们正在查看的书面内容是否包含正面信息。对于这些示例,每个人给出的答案都会略有不同,因为世界上没有任何两个人是相同的。这些客观度量收集用户与项目或程序交互时可能如何看待的共识。F1和基于测试的质量度量非常适合处理更客观的数据集,而评分者之间的可信度则优于主观数据集。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/588972.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LVS几种模式介绍

备注:这篇真的是水文,不看也罢。 LVS,linux virtual server,可提供IP网络层的负载均衡。 其主要模式主要有以下几种: LVS-NAT 主要通过网络地址转换,修改目的IP实现。Network Address Translation LVS-…

JS封装网页进入/退出全屏功能,兼容各大主流浏览器

1、演示 2、封装进入全屏函数 mozRequestFullScreen:兼容Firefox webkitRequestFullscreen:兼容 Chrome、Safari、Opera msRequestFullscreen:兼容:IE/Edge const enter () > {const element document.documentElementif (el…

32-数据处理:如何高效处理应用程序产生的数据?

如何更好地进行异步数据处理。 一个大型应用为了后期的排障、运营等,会将一些请求数据保存在存储系统中 。例如:应用将请求日志保存到 Elasticsearch 中,方便排障;网关将 API 请求次数、请求消息体等数据保存在数据库中&#xff…

.net 6 swagger Failed to load API definition

为什么会出现这样的问题? 因为swagger用的是restful 规则同一个路径下面,只有一个Get、Post、Put 如果你控制器下面有多个HttpGet、HttpPost、HttpPut 请求就会报错 正确方式,在控制器上添加路由[Route("api/[controller]/[action]")] 或…

算法练习第四十二天|01背包问题、416. 分割等和子集

一些背包问题 01背包问题 题目描述 小明是一位科学家,他需要参加一场重要的国际科学大会,以展示自己的最新研究成果。他需要带一些研究材料,但是他的行李箱空间有限。这些研究材料包括实验设备、文献资料和实验样本等等,它们各自…

蓝桥杯嵌入式学习笔记(9):RTC程序设计

目录 前言 1. RTC介绍 2. 使用CubeMx进行源工程配置 3. 代码编程 3.1 准备工作 3.2 进行bsp_rtc.h编写 3.3 进行bsp_rtc.c编写 3.4 main.c编写 3.4.1 头文件引用 3.4.2 变量声明 3.4.3 子函数声明 3.4.4 函数实现 3.4.5 main函数编写 4. 代码实验 5. 总结 前言 因本人备赛蓝…

如何使用 Python 本地客户端操作读写云服务器 Redis 缓存数据库详细教程(更新中)

Redis 基本概述 Redis(Remote Dictionary Server)是一个开源的使用 ANSI C 语言编写的、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。它通常被称为数据结构服务器,因为值(value…

Kubernetes(k8s):如何进行 Kubernetes 集群健康检查?

Kubernetes(k8s):如何进行 Kubernetes 集群健康检查? 一、节点健康检查1、使用 kubectl 查看节点状态2、查看节点详细信息3、检查节点资源使用情况 2、Pod 健康检查2.1、 使用 kubectl 查看 Pod 状态2.2、 查看特定 Pod 的详细信息…

2012年认证杯SPSSPRO杯数学建模D题(第一阶段)人机游戏中的数学模型全过程文档及程序

2012年认证杯SPSSPRO杯数学建模 减缓热岛效应 D题 人机游戏中的数学模型 原题再现: 计算机游戏在社会和生活中享有特殊地位。游戏设计者主要考虑易学性、趣味性和界面友好性。趣味性是本质吸引力,使玩游戏者百玩不厌。网络游戏一般考虑如何搭建安全可…

zabbix 7.0 新增功能亮点(一)——T参数

概要: T参数是zabbix7.0新增的一项功能,它支持对配置文件进行可用性验证,即zabbix程序(server/proxy/agent等)修改配置文件后,支持-T或–test-config参数验证配置参数可用性。 T参数主要包含以下三个方面的应用场景: …

解决Centos7无法连接网络和访问网页连接不上问题

一、网络无法连接问题 网络无法连接的问题我查到了一个很良心的操作,不用重装,因为可能是你虚拟机设置上的问题。我先写我的解决方案,再附上其他几种解决方案。 问题一: 虚拟机的问题****加粗样式 解决: (…

ImportError: cannot import name ‘PILLOW_VERSION‘ from ‘PIL‘

原因:torchvision模块在运行时要调用PIL模块的PILLOW_VERSION函数,但PILLOW_VERSION在Pillow 7.0.0之后的版本被移除了,Pillow 7.0.0之后的版本使用__version__函数代替PILLOW_VERSION函数。 解决方法:降低pillow版本即可。 参考…