语音识别数据的采集方法:基本流程数据类型

“人工智能是一种模仿人类功能的产品。数据采集的方法需要针对特定的场景需求。”—–Mark Brayan (澳鹏CEO)

我们一直说,对于一个高质量的人工智能产品离不开高质量的训练数据。对于不同的人工智能我们需要不同的数据对其训练。要采集正确的数据去训练特定的模型才会得到高度精准的人工智能产品,才会解决某些特定的场景问题。 在确定数据采集的方法之前,我们都应该明确我们要解决的AI场景是什么?如果你是需要去做一款智能客服语音系统,你必然需要的是大量的语音数据而不是图像数据。当我们明确了需要的是大量的语音数据后,我们就要去寻找适合语音数据采集的方法。我们是否需要某种特定的工具?我们是否需要特定的培训才会使用这些工具?我们是否需要采集全新的数据还是可以更新一部分现有的数据?当明确了我们的产品最终要服务的目的和现况后,数据采集的方法也会迎刃而解且对症下药。 本期文章中,我们将介绍语音AI场景下适用的数据采集方法和案例。  

语音数据采集的方法

如果你需要一款聊天机器人或者是智能语音系统,你会需要语音数据来训练算法模型。不同的语音产品需要不同程度的,量级的语音数据。语音数据又分为很多不同的类型,常见的类型有语音识别数据(ASR),和语音合成数据(TTS)

采集语音数据的基本流程

  • 找出用户需要说的内容
  • 确定特定领域的语言
  • 从特定领域语言的样本中建立一个 “脚本”
  • 确定受众
  • 记录人类从你的脚本中读出的内容
  • 转写采集的语音数据
  • 建立一个测试集
  • 训练一个语言模型

语音识别数据的分类

语音识别数据可以分为:

  1. 受控:脚本语音数据
  2. 半控制:基于场景的语音数据
  3. 自然:无脚本或对话式语音数据

1. 脚本语音数据 脚本语音识别数据采集通常包括语音命令、唤醒词采集或两者的一种组合形式。参与数据采集的人员通常被要求阅读一组已经设置好的唤醒词或者语音命令语句。比如说:

  • “小爱,请调大音量”
  • “小爱,声音调大点”
  • “小爱,太轻了”

以上是表述同一个意思但不同说法的指令。这类型的数据通常被采集用来观察同一个命令的不同表达方式而不关注采集人员说的具体内容。

智能音响语音数据采集

2. 基于场景的语音数据 基于场景的语音数据是说话人员根据特定场景所说的一组语音命令,用于自然语音采集。采集人员会被要求在指定场景下,说出一系列命令。比如场景是:询问A地图软件如何去陆家嘴。参与者可以说:

  • A,我怎么去陆家嘴
  • A,给我去陆家嘴的导航路线
  • 带我去陆家嘴,A

这类型的数据通常在针对同一场景的不同方式(命令意图)时被进行抽样采集。 3. 无脚本或对话式语音数据 无脚本或对话式语音数据是要求多个人进行对话的“自然”语音采集。采集人员可以坐在一起围绕某一话题进行讨论。比如话题是:建筑。

  • 参与者1: 今年的普里兹克奖你觉得会是哪个建筑师?
  • 参与者2: 我觉得可能是比较冷门的那些吧。
  • 参与者3: 中国的你们觉得有戏吗?
  • 参与者1: 我觉得希望不大,估计还是海外的概率大一点。

这类数据通常被应用于训练AI针对自然会话的多样性,训练聊天机器人等AI系统。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/108017.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【计算机网络】传输层协议——TCP(上)

文章目录 TCPTCP协议段格式报头和有效载荷如何分离?4位首部长度 TCP可靠性确认应答机制的提出序号和确认序号为什么序号和确认序号在不同的字段? 16位窗口大小 6个标志位标志位本质具体标志位PSHRSTURG 超时重传机制 文章目录 TCPTCP协议段格式报头和有效…

解决Java类加载异常:java.lang.ClassNotFoundException

在Java开发过程中,有时会遇到类加载异常,其中之一是java.lang.ClassNotFoundException异常。这个异常通常出现在缺少相关依赖库或配置问题的情况下。本文将介绍如何解决这个问题,并以一个具体案例来说明。 问题描述 在开发过程中&#xff0…

Zabbix监控平台概念

1.概念 Zabbix是一款开源的、免费的、分布式监控平台支持web管理,WEB界面可以方便管理员使用可以监控硬件服务器CPU温度、风扇转速、操作系统CPU、EME、DISK、I/O、流量宽带、负载、端口、进程等Zabbix是C/S架构,Client客户端和Server端组成 2.Zabbix可…

Anaconda下Jupyter Notebook执行OpenCV中cv2.imshow()报错(错误码为1272)网上解法汇总记录和最终处理方式

零、我设备的相关信息 Python 3.8.8Anaconda3 2021.05查询匹配python3.8.*的OpenCV匹配版本为:4.1.* — 4.2.*,我最后安装4.2.0.32版本如下我记录了 “从发现问题,到不断试错,最后解决问题” 的完整过程,以备自己复盘…

C++数据结构X篇_12_树的基本概念和存储

学习二叉树之前先学习树的概念。 文章目录 1. 树的基本概念1.1 树的定义1.2 树的特点1.3 若干术语 2. 树的表示法2.1 图形表示法2.2 广义表表示法 3. 树的存储3.1 双亲表示法:保存父节点关系3.2 孩子表示法3.3 左孩子右兄弟表示法 1. 树的基本概念 之前所学均为线性…

OpenCV(三十四):轮廓外接最大、最小矩形和多边形拟合

目录 1.轮廓外接最大矩形boundingRect() 2.轮廓外接最小矩形minAreaRect() 3.轮廓外接多边形approxPolyDP() 1.轮廓外接最大矩形boundingRect() Rect cv::boundingRect ( InputArray array ) array:输入的灰度图像或者2D点集&#xff0c;数据类型为vector<Point>或者M…

Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement

Self-Polish: Enhance Reasoning in Large Language Models via Problem Refinement 文章链接 核心思想是通过instruction让LLM来优化问题本身&#xff0c;从而达到更好的效果&#xff0c;且这种针对问题的优化可以跟其他的prompt技术&#xff0c;如CoT或者Least-to-Most相结合…

一名IT重装操作系统后的安装环境历程

1、安装JDK&#xff0c;配置环境变量&#xff08;我一般默认安装&#xff0c;避免后期一些不必要的问题&#xff09;。 下载链接 个人安装包可从下方下载&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1XIsjCQ2Y-r1m9H8MBlsILQ?pwd6ekm 提取码&#xff1a;6ekm …

【javaSE】 Lambda表达式与Lambda表达式的使用

文章目录 &#x1f333;Lambda表达式的背景&#x1f6a9;Lambda表达式的语法&#x1f6a9;函数式接口 &#x1f38b;Lambda表达式的基本使用&#x1f384;语法精简 &#x1f332;变量捕获&#x1f6a9;匿名内部类&#x1f6a9;匿名内部类的变量捕获&#x1f6a9;Lambda的变量捕…

Java“牵手”淘宝商品详情数据,淘宝商品详情接口,淘宝API接口申请指南介绍

采集场景 在淘宝首页&#xff08;taobao.com&#xff09;输入关键词搜索&#xff0c;采集搜索后得到的商品列表页数据然后再点击进去即是商品详情页面数据。示例中关键词为【新款连衣裙】&#xff0c;可根据需求进行更换&#xff0c;同时支持自动批量输入多个关键词&#xff0…

Java——》线程间是如何通信的

推荐链接&#xff1a; 总结——》【Java】 总结——》【Mysql】 总结——》【Redis】 总结——》【Kafka】 总结——》【Spring】 总结——》【SpringBoot】 总结——》【MyBatis、MyBatis-Plus】 总结——》【Linux】 总结——》【MongoD…

使用js搭建简易的WebRTC实现视频直播

首先需要一个信令服务器&#xff0c;我们使用nodejs来搭建。两个端&#xff1a;发送端和接收端。我的目录结构如下图&#xff1a;流程 创建一个文件夹 WebRTC-Test。进入文件夹中&#xff0c;新建一个node的文件夹。使用终端并进入node的目录下&#xff0c;使用 npm init 创建p…