“智能语音指令解析“ 基于NLP与语音识别的关键工单信息提取,

"智能语音指令解析" 基于NLP与语音识别的关键工单信息提取,

    • 1. 背景介绍
      • 1.1 场景痛点
      • 1.2 方案选型
    • 2. 准备开发环境
    • 3. PaddleSpeech 语音识别快速使用
    • 4. PaddleNLP 信息抽取快速使用
    • 5. 语音工单信息抽取核心功能实现
    • 6. 语音工单信息抽取网页应用
      • 6.1 网页前端
      • 6.2 网页后端
      • 6.3 aistudio服务演示
      • 6.4 启动服务
      • 6.5 构造Post请求测试
    • 服务

本文将介绍如何利用 PaddleSpeech 的语音识别技术与 PaddleNLP 的通用信息抽取技术,实现基于智能语音指令解析的关键工单信息提取。我们将通过语音交互的方式,在交通报销场景下实现智能信息抽取,以提高工作效率与质量。

1. 背景介绍

智能语音指令解析集成了语音识别(ASR)与信息抽取(IE)等技术,广泛应用于智能语音填单、语音交互、手机APP语音唤醒等场景,提高人机交互效率。其中,智能语音填单可通过口述记录信息,并利用算法解析口述内容中的关键信息,完成自动信息录入。

1.1 场景痛点

  • 电话分析:边询问边记录,容易遗漏关键信息,例如社区疫情防控信息记录。
  • 工单生成:特定场景下无法完成文字录入,如电力路线巡检工作人员在高空巡检高压电线路。
  • 信息登记:重复性工作效率低易出错,例如汽车售后客服话务员每天接听大量电话。

针对以上场景,利用PaddleSpeech的语音识别技术和PaddleNLP的信息抽取技术,可以自动识别和抽取语音中的关键信息,帮助简化记录流程,提高工作效率和质量。

1.2 方案选型

  • PaddleSpeech语音识别模型:包含多种领先国际水平的语音算法与预训练模型,提供简单易用的语音识别功能。
  • PaddleNLP通用信息抽取模型(UIE):支持实体识别、关系和事件抽取、情感分析等多种信息抽取任务,具有良好的泛化效果。

2. 准备开发环境

安装PaddleSpeech与PaddleNLP:

!pip install paddlespeech
!pip install paddlenlp

下载必要数据包与示例音频,并进行初始化设置。

3. PaddleSpeech 语音识别快速使用

通过PaddleSpeech调用语音识别方法简单易行:

from paddlespeech.cli.asr.infer import ASRExecutor
asr = ASRExecutor()
result = asr(audio_file="ie.wav", force_yes=True)
print(result)

4. PaddleNLP 信息抽取快速使用

利用PaddleNLP提供的信息抽取能力,直接调用Taskflow API进行预测:

from paddlenlp import Taskflowschema = ["时间", "出发地", "目的地", "费用"]
ie = Taskflow("information_extraction", schema=schema, task_path="/home/aistudio/work")ie_result = ie(result)
print(ie_result)

5. 语音工单信息抽取核心功能实现

将语音识别与信息抽取功能进行串联,实现语音工单信息抽取的核心功能模块:

def audio_ie(audio_path):asr_result = asr(audio_file=audio_path, force_yes=True)ie_result = ie(asr_result)return ie_resultaudio_ie("ie.wav")

6. 语音工单信息抽取网页应用

构建网页应用,通过前后端交互实现语音工单信息抽取的服务。

6.1 网页前端

利用Vue框架,结合js-audio-recorder库实现网页前端的录音功能。

6.2 网页后端

利用FastAPI框架搭建后端服务,核心功能为语音信息抽取函数。

6.3 aistudio服务演示

在aistudio中,通过FastAPI搭建网页应用,模拟网页调用语音工单信息提取的后端服务。
在这里插入图片描述

6.4 启动服务

启动FastAPI服务,提供后端服务支持。

6.5 构造Post请求测试

通过requests库构造Post请求,模拟调用语音工单信息提取的后端服务。

通过以上步骤,你可以快速上手使用PaddleSpeech与PaddleNLP实现语音工单信息提取的应用,提高工作效率与质量。

服务

🛠 博主提供一站式解决方案,让您的工作变得更加轻松、高效!以下是我们提供的服务:

  1. 代部署

    🚀 为您提供快速、稳定的部署方案。无论是您的应用程序、网站还是其他软件项目,我们都可以帮助您将其部署到适当的平台上。

  2. 课程设计选题

    📚 为您量身定制符合课程要求和学生需求的选题方案。无论是基础课程还是高级课程,我们都能够为您提供专业的建议和支持。

  3. 线上辅导

    💻 提供线上辅导服务,为您提供个性化的指导和支持,帮助您解决在学习、工作或研究中遇到的各种问题和困难。
    如有需求,请随时私信

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/491881.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

TLS1.2抓包解析

1.TLS1.2记录层消息解析 Transport Layer SecurityTLSv1.2 Record Layer: Handshake Protocol: Client HelloContent Type: Handshake (22)Version: TLS 1.0 (0x0301)Length: 253Content Type:消息类型,1个字节。 i 0Version:协议版本&…

斯坦福大学为机器人操作模仿学习设计了示教新范式

近期斯坦福大学提出了通用操纵界面(UMI)–一种数据收集和策略学习框架,可将人类演示的技能直接转移到可部署的机器人策略中。 https://umi-gripper.github.io/ UMI 采用手持式抓手和精心的界面设计,可为具有挑战性的双臂和动态操…

Unity接入SQLite (一):SQLite介绍

1.简介 SQLite是一个开源的嵌入式关系数据库管理系统。它是一种轻量级的数据库引擎,不需要单独的服务器进程,可以直接嵌入到应用程序中使用。Sqlite使用简单、高效,并且具有对标准SQL的完整支持。它适用于需要在本地存储和访问数据的应用程序…

Windows下用CMake编译VTK及配置测试

作者:翟天保Steven 版权声明:著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处 VTK是什么? VTK(visualization toolkit)是一个开源的免费软件系统,主要用于三维计…

Base64 编码 lua

Base64 编码 -- Base64 字符表 local base64_chars { A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z, a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9,…

C#,动态规划(DP)N皇后问题(N Queen Problem)的回溯(Backtracking)算法与源代码

1 N皇后问题(N Queen Problem) 在N*N的方格棋盘放置了N个皇后,使得它们不相互攻击(即任意2个皇后不允许处在同一排,同一列,也不允许处在与棋盘边框成45角的斜线上。 2 回溯算法 回溯算法实际上一个类似枚…

Linux软件高级编程-进程基本概念--day6

1.进程: 程序: 存放在外存的一段数据组成的文件 进程: 是一个程序动态执行的过程,包括进程的创建、进程的调度、进程的消亡 2.进程相关命令: 1)top: 动态查看当前系统中所有进程信息&#xff08…

(Linux学习一):Mac安装vmWare11.5,centOS 7安装步骤教程

一。下载vmware 官网地址:下载地址 由于我的电脑系统是Mac 10.15.6版本系统,我下载的是VMware Fusion 11.5版本,13是最新版本不支持安装需要系统在11以上。 百度网盘下载地址: VMware Fusion 11 VMware Fusion 12 VMware Fusion 13 下载需要…

万界星空科技商业开源MES

一、万界星空科技商业开源MES系统概述: 万界星空科技免费MES、开源MES、商业开源MES、市面上最好的开源MES、MES源代码、适合二开的开源MES。 1.万界星空开源MES制造执行系统的Java开源版本。 开源mes系统包括系统管理,车间基础数据管理,计…

【管理咨询宝藏资料25】某能源集团五年发展战略报告

本报告首发于公号“管理咨询宝藏”,如需阅读完整版报告内容,请查阅公号“管理咨询宝藏”。 【管理咨询宝藏资料25】某能源集团五年发展战略报告 【关键词】战略规划、五年战略、管理咨询 【文件核心观点】 - LL应以快速做大做强为目标,专注…

五.AV Foundation 视频播放 - 标题和字幕

引言 本篇博客主要介绍使用AV Foundation加载视频资源的时候,如何获取视频标题,获取字幕并让其显示到播放界面。 设置标题 资源标题的元数据内容,我们需要从资源的commonMetadata中获取,在加载AVPlayerItem的时候我们已经指定了…

docker安装mongodb

1.使用docker安装mongo 1.1下载MongoDB镜像 docker pull mongo:4.4 1.2运行MongoDB容器 docker run -itd --name mongo -v /docker_volume/mongodb/data:/data/db -p 27017:27017 mongo:4.4 --auth 2.创建用户 2.1 登录mongo容器,并进入到【admin】数据库 dock…