基于语音识别的智能电子病历(一)

引子

A:“上周开年会了!”

俺:“有啥新的动向?”

A:“今年计划开发基于语音识别的智能电子病历。老板说这个算是国内首创!”

俺:“嗯,俺做这个20多年了。”

A:“语言识别 加 AI 的电子病历!”

俺:“明白,俺都做了20多年了,这个的弯弯绕绕、潮起潮落俺都门清。给你说说?”

起初

说起基于语音识别的智能电子病历来,就不得不说一个医疗的小行业“医疗转录”。医疗转录,是指根据医生的口述录音,利用文字处理软件程序对记录医疗过程的档案文件进行信息转录。医疗转录是一个准确并迅速转录口述的医疗报告等资料的过程,包括对历史记录、体检报告、临床诊断、办公笔记、手术报告、会诊记录、出院小结、信件、精神性评估、实验报告、X光报告和病理报告等资料的转录。我们来分析一下医疗转录服务,数据源头来自医生的语音,最终的结果是电子病历的内容,这不就是基于语音识别的智能电子病历的一个业务实现吗?

医疗转录是如何形成一个小行业的?

这个要从美国的医生开始说起。美国医生的地位非常高,成为一个外科医生,大学最短也要读11年,拿到博士学位,之后还有再读几年医科。俺刚参加工作时,有一次在文字中称呼医生为Doctor,同事指出了俺的错误,应该称呼对方为M.D.(Medicinae Doctor) ,称呼对方为Doctor,是一种不尊重。那么,让一个读了11年大学,学费都超过70万美元的外科医生,一个字母一个字母的录入电子病历,是一件很浪费的事情。于是,有了精细化的分工 ,医疗转录服务 来了最初的时候医生是通过录音磁带或者电话,把语音发给医疗转录服务公司。然后这些公司就根据这些语音生成电子病历的内容。

时间来到了1996年,俺当初工作过那就公司诞生了。这是一家提供医疗转录服务 的公司。2017年拿过全美医疗转录质量评比的第一名。拿过NIST的4次认证。2019年被M*Modal 收购。

时间到了2000-07-15,俺入职了。

概述

系统构成

如果说基于语音识别的智能电子病历是一种思路,那么医疗转录服务就是这个思路的具体实现。我我们先从语音说起,在实际的业务中,一般分2两种业务模式。

  • 整体录音(下图的Full Dictation部分),这种方式每个语音文件包含一个或者多个报告,时长也比较长,3到8分钟长的语音比较多。最终产生的也是一个或者多个医疗报告
  • 局部录音(下图的Partial Dictation部分),这种方式一般是和结构化的电子病历一起使用。语音的内容是电子病历中的一段或者一部分。

医生是如何使用的呢?

整体录音(Full Dictation),通常有有些几种方式接入

  • 医院或者医生通过接口或者网站上传语音文件
  • 医生使用电话进行录音,医生拨打电话进行录音。有T1线路+语音卡,也有网络电话的接入。
  • 医生使用手机APP进行录音。例如这个是2009年发布IOS的APP,android下的APP的界面类似。

         

  • 医生在电脑上访问网站或者使用应用软件进行录音。

局部录音(Partial Dictation),一般是和结构化电子病历或者HIS 做对接。

病人的相关数据也需要和医院对接。这个我们自己开发了一个平台用于和医院对接数据。

上面说的2部分,在下面的图上就是最左边的 Input 和 Dictation

数据的来源处理好后,就进入了WMS(Workflow Management System)部分。这部分是核心,包含的东西特别多。从功能上来说有这么几部分:

  • 医疗行业的特定人群的语音识别
  • 富文本报告编辑器
  • 结构化电子病历(CDA)编辑器
  • 和编辑器互联并支持3键脚踏板的语音播放器
  • 医疗行业的语义分析
  • 整合医疗数据的输入法
  • 语音识别的自动再训练
  • 语义分析的自动再训练
  • 基于医疗知识的拼写检查和内容检查
  • 多级质检系统
  • 报告系统

每个部分其实都有很多可以讲的东西,以后再说。

生成好的报告或者电子病历,有时还要进行电子签名。电子签名的技术简单,就是业务复杂。电子签名一般 Dictator 、Attend 、Ordering 、Referring 、PCP、 DictatorFor  等多个角色 。每个角色都有可能有替代医生。签名规则也比较多 。有些医院的某些报告需要多个角色的合签。有的合签还规定了不同的角色签名的前后顺序。之前做过一次梳理,业务上 240多种不同的业务分支。

最后一步就是把数据送回医院,除了和医院的系统对接之外(每个医院都有不同的接口方式)。还有其他Email 、传真、打印、发布到APP 等方式。传真在国内用的不多,但是在美国还是有很多地方在用。

运营模式

实施一般不收费,公司是根据服务量收费,古早的时候 一般每行是6-8美分。有些复杂的甚至能谈到1毛。现在随着语音识别和AI的运用,价格已经降低了到了4-6美分。这个还分本土服务和国际服务。

  • 本土服务:数据不流出美国本土 。价格会贵1-2分。
  • 国际服务:报告在印度、菲律宾等国家完成。价格便宜。

语音识别和人工智能在这个行业能够很早使用,也是和这种运营模式分不开的。每个公司千方百计的提高工作效率。在同样的工作时长,完成的报告行数越多,报告的质量越好,公司越有竞争力。因为安装一般不收钱,报价比其他公司少1分钱,就可以抢走其他公司的客户。

行业发展

2000年之后 Nuance (已被微软用197亿美元)是第一个大规模使用语音识别的公司。Nuance最早的识别引擎是基于隐含马尔科夫链。对于特定人群来说,基于隐含马尔科夫链还是不错的。因为是为每个医生训练模型,隐马的效果还是不错的。这个版本的内部代号是Dragon,在帮助文件的后半部分都是程序员的照片和聚会照片,是个很特别的帮助。

2010年之后M*Modal(其开发团队被3M用8亿美元收购,2亿现金加6亿股份)开始快速发展,很快成为行业第2。M*Modal的优势主要有以下2点:

  • 结构化电子CDA编辑器和CDA发布
  • 识别的再训练

2020之后出现了一家新的公司Soniox 。这家公司的语义分析不错,特别是对于新报告的处理。

上面说的 M*Modal、 Nuance、Soniox ,我们都长期合作过。另外我们自己也有一个引擎,而且可以兼容 M*Modal、 Nuance的数据格式。能够平滑替代M*Modal和Nuance的服务。目前我们每个月会处理400万分钟的医生的录音。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/660636.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电脑装了两个Win10系统,怎么修改其名称方便识别?

前言 有小伙伴在上一期的双系统教程上留言说怎么修改双系统引导时候显示的名称 不然看起来两个系统好像都没啥分别,如果是Windows10Windows11的方案还好说,但如果是两个Windows10或者是两个Windows11,有时候还真的很不好分辨。 万一想要启动…

从MySQL+MyCAT架构升级为分布式数据库,百丽应用OceanBase 4.2的感受分享

本文来自OceanBase的客户,百丽时尚的使用和测试分享 业务背景 百丽时尚集团,作为国内大型时尚鞋服集团,在中国超过300个城市设有直营门店,数量超过9,000家。集团构建了以消费者需求为核心的垂直一体化业务模式,涵盖了…

C++11:shared_ptr循环引用问题

一、shared_ptr的弊端 struct Listnode {int _val;std::shared_ptr<Listnode> _prev;std::shared_ptr<Listnode> _next;Listnode(int val ):_val(val),_prev(nullptr),_next(nullptr){}~Listnode(){cout << "~Listnode()" << endl;} }; in…

Macos M3 FastGpt部署实现文档问答

前言 经过 Macos安装OrbStack-CSDN博客 Centos8安装docker-compose-CSDN博客 两篇文章的铺垫&#xff0c;可以正式在mac m芯片系列的电脑上使用docker安装项目了 什么是FastGpt FastGPT 是一个基于 LLM 大语言模型的知识库问答系统&#xff0c;提供开箱即用的数据处理、模…

【HarmonyOS4学习笔记】《HarmonyOS4+NEXT星河版入门到企业级实战教程》课程学习笔记(七)

课程地址&#xff1a; 黑马程序员HarmonyOS4NEXT星河版入门到企业级实战教程&#xff0c;一套精通鸿蒙应用开发 &#xff08;本篇笔记对应课程第 14 节&#xff09; P14《13.ArkUI组件-自定义组件》 将可变部分封装成组件的成员变量&#xff1a; 1、首先给标题添加两个图标&am…

计算机网络4——网络层4内部路由选择协议

文章目录 一、有关路由选择协议的几个基本概念1、理想的路由算法2、分层次的路由选择协议 二、内部网关协议 RIP1、协议 RIP 的工作原理2、特点3、距离向量算法4、坏消息传播慢 三、内部网关协议 OSPF1、基本特点2、OSPF 的五种分组类型 本节将讨论几种常用的路由选择协议&…

chrome和drive安装包路径

Chrome for Testing availability (googlechromelabs.github.io) 下载Stable下面的包哈

Mysql从入门到精通——Mysql知识点总结(基础篇)

参考视频 黑马程序员 MySQL数据库入门到精通i 题单推荐 入门 进阶 SQL语句类型 DDL:数据定义语言&#xff0c;用来定义数据库对象(数据库&#xff0c;表&#xff0c;字段)DML:数据操作语言&#xff0c;对数据库表中的数据进行增删改DQL:数据查询语言,用来查询数据库中表的…

音视频入门基础:像素格式专题(1)——RGB简介

一、像素格式简介 像素格式&#xff08;pixel format&#xff09;指像素色彩按分量的大小和排列。这种格式以每个像素所使用的总位数以及用于存储像素色彩的红、绿、蓝和 alpha 分量的位数指定。在音视频领域&#xff0c;常用的像素格式包括RGB格式和YUV格式&#xff0c;本文…

罗宾斯《管理学》第13版/教材讲解/考研真题视频课程/网课

本课程是罗宾斯《管理学》&#xff08;第13版&#xff09;精讲班&#xff0c;为了帮助参加研究生招生考试指定考研参考书目为罗宾斯《管理学》&#xff08;第13版&#xff09;的考生复习专业课&#xff0c;我们根据教材和名校考研真题的命题规律精心讲解教材章节内容。 序号名…

ubuntu部署sonar与windows下使用sonar-scanner

ubuntu部署sonar与windows下使用sonar-scanner sonar部署java安装mysql安装配置sonarqube 插件安装sonar-scanner使用简单使用 sonar部署 使用的是sonarqube-7.5&#xff0c;支持的java环境是jdk8&#xff0c;且MySQL版本 >5.6 && <8.0 java安装 打开终端&…

白话机器学习2:快速理解不同分类模型

一、支持向量机(SVM) 想象你在桌子上有一堆苹果和橘子&#xff0c;你的任务是用一根棍子&#xff08;在二维空间里&#xff0c;这根棍子就是一条直线&#xff09;把它们分开。苹果在棍子的一边&#xff0c;橘子在棍子的另一边。这就是分类问题的基本形式&#xff0c;而SVM就是用…