实时语音识别（Python+HTML实战）-编程知识

实时语音识别（Python+HTML实战）

项目下载地址：FunASR

1 安装库文件

项目提示所需要下载的库文件：pip install -U funasr 和 pip install modelscope

运行过程中，我发现还需要下载以下库文件才能正常运行：

下载：pip install websockets，pip install ffmpeg

运行 FunASR-main/runtime/python/websocket/funasr_wss_server.py 文件，加载模型

注：如果提示缺少什么模型，就 pip 下载什么模型

部署本地的情况下需要修改默认 host 值 "0.0.0.0" 为 "127.0.0.1"：

--host：是 FunASR runtime-SDK 服务部署机器的 ip，默认为本机 ip（127.0.0.1），如果 client 与服务不在同一台服务器，需要改为部署机器 ip
--port：10095 是部署的端口号

成功运行结果如下：

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-pytorch\model.pt

.cache\modelscope\hub\iic\speech_paraformer-large_asr_nat-zh-cn-16k-common-vocab8404-online\model.pt

.cache\modelscope\hub\iic\speech_fsmn_vad_zh-cn-16k-common-pytorch\model.pt

.cache\modelscope\hub\iic\punc_ct-transformer_zh-cn-common-vad_realtime-vocab272727\model.pt

提示如下内容，说明模型已经加载完毕：

运行 FunASR-main/runtime/html5/static/index.html 文件，加载项目主页面

第一个 asr 服务器的地址填入：

wss://127.0.0.1:10095

点击左下角的连接按钮，回到 Pycharm 运行界面提示连接成功！

该项目支持麦克风实时录音功能，同时可以传入多种音频格式的文件（如 .wav, .pcm, .mp3 等），也支持视频输入(如 .mp4 等)，以及多文件列表 wav.scp 输入。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/578579.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！