分享一个语音识别黑科技——开源免费的FunASR!
我们先看下Funasr的语音识别效果。第一个是识别MP4视频文件。
第二个是,电话语音实时识别。
FunASR有两个识别引擎,离线识别 和 实时识别。
离线识别引擎,主要用途是对录音文件进行转写,得到文本结果。
典型的使用场景:会议录音转写、电话录音转写,提取短视频文案等。
文件越大,等的时间越久,建议录音文件不要超过60分钟,否则服务端容易卡死。
实时识别引擎。
顾名思义,这个功能就是实时返回语音识别结果。
你的程序需要把语音数据,实时的不间断的发送给语音识别引擎。
典型的使用场景,直播字幕、视频会议字幕、智能客服,
这就像给声音装上了“同声传译”,识别结果秒同步!