这里通过gradio来实现实时语音识别,通过上传一个文件,当点击提交后则在右侧输出其相应识别的文字。
实现代码比较简单,如下所示:
import gradiodef convert(file_bytes):# 语音识别方法,其中file_bytes是采样率与对应numpy.ndarray实例return recognition_func(file_bytes[1])demo = gradio.Interface(fn=convert,inputs=gradio.Audio(),outputs="textbox")
demo.launch()
其效果如下:
可以看到效果还是可以的。不仅支持识别还把标点符号给添加了。