音转文工具，9.8k star! 【送源码】-编程知识

音转文工具，9.8k star! 【送源码】

news/2024/11/17 7:33:01/文章来源:https://blog.csdn.net/java_121388/article/details/138629516

我们经常会遇到将音频转为文字的情况，比如在开会时录音的会议纪要、上课时录下的老师讲课内容。虽然网上也有一些在线的工具可以将音频转为文字，但是考虑到数据安全和费用问题，使用起来也不是很方便。

今天了不起给大家介绍一款开源工具——Buzz，他可以让你在本地离线的识别音频并转换成文字。

项目介绍

Buzz 是一款开源的语音转文字工具，它能够实时将语音转换为文字，支持多种操作系统，包括 Windows、macOS 和 Linux。它不仅支持实时语音识别，还能将视频和音频文件转换成文字或字幕，极大地方便了内容创作者、翻译工作者和广大用户。

项目使用

因为是跨平台的工具，Windows 用户可以在 release 页面下载安装包，Mac 用户可以使用 brew install --cask buzz 命令安装应用。

打开应用，可以看到界面非常简洁：

点击上方菜单栏的“➕”，可以选择音频文件。之后在弹出的对话框中选择要使用的模型、任务以及语言。这里我们就使用默认的 Whisper 的 base 模型，任务选择“Transcribe”即可将语音转换为文字。

点击“Run”按钮后，软件会自动下载模型文件，并进行转换。转换完毕的任务会在首页列表显示，如图：

双击任务，即可查看转换成功的文字，如图：

你可以在这个页面查看每句话的所在的音频时间，并且播放音频。还可以点击右下角的下载按钮，将文件导出为 txt 格式或者 srt 的字幕格式。

当然，Buzz 还支持实时的语音转文字和翻译功能。首页点击左上角的小麦克风按钮，即可进入实时录音的界面。依旧是配置好使用的模型和任务类型，点击“Record”按钮，即可实时的转换文字了。

总结

随着开源的大型模型日益增多，以及 GitHub 上涌现的众多整合了这些大型模型的工具，我们得以以更低的门槛在个人电脑上运行这些模型，从而帮助我们完成更多的工作。Buzz 就是这么一款使用方便的语音转文字工具，如果你有类似的需求，就赶快去试试吧。

项目地址：https://github.com/chidiwilliams/buzz

—— EOF ——

给大家分享一套基于Springboot+Vue的图书管理系统源码，在实际项目中可以直接复用。(免费提供，文末自取)

一、系统运行图（设计报告和接口文档）

1、登陆页面

2、后台页面

3、设计报告包含接口文档

二、系统搭建视频教程

源码免费领取方式

扫码后台回复 图书

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/681813.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

#友元函数与友元类

#友元函数与友元类

目录 1.概念 2.友元函数 3.友元类 1.概念友元提供了一种突破封装的方式，有时提供了便利。但是友元会增加耦合度，破坏了封装，所以友元不宜多用。友元分为：友元函数和友元类 2.友元函数友元函数可以直接访问类的私有成员&a…

阅读更多...

「MDN web 入门」学习笔记

目录写在前面 1. MDN 简介 1.1 MDN 的主要特点 1.2 MDN 的主要功能 1.3 MDN 网页开发的指南 2. 安装基础软件 2.1 专业人士工具 2.2 初学者基本工具 3. 设计网站外观 3.1 计划 3.2 绘制草图 3.3 选定素材 3.4 文本 3.5 主题颜色 3.6 图像 3.7 字体 4. 处理文…

阅读更多...

六西格玛项目的核心要素：理论学习、实践应用与项目经验

六西格玛项目的核心要素：理论学习、实践应用与项目经验

许多朋友担心，没有项目经验是否就意味着无法考取六西格玛证书。针对这一疑问，张驰咨询为大家详细解答。首先，需要明确的是，六西格玛项目不仅仅是一种管理工具或方法，更是一种追求卓越、持续改进的思维方式。它强调通…

阅读更多...

5.07 Pneumonia Detection in Chest X-Rays using Neural Networks

5.07 Pneumonia Detection in Chest X-Rays using Neural Networks

肺炎诊断是一个耗时的过程，需要高技能的专业人员分析胸部X光片chest X-ray (CXR)，并通过临床病史、生命体征和实验室检查确认诊断。它可以帮助医生确定肺部感染的程度和位置。呼吸道疾病在 X 光片上表现为一处膨胀的不透明区域。然而，由于不…

阅读更多...

科技云报道：从亚运到奥运，大型国际赛事共赴“云端”

科技云报道：从亚运到奥运，大型国际赛事共赴“云端”

科技云报道原创。 “广播电视转播技术拯救了奥运会”前奥委会主席萨马兰奇这句话广为流传。奥运会、世界杯、亚运会这样的全球大型体育赛事不仅是体育竞技的盛宴，也是商业盛宴，还是技术与人文的融合秀。随着科技的进步，技术在体育赛事中扮…

阅读更多...

2.外卖点餐系统（Java项目 springboot）

2.外卖点餐系统（Java项目 springboot）

目录 0.系统的受众说明 1.系统功能设计 2.系统结构设计 3.数据库设计 3.1实体ER图 3.2数据表 4.系统实现 4.1用户功能模块 4.2管理员功能模块 4.3商家功能模块 4.4用户前台功能模块 4.5骑手功能模块 5.相关说明新鲜运行起来的项目：如需要源码数据库…

阅读更多...

树形数据结构---堆

树形数据结构---堆

1.概念什么是堆？堆和树的区别是什么？它的应用场景有哪些？ 堆（Heap）是一种基于树形结构的数据结构，它是一种特殊的完全二叉树。堆的特点是每个节点都满足堆的性质，即父节点的键值总是大于或等…

阅读更多...

8.删除有序数组中的重复项 II

8.删除有序数组中的重复项 II

文章目录题目简介题目解答解法一：双指针（快慢指针）代码：复杂度分析： 题目链接大家好，我是晓星航。今天为大家带来的是删除有序数组中的重复项 II 相关的讲解！😀 题目简介题目解…

阅读更多...

[NSSRound#1 Basic]sql_by_sql

[NSSRound#1 Basic]sql_by_sql

[NSSRound#1 Basic]sql_by_sql 这题没啥难的，二次注入盲注的套题先注册，进去有个修改密码可能是二次注入修改密码处源码 重新注册一个admin-- 获得admin身份（原理看sqli-l…

阅读更多...

【日常开发之FTP】Windows开启FTP、Java实现FTP文件上传下载

【日常开发之FTP】Windows开启FTP、Java实现FTP文件上传下载

【日常开发之FTP】windows开启FTP、Java实现FTP文件上传下载 FTP前言FTP是什么？FTP两种模式 Windows开启FTPFTP windows 配置防火墙配置 Java部分Maven配置创建FTPClient 注意 FTP前言 FTP是什么？ FTP是一个专门进行文件管理的操作服务，一般…

阅读更多...

从github上复制代码，记录失败过程，最后放弃挣扎直接去github上手动下载了

从github上复制代码，记录失败过程，最后放弃挣扎直接去github上手动下载了

从github中复制代码出现一下两种报错 1、Failed to connect to github.com port 443: 连接超时 2、Failed to connect to github.com port 443: 拒绝连接解决办法如下： https://www.ipaddress.com/ github.com的IP地址为140.82.114.3 终端打开hosts文件加入140…

阅读更多...

智慧变电站守护者：TSINGSEE青犀AI视频智能管理系统引领行业革新

智慧变电站守护者：TSINGSEE青犀AI视频智能管理系统引领行业革新

一、方案概述随着科技的不断进步，人工智能（AI）技术已经深入到各个领域。在变电站安全监控领域，引入AI视频监控智能分析系统，可以实现对站内环境、设备状态的实时监控与智能分析，从而提高变电站的安全运行…

阅读更多...

推荐文章

最新文章