使用ESP32的语音到文本转换

news/2025/3/26 4:18:48/文章来源:https://www.cnblogs.com/linkstu/p/18788762

ESP32 + INMP441麦克风+ SD卡+ Deepgram API =语音到文本只需3秒!即时记录、存储和转录。现在就试试!

最快!使用ESP32板的语音到文本转换

语音转文本技术改变了许多项目的游戏规则。从在智能家居中实现免提控制到为残疾人创建无障碍解决方案,将口语转换为文本的能力打开了无限的可能性。无论你是在构建语音激活的自动化系统、在旅途中抄写笔记,还是将语音识别集成到聊天机器人中,语音转文本都可以简化用户交互,并将你的想法变为现实。借助ESP32开发板和Deepgram语音到文本API,您可以无缝高效地实现这一目标,使其成为创新物联网项目的必备功能。

为什么选择ESP32进行语音转文本?

ESP32是一款多功能微控制器,内置Wi-Fi和蓝牙,是物联网应用的理想选择。它的双核处理器和充足的内存使它可以毫不费力地处理语音到文本转换等复杂任务。通过利用Deepgram语音到文本API,我们可以实现实时语音识别,同时保持ESP32的处理需求最小化。

它是如何工作的

ESP32通过INMP441麦克风捕获音频输入,并将录制的音频存储在SD卡上。存储的音频文件然后从SD卡读取并发送到Deepgram语音转文本API。API处理音频数据并返回转录文本,然后可用于各种应用程序,如家庭自动化、笔记记录,甚至聊天机器人交互。

硬件设置

连接INMP441麦克风:

•将INMP441的I2S引脚(WS、SD和SCK)连接到ESP32 Dev Board的相应引脚上。

•确保正确的电源和接地连接。

连接INMP441麦克风:

•我的麦克风,esp32

GND -> GND

VDD -> 3.3v

Sd -> d35

SCK -> d33

w -> d22

L/ r -> 3.3v

连接SD卡模块:

将SD卡模块连接到ESP32 (MOSI、MISO、SCK和CS)的SPI引脚上。

将8GB SD卡插入模块。

连接SD卡模块:

SD卡模块ESP32

GND -> GND

Vcc -> VIn

味噌-> d19

Mosi -> d23

SCK -> d18

CS -> D5

在PCB上组装硬件(我们为触发器添加了一个额外的按钮)

如何创建Deepgram API密钥

要使用Deepgram语音转文本API,您需要一个API密钥。按照以下步骤创建一个:

注册一个Deepgram账户:

•访问Deepgram的网站并创建一个免费帐户。

•注册一个Deepgram账户:

•有了这个新帐户,你可以获得200美元的免费积分

•然后点击“创建API密钥”

•给它一个名字,然后你就能得到API密钥,复制并保存它

安装所需的库

打开Arduino IDE,安装以下库:

•ESP32 Core for Arduino(通过Board Manager版本3.4.0)

•HTTPClient用于向Deepgram API发送HTTP请求(内置库)

•ArduinoJson解析JSON响应从API(需要安装)

连接图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/904671.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SNeP软件计算有效群体大小

001、官网: https://sourceforge.net/projects/snepnetrends/002、脚本: SNeP1.1 -ped sample_name.ped -map sample_name.map -threads 10 -ld -out ./sample_name003、结果文件:。

2025.3.28(周五)

android实验二第三部分 事情处理 1. 点击事件 (OnClickListener) 方法:setOnClickListener(View.OnClickListener listener) android:onClick(在 XML 中使用) 核心功能:处理按钮、文本、图片等控件的 单击事件。 使用场景:按钮提交、页面跳转、功能触发等。 2. 长按事件 (…

关于原生小程序canvas标签始终显示再最上层问题

官方说明: https://developers.weixin.qq.com/miniprogram/dev/component/native-component.html 解决方法:将canvas正常绘制 对canvas进行定位,远离手机屏幕显示区域 将canvas转换为img图片,将转换后的图片进行展示 如果图片清晰度不够,则将canvas成倍的绘制,将转换后的…

Particle Asset OTA 如何实现远程

问题 用粒子平台部署更新到你的舰队是很容易的。但是,当您的产品包含其他组件(如ML模型、显示器、协处理器、证书或图像和声音等媒体)时,远程管理更新就变得更具挑战性。传统的方法通常需要物理访问,这可能耗时、昂贵,而且在规模上不切实际。解决方案 粒子资产OTA使您能够轻…

【企业必读】内外网文件传输的6个常见误区,你中招了吗?

在数字化转型的浪潮中,企业内外网文件传输已成为日常运营中不可或缺的一环。然而,许多企业在进行网络隔离后的文件传输和产品选型时,常常陷入一些常见的误区。这些误区不仅可能影响工作效率,还可能带来严重的安全隐患和合规风险。本文将深入探讨这些误区,并提供实用的建议…

SpreadJS V18.0 新版本发布!数据驱动革新,效率与体验全面升级

表格控件SpreadJS推出V18.0及V8.0版本!本次更新聚焦数据管理、多语言适配、报表与透视表增强,新增多项重磅功能,赋能企业高效应对复杂业务场景。核心亮点速览👇 一、表格绑定数据源:直连数据管理器,性能与效率双突破 开发背景 企业常将 Excel 作为动态数据库使用(如分析…

使用LattePanda V1制作了一个简单的基于batocera的游戏仿真站

现在,我们正在使用我们最近开发的Batocera arcade Box使用PS1模拟器运行Roadrash。我们使用的是Batocera Linux,这是一个开源且完全免费的复古游戏发行版本,旨在将任何计算机或单板计算机变成游戏控制台。 在这里,我们在相当旧的Latte Panda V1单板计算机上启动了Batocera,…

河北省科级政策app 连接MySQL数据库

项目结构 在连接数据库的时候要把localhost改为自己电脑的IP地址 开放mysql数据库远程访问的权限 使用jdbc的方法把jar包导入项目中

【Guava工具类】StringsInts

String相关工具 Strings Guava 提供了一系列用于字符串处理的工具: 对字符串为null或空的处理nullToEmpty(@Nullable String string):如果非空,则返回给定的字符串;否则返回空字符串 public static String nullToEmpty(@Nullable String string) {//如果string为null则返回…

我开发的【巨大娘的玩耍♥】游戏正在众筹中,参与即可获得限量优惠回报

大家好,我开发的【巨大娘的玩耍♥】游戏正在众筹中,参与即可获得限量优惠回报 游戏目前正在爱发电上众筹,众筹总额达成5千元即可开发和发布正式版。众筹截止日期:2025年7月23日 支持者可获得 8折激活码、获得所有玩家可见的特殊成就、上感谢名单 等 限量 回报~ 点我查看具体…

用于遥控车的先进PCB

该定制板集成了大功率电机控制,无线通信和高效电源管理在RC汽车的世界里,精确控制和效率是至关重要的。为了推动性能的极限,我专门为RC汽车设计了一个先进的PCB。这种定制板集成了大功率电机控制,无线通信和高效的电源管理,使其成为爱好者和机器人爱好者的理想选择。 为了…

读DAMA数据管理知识体系指南29文件和内容管理活动

读DAMA数据管理知识体系指南29文件和内容管理活动1. 规划生命周期的管理 1.1. 从文件的创建或接收文件后的分发、存储、检索、归档和潜在的销毁 1.2. 规划包括开发分类/索引系统和分类法,以实现文件的存储和检索 1.3. 重要的是,生命周期规划中需要为档案建立具体的制度 1.4. …