使用百度开发者平台处理语音朗读

--TIME

--百度开发者中心-汇聚、开放、助力、共赢

--注册账号

 -- 准备工作

准备工作

更新时间:2023-01-13

成为开发者

三步完成账号的基本注册与认证:

STEP1:点击进入控制台,选择需要使用的AI服务项。若为未登录状态,将跳转至登录界面,请您使用百度账号登录。如还未持有百度账户,可以点击此处注册百度账号。

STEP2:首次使用,登录后将会进入开发者认证页面,请填写相关信息完成开发者认证。注:(如您之前已经是百度云用户或百度开发者中心用户,此步可略过。)

STEP3:通过控制台左侧导航,选择语音技术,进入语音技术的控制面板,进行相关操作。

BB4979E6-CF98-4639-BFAE-696361D6EE1F.JPG

领取免费额度

新用户使用语音技术可以在控制台领取相应接口的免费测试额度进行接口调用,免费额度有效期自领取成功之日开始计算,有效期截止后,免费调用额度清零。详情可点击此处查看 语音识别免费额度 | 语音合成免费额度 | 呼叫中心语音免费额度。

微信截图_20221130182012.png

创建应用

您需要创建应用才可正式调用语音技术能力,应用是您调用服务的基本操作单元,您可以基于应用创建成功后获取的API Key及Secret Key,进行接口调用操作,及相关配置。您可按照下图所示的操作流程,完成创建操作。

微信截图_20221130182124.png

微信截图_20221130182151.png

应用名称: 用于标识您所创建的应用的名称,支持中英文、数字、下划线及中横线,此名称一经创建完毕,不可修改。

接口选择: 每个应用可以勾选业务所需的所有AI服务的接口权限(仅可勾选具备免费试用权限的接口能力),语音技术下全部接口已默认勾选,创建应用完毕,此应用即具备了所勾选服务的调用权限。

语音包名:如果您需要使用语音技术SDK服务(iOS/Android),需要绑定包名信息,以便生成授权License。

应用归属:可选择个人使用或公司使用服务,若为公司使用,可与专属商务经理沟通,获取专业的售前支持。

应用描述: 对此应用的业务场景进行描述。

获取密钥

在您创建完毕应用后,平台将会分配给您此应用的相关凭证,主要为AppID、API Key、Secret Key。以上三个信息是您应用实际开发的主要凭证,请您妥善保管。下图为示例内容:

image.png

生成签名

您需要使用创建应用所分配到的AppID、API Key及Secret Key,进行Access Token(用户身份验证和授权的凭证)的生成,方法详见 Access Token获取,我们为您准备了几种常见语言的请求示例代码。

温馨提示:Access Token的有效期为30天(以秒为单位),请您集成时注意在程序中定期请求新的token。

启动开发

目前语音技术主要有两种方式使用:API与SDK,您可以选择各产品的文档,查看具体使用方法及参数。详情可点击此处查看 语音识别导览 | 语音合成导览 | 呼叫中心语音导览。

 

如何用可视化工具调用

更新时间:2023-01-13

如何使用 Postman 调用语音技术服务 API

本文提供了通过可视化工具 Postman 调用短文本语音合成 API 的样例,帮助您零编码快速体验并熟悉语音技术服务。

1. 下载并安装接口调用工具

1.1 下载接口调用工具 — Postman

下载地址如下:

Mac 下载地址,点击前往>>

Windows 下载地址,点击前往>>

1.2 Postman 安装教程

(1)双击安装包。

(2)初次登录无账号,可直接进入 postman 主界面。

2. 获取 Access Token

将请求格式改为 “POST” 并填写请求地址:https://aip.baidubce.com/oauth/2.0/token

微信截图_20221130185421.png

点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下3个请求参数。

grant_type: 必须参数,固定为 client_credentials

client_id: 必须参数,应用的 API Key

client_secret: 必须参数,应用的 Secret Key

微信截图_20221130185459.png

点击右上角蓝色“send”,即可在下方返回值区域中获取 access_token。

微信截图_20221130185603.png

3. 进行接口调用

3.1 接口调用 具体操作如下:

(1) 将请求格式改为 “POST” 并填写请求地址(以短文本语音合成为例):https://tsn.baidu.com/text2audio

微信截图_20221130190152.png

(2)点击 Body,选择“x-www-form-urlencoded”,在 key 和 value 中分别输入以下请求参数。

tex: 必须参数,合成文本

tok: 必须参数,获取到的access_token参数

cuid: 必须参数,用户唯一标识

ctp: 必须参数,客户端类型选择,web端填写固定值 1

lan: 必须参数,固定值 zh

(更多参数请到短文本语音合成页面查看)

微信截图_20221130190448.png

(3) 修改请求头,点击 Headers,在 key 和 value 中分别输入1个请求参数。

key 栏输入:Content-Type

value 栏输入:application/x-www-form-urlencoded

微信截图_20221130190958.png

(4)点击右上角蓝色“send”,即可在下方返回值区域中获取音频。

微信截图_20221130190455.png

语音识别SDK

更新时间:2023-01-13

Android SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

先点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.recognizerdemo)等信息,创建完成后就可以看到创建的应用信息了:

创建APP2.png

创建完成的应用信息如下图所示:

APP3.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取。

2. 下载语音识别SDK

在SDK下载页面下载 语音识别Android SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 不修改SDK,直接运行

解压sdk文件,不做任何修改,直接安装运行程序可以看到以下界面:

安卓修改1.png

4. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

修改参数.JPG

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后进入在线识别,点击开始录音可进行在线语音识别:

安卓修改2.png

简单的 语音识别Android SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。


 

iOS SDK快速集成指南

只需四步,即可完成语音识别SDK的应用集成,让您的应用获得稳定一致的识别体验。

Step1:成为百度AI开放平台的开发者

要调用百度AI开放平台的语音识别能力先要成为百度AI开放平台的开发者,首先让我们花5分钟来注册百度AI开放平台的开发者,并新建一个百度语音识别应用。

1. 创建帐户

先点击此处注册百度账户,快速建立一个百度账号,请参考下图: 

屏幕截图 2021-12-29 144649.png

2. 创建应用

创建账号之后,登录百度AI开放平台,并且点击此处创建一个应用,如下图:

创建APP1.png

创建应用时请务必输入应用名称、语音包名(输入示例demo包名:com.baidu.speech.BDSClientSample)等信息,创建完成后就可以看到创建的应用信息了:

ios包名创建.png

创建完成的应用信息如下图所示:

iosapp2.png

Step2:申请语音识别额度

1. 实名认证

语音识别SDK需要完成实名认证后才能使用,第一步需要按照提示完成个人认证或企业认证。完成实名认证的用户可以领取免费额度。如下图所示进行实名认证: 

实名认证.png

2. 领取免费额度

完成实名认证后,需领取语音识别的免费额度。如下图所示:

领取免费额度.png

Step3:下载语音识别SDK,填写授权信息

1. 获取鉴权信息

准备好创建应用后获取到的3个鉴权信息,AppID、API Key、Secret Key,需要您登陆控制台查看应用详情获取

2. 下载语音识别SDK

在SDK下载页面下载 语音识别IOS SDK 文件,链接:SDK下载_文字识别SDK_语音识别SDK-百度AI开放平台

3. 填写鉴权信息

填入 AppID、API Key、Secret Key 3个鉴权信息测试,请按照以下步骤全部修改:

IOS鉴权修改.png

Step4: 测试语音识别功能

1. 按照上述文档修改完成后,安装app打开后可进行在线语音识别:

ios识别.png

简单的 语音识别IOS SDK 测试完成了,其他各子功能可以按照详细的技术文档进行集成。

 

百度AI开放平台 语音文档~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/247226.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

安装Python以及pycharm

Pycharm是编辑器。相当于Word对文字进行编辑。 Python是解释器。讲代码翻译为计算机可以理解的指令。 1、安装Python 官网:Welcome to Python.org 打开的时候有点慢等待一会就好,点击下载,选择Windows版本 等待一会,可以看到如…

Java类的初始化顺序

类初始化顺序遵循以下三个原则(优先级依次递减) 1、静态对象(变量)优先于非静态对象(变量)初始化,其中静态对象(变量)只初始化一次,而非静态对象&…

Spring-事务支持

目录 一、事务概述 二、引入事务场景 三、Spring对事务的支持 Spring实现事务的两种方式 声明式事务之注解实现方式 1.在Spring配置文件中配置事务管理器 2. 在Spring配置文件引入tx命名空间 3. 在Spring配置文件中配置“事务注解驱动器”,通过注解的方式控…

容器技术发展史,编排与容器的技术演进之路——2

目录: 容器技术发展史 Jail时代 1979 年 贝尔实验室发明 chroot2000 年 FreeBSD 4.0 发行 FreeBSD Jail2001 年 Linux VServer 发行2004 年 Solaris Containers 发行云时代 2006 年 google 推出 Process Containers2008 年 LXC 推出2011 年 CloudFoundry 推出 Ward…

RH850P1X芯片学习笔记-Pin Functions

文章目录 Pin Connection Diagrams术语定义 Pin ListPort OverviewIntroductionFunctional OverviewPort CategoryOperation Mode运行模式 Port Function寄存器地址映射 Port寄存器描述Pn/JP0 — Port RegisterPPRn/JPPR0 — Port Pin Read RegisterPMn/JPM0 — Port Mode Regi…

apk和小程序渗透测试

apk和小程序渗透测试 文章目录 apk和小程序渗透测试小程序渗透测试apk和小程序的抓包安装证书apk渗透 小程序渗透测试 小程序的默认路径在 C:\Program Files (x86)\Tencent\WeChat\WeChatApp 使用UnpackMiniApp、wxappUnpacker工具完成逆向 先打开UnpackMiniApp.exe工具 选…

8.4 Windows驱动开发:文件微过滤驱动入门

MiniFilter 微过滤驱动是相对于SFilter传统过滤驱动而言的,传统文件过滤驱动相对来说较为复杂,且接口不清晰并不符合快速开发的需求,为了解决复杂的开发问题,微过滤驱动就此诞生,微过滤驱动在编写时更简单,…

重要通知丨JumpServer开源堡垒机V2社区版即将停止维护的通知

尊敬的JumpServer开源堡垒机用户:您好! 如《关于JumpServer开源堡垒机V2版本产品生命周期的相关说明》所示,JumpServer开源堡垒机V2版本(社区版)将于2023年12月31日停止维护支持。 在过去两年多的时间里,…

MYSQL练题笔记-聚合函数-有趣的电影

一、题目相关内容 1)相关的表和题目 2)帮助理解题目的示例,同时告诉我查询结果的格式 二、自己初步的理解 其实从题目就可以看出来,三个关键点,非,奇数,降序排列。 我去找下奇数的函数是哪一…

接口压测指南

接口压测指南 一、 为什么需要进行接口压测二 、接口压测的目标是什么三、 用什么工具进行接口压测四、 接口压测核心指标4.1 JMeter的报告模板4.2 ApiPost报告模板 五、 接口慢如何排查5.1 大体排查思路5.2 排查工具5.3 压测经验 一、 为什么需要进行接口压测 突然有一天领导…

在用户不安装 ImageMagick 的情况下使用

需要以编程的方式配置环境变量(手工配置也是一样的效果) 1、首先要配置 path 将 {ImageMagick目录} 配置到path中 2、配置 MAGICK_HOME 将 {ImageMagick目录} 配置到MAGICK_HOME中 3、配置MAGICK_CODER_MODULE_PATH 将 {ImageMagick目录}\modules\…

JVM:双亲委派(未完结)

类加载 定义 一个java文件从编写代码到最终运行,必须要经历编译和类加载的过程,如下图(图源自b站视频up主“跟着Mic学架构”)。 编译就是把.java文件变成.class文件。类加载就是把.class文件加载到JVM内存中,得到一…