MoneyPrinterPlus:AI自动短视频生成工具-微软云配置详解

news/2024/10/5 21:16:00/文章来源:https://www.cnblogs.com/flydean/p/18269224

MoneyPrinterPlus可以使用大模型自动生成短视频,我们可以借助Azure提供的语音服务来实现语音合成和语音识别的功能。

Azure的语音服务应该是我用过的效果最好的服务了,微软还得是微软。

很多小伙伴可能不知道应该如何配置,这里给大家提供一个详细的Azure语音服务的配置教程。

项目已开源,代码地址:https://github.com/ddean2009/MoneyPrinterPlus

Azure的具体配置

因为Azure的注册需要用到VISA,所以阻止了很多想要进一步探索的小伙伴。

其实,MoneyPrinterPlus也是支持国内的云厂商,比如阿里云和腾讯云。所以,如果注册Azure有困难的小伙伴,可以参考我的另外两篇使用阿里云和腾讯云的介绍文章。

这里Azure为例,来讲解如何进行Azure语音的配置。

获取Azure的Speech Key和Service Region

首先我们到Azure的官网上去注册一个账号,怎么注册这里就不讲了,反正很简单,注册成功还可以免费使用一年的微软云服务,非常的棒。

有了账号,并且登录账号之后,在搜索框输入语音服务:

image-20240626152358026

点击下面的语音服务,进入到Azure的语音服务页面。

image-20240626152540065

到语音服务这里,点击创建按钮,会进入创建语音服务页面:

image-20240626152710532

填上必须的内容。点击审阅并创建,就可以创建好Azure的服务了。

记住你的密钥和region:

image-20240626152846707

在MoneyPrinterPlus中配置

启动我们的项目,在web页面点击最左边的基础配置,找到右边的配置音频库信息,选择Tencent。

填入我们之前保存的密钥和region。

回车后,这样我们的配置就保存了。

image-20240626152909378

其他的配置

资源库

资源库指的是我们从哪里获取视频或者图片信息,这里目前提供了两个资源提供方,分别是pexels和pixabay。

大家任意选择一个即可。

以pexels为例,我们登入pexels官网 https://www.pexels.com/zh-cn/ ,注册一个账号。

在图片和视频API里面,可以查看自己的api密钥。

image-20240616211609578

查看自己的API密钥:

image-20240616211719443

把这个API密钥记下来,拷贝到MoneyPrinterPlus的配置即可。

![image-20240620170029227](/Users/wayne/Library/Application Support/typora-user-images/image-20240620170029227.png)

大模型配置

目前支持Moonshot,openAI,Azure openAI,Baidu Qianfan, Baichuan,Tongyi Qwen, DeepSeek这些。

国内要用的话推荐Moonshot(最近发现moonshot不太稳定,大家可以考虑Baichuan或者DeepSeek)。

同样的到Moonshot开发者平台上注册一个key:https://platform.moonshot.cn/ 填入对应的配置即可。

image-20240616212642905

AI短视频生成

有了基础配置之后,就可以点击左边的AI视频进入AI视频生成页面。

  1. LLM视频文案生成

在视频主题区输入你需要生成的视频主题,然后点击生成视频文案。

程序会自动使用大模型生成对应的视频文案和视频文案关键字:

image-20240616220713534

如果你对视频文案或者关键字不满意,可以手动进行修改。

  1. 视频配音区

在视频配音区可以选择配音语言和对应的配音语言,目前支持100+配音语言。

还可以选择不同的配音语速,以支持不同使用场景。

image-20240616220840076

如果你对配音不太确定,可以点击试听声音试听对应的配音语音。

  1. 背景音乐

背景音乐放在项目下的bgmusic目录下面,你可以自行添加背景音乐文件到该文件夹下面。

image-20240616221041774

可以选择是否开启背景音乐,和默认的背景音乐音量。

  1. 视频配置区

视频配置区可以选择视频布局:竖屏,横屏或者方形。

可以选择视频帧率,视频的尺寸。

还可以选择每个视频片段的最小长度和最大长度。

最最重要的,还可以开启视频转场特效。目前支持30+视频转场特效。

image-20240616221116997

  1. 字幕配置

如果你需要字幕,那么可以点击开启字幕选项,可以设置字幕字体,字幕字体的大小和字幕颜色等。

如果你不知道怎么设置,选择默认即可。

image-20240616221242812

  1. 最后的视频生成

最后点击生成视频按钮即可生成视频。

页面会有相应的进度提醒。

image-20240616221712173

最后生成的视频会展示在页面最下面,大家可以自行播放。

点我查看更多精彩内容:www.flydean.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/731633.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Camera基础知识

1. 摄像头组成 摄像头通常由以下几个主要组成部分构成:镜头(lens)、传感器(sensor)、软板(FPC)、图像处理芯片(DSP)。决定一个摄像头好坏的重要部件是:镜头(lens)、图像处理芯片 (DSP)、传感器(sensor) 2. 摄像头采样与格式 YUV 是一种颜色编码方法,和它等同的还…

Linux OpenGrok搭建

OpenGrok是一个源码搜索及交叉引用查询引擎,OpenGrok的引入可以帮助我们更好地在浩如烟海的源码里找到自己需要的那坨代码。目录一、目的二、环境三、相关概念3.1 OpenGrok3.2 CTags3.3 Tomcat四、OpenGrok搭建4.1 安装jdk4.2 安装ctags依赖4.3 安装universal-ctags4.3.1 下载…

22.5万奖金池丨Higress AI 网关编程挑战赛启动

2024 天池云原生编程挑战赛 6 月 12 日正式启动,8 月 28 日线下决赛,9 月公布最终参赛结果,奖金池合计 22.5 万,共计三个赛道,面向全社会开放。《使用 Higress AI 网关优化 AI 调用成本》是第二赛道。AI 原生应用,对网关的需求已经超越了传统的路由和负载均衡功能,还需要…

alembic数据库迁移工具

Alembic 使用 SQLAlchemy 作为底层引擎,为关系数据库提供变更管理脚本的创建、管理和调用。 安装alembicpip install alembic 2、初始化alembic环境命令: alembic init alembic 3、修改配置和环境 此处修改两个地方: 1 alembic.ini 将url修改为你要连接的数据库地址 2 修…

Hexo自动部署

作者: 時光 来源: 時光的博客园子 原文: https://blog.shiguang666.eu.org/2024/06/24/49078ab077e1Hexo自动部署 为了简化Hexo部署过程,你可以使用持续集成工具(如 GitHub Actions)来实现自动化部署。GitHub Actions 是一个持续集成和持续交付 (CI/CD) 平台,允许你自动化你…

SQLAlchemy的数据库引擎

任何SQLAlchemy应用程序的开始都是一个名为 Engine . 此对象充当连接到特定数据库的中心源,提供工厂和称为 connection pool 对于这些数据库连接。引擎通常是一个只为特定数据库服务器创建一次的全局对象,并使用一个URL字符串进行配置,该字符串将描述如何连接到数据库主机或…

Butterfly主题配置及美化

作者: 時光 来源: 時光的博客园子 原文: https://blog.shiguang666.eu.org/2024/06/24/a334c4683866/Butterfly主题配置及美化 Butterfly主题介绍官方文档:Hexo Butterfly 主题官方文档 GitHub 仓库:Hexo Butterfly 主题 GitHub 仓库Hexo官网上面有非常多好看的主题,你可以选…

概率释疑 | 高一层次

人教2019 A版概率中的问题释疑前言 疑难廓清 ✍️【人教 2019A 版教材 \(P_{246}\) 习题 \(10.1\) 第 \(4\) 题】判断下列说法是否正确.若错误,请举出反例. (1). 互斥的事件一定是对立事件,对立事件不一定是互斥事件; (2). 互斥的事件不一定是对立事件,对立事件一定是互斥…

[Triton课程笔记] 2.1.4 Backend-build

课程链接:https://www.bilibili.com/video/BV1Fa411G75m/?spm_id_from=333.788&vd_source=c2a322357481107ab7f418b1ae9ce618 一、build写CMakeLists.txt文件; 写cmake/TritonYourBackendConfig.cmake.in 文件; 将pytorch_backend/src/libtriton_pytorch.ldscript 拷贝…

pdf转ppt怎么免费转换?3个方法一定要看看!

我们在工作中经常会遇到这两种格式的文件,各有各的优点,PDF兼容性很强,但是不易编辑,如果想要修改其中的内容那就比较麻烦,所以通常会将PDF文件转换成易编辑的Word、PPT等文档。那么你知道pdf如何免费转换ppt吗?下面就来讲讲pdf转ppt的方法,看完你就会了。 方法一、Wind…

服务器raid5数据恢复

服务器数据恢复环境: x3850 X5服务器,一组由5块硬盘组建的raid5阵列,安装linux操作系统,运行oracle数据库。服务器故障检测分析描述: 服务器上raid5阵列中两块硬盘故障导致磁盘离线,服务器数据库数据丢失。raid5阵列中有两块硬盘处于离线状态;没有发现物理故障。服务器数…

服务器磁盘阵列数据恢复

服务器环境描述: IBM 3650服务器,raid磁盘阵列中共有5块 SAS 300GB 磁盘组成一组RAID5磁盘阵列,是windows 2003系统, SQL Server 2010数据库。服务器检测与分析: 首先检测raid磁盘阵列,发现服务器中的2块磁盘物理故障离线且有坏道导致RAID离线,服务器无法进入系统。服务…