AI 绘画Stable Diffusion 研究(十三)SD数字人制作工具SadTlaker使用教程


免责声明:
本案例所用安装包免费提供,无任何盈利目的。


大家好,我是风雨无阻。

想必大家经常看到,无论是在产品营销还是品牌推广时,很多人经常以数字人的方式来为自己创造财富。而市面上的数字人收费都比较昂贵,少则几千,多则上万。


那么如何才能免费制作属于自己的数字人视频呢?


其实很简单,只需要在stable diffusion上安装sadtalker插件就能轻松生成自己的数字人。


如果还没安装sadtalker插件的朋友,请查看我的上一篇文章AI 绘画Stable Diffusion 研究(十二)SD数字人制作工具SadTlaker插件安装教程。


今天我们就来演示 如何使用SadTlaker插件制作一个会说话的数字人视频。

大家跟着我的步骤,赶紧实操起来,看看效果。


1、准备图片


图片: 准备一张人物正面图片,我们可以用sd 文生图或图生图功能生成,也可以是其他的图片。


这里再演示一下,使用sd 图生图,生成一张正面图片的步骤。

(1)、去C站找一张正面图作为参考

在这里插入图片描述


(2)、下载大模型: majicMIX realistic 麦橘写实 ,并把它放到 models\Stable-diffusion 目录下


然后重启 Stable-diffusion 让模型生效。

\sd-webui-aki-v4.2\models\Stable-diffusion

在这里插入图片描述


(3)、下载图片,并上传到图生图,然后设置相关参数

  • 上传图片
  • 设置正向提示词 、反向提示词
  • CLP 终止层数设置为:2
  • 设置随机种子
  • 设置采样方法
  • 设置重绘制尺寸
  • 开启面部修复(重要:不开启,人物面部会出现斑点或痣)

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


(4)、点击生成,可以获得一张人物正面图片

在这里插入图片描述


2、准备音频文件

音频文件格式: MP3或wav 文件。

音频文件允许的长度:由显存大小决定。

音频文件的生成:可以使用chatgpt 生成文案,再使用配音工具生成音频,保存起来。当然也可以自己录制音频,这里就不再详细演示。

这里为了演示,提前准备了一段 14s 左右的音频。


3、使用SadTlaker 合成数字人视频


(1)、功能栏区域,切换到SadTlaker 标签页

在这里插入图片描述


(2)、上传刚刚sd 生成好的人物正面图片

在这里插入图片描述


(3)、上传准备的音频文件

在这里插入图片描述


(4)、参数设置及详解

  • 姿态样式: 人脸姿态,一共47个数字,每个姿态都不一样,大家可自行测试选择喜欢的姿态。

  • 脸部模型分辨率:根据分辨率选择自己对口型的模型,如果图片较大就选择512。

  • 预处理:这个设置,与图生图中的设置相同。

  • 静止模式:更少的手势,需要和完整与处理一起使用。

  • 使用GFPGAN 增强面部: 是否高清化处理


这是我的设置,如下:

在这里插入图片描述


(5)、点击“生成”按钮,合成视频

视频会在预览窗口显示视频处理状态,控制台也能看到处理进度。

只需等待处理完成即可。

在这里插入图片描述


A、使用预处理完整+静止模式的方式生成的视频:

SD插件SadTlaker制作的会说话的数人

B、使用预处理裁剪 方式生成的视频:

SD插件SadTlaker制作的会说话的数人2


对比效果:

A 方式生成的视频动作幅度更小,但是图片使用的是原尺寸。

B 方式生成的视频动作幅度更大,图片被裁剪,但是效果更真实自然一些。

好了,SD数字人制作教程就到此结束。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/76024.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

AMBA总线协议(3)——AHB(一)

目录 一、前言 二、什么是AHB总线 1、概述 2、一个典型的基于AHB总线的微处理器架构 3、基本的 AHB 传送特性 三、AMBA AHB总线互联 四、小结 一、前言 在之前的文章中我们初步的了解了一下AMBA总线中AHB,APB,AXI的信号线及其功能,从本文开始我们…

vue + vue-office 实现多种文件(docx、excel、pdf)的预览

支持多种文件( docx、excel、pdf)预览的vue组件库,支持vue2/3。也支持非Vue框架的预览。 github: 《仓库地址》 演 示: 《演示效果》 功能特色 一站式:提供docx、pdf、excel多种文档的在线预览方案,有它就够了简单&#xff1a…

简历本-专业在线简历制作下载网站 自带智能简历诊断

简历本是一个高效的在线简历制作与管理工具,为求职者提供专业简历模板,使用简历本5分钟就能制作一份优秀简历,可随时随地将简历下载为Word、PDF、图片格式文件,可在线发送或投递,不过使用需要注册登陆,提供…

Docker+Selenium Grid搭建自动化测试平台

安装docker yum install -y yum-utils device-mapper-persistent-data lvm2 yum-config-manager –add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo yum install docker-ce -y Create a Docker Network docker network create grid 下载镜像 hu…

perl下载与安装教程【工具使用】

Perl是一个高阶程式语言,由 Larry Wall和其他许多人所写,融合了许多语言的特性。它主要是由无所不在的 C语言,其次由 sed、awk,UNIX shell 和至少十数种其他的工具和语言所演化而来。Perl对 process、档案,和文字有很强…

ONES × 鲁邦通|打造研发一体化平台,落地组织级流程规范

近日,ONES 签约工业互联网行业领先的解决方案提供商——鲁邦通,助力鲁邦通优化组织级流程规范,落地从需求到交付的全生命周期线上化管理。 依托于 ONES 一站式研发管理平台,鲁邦通在软硬件设计开发、项目管理和精益生产等方面的数…

16----公式

本节我们来学习如何在markdown中打印公式 Markdown是一种轻量级标记语言,常用于撰写文档、博客和论坛帖子。虽然Markdown本身并不支持数学公式,但可以使用一些扩展来实现公式的显示。在支持公式扩展的 Markdown 解析器中,我们可以使用 Katex …

嵌入式:ARM Day6

作业:完成cortex-A7核UART总线实验 目的:1.输入a,显示b,将输入的字符的ASCII码下一位字符输出 2.原样输出输入的字符串 源码: uart4.h #ifndef __UART4_H__ #define __UART4_H__#include "stm32mp1xx_rcc.h" #incl…

.netcore windows app启动webserver

创建controller: using Microsoft.AspNetCore.Mvc; using Microsoft.Extensions.Logging; using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Text.Json.Serialization; using System.Threading.Tasks;namespace MyWorker.…

安防监控/视频集中存储/云存储平台EasyCVR v3.3增加首页告警类型

安防监控/视频集中存储/云存储EasyCVR视频汇聚平台,可支持海量视频的轻量化接入与汇聚管理。平台能提供视频存储磁盘阵列、视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、平台级联、H.265自动转码等…

.netcore grpc客户端工厂及依赖注入使用

一、客户端工厂概述 gRPC 与 HttpClientFactory 的集成提供了一种创建 gRPC 客户端的集中方式。可以通过依赖包Grpc.Net.ClientFactory中的AddGrpcClient进行gRPC客户端依赖注入AddGrpcClient函数提供了许多配置项用于处理一些其他事项;例如AOP、重试策略等 二、案…

微服务中间件--分布式事务

分布式事务 a.理论基础1) CAP定理2) BASE理论 b.Seata1) XA模式1.a) 实现XA模式 2) AT模式3) TCC模式3.a) 代码实现 4) Saga模式5) 四种模式对比6) TC的异地多机房容灾架构 a.理论基础 1) CAP定理 分布式系统有三个指标: Consistency(一致性&#xff…