闲聊从零开发一个2D数字人流程实战

  • .2D数字人技术
  1. 百度,腾讯,等大厂都有自己的数字平台制作(套壳:api+后台转发+vue前端),国外也有出名的heygen(非常厉害一个)
  2. 通过开源项目组合实现,再打通每个项目已api的形式提供调用。
  1. 对口型
  2. 不对口型

  • 组合形式(ai 项目总结)
  1. 素材准备

a.1张图片或者自己拍摄一个短10秒钟视频(图片效果肯定没有视频好)

b.全新制作一个不存在现实的数字人(制作)

2.全新数字人形象制作。

  (1)技术软件:Stable_Diffusion或者Fooocus

选择:Fooocus  (对标sd,使用简单,对机器要求不高!)

      GitHub - lllyasviel/Fooocus: Focus on prompting and generating  

      提示词:Beautiful girl with a clear front and face

获得一张形象图片保存好。

Ai软件安装流程大多(每个人遇到问题都可能不一样,使用系统不一样):

conda create -n 名称xx python=xxx

conda activate 名称xx

安装torch touchversion 这里要注意电脑有cuda的可以到

Start Locally | PyTorch 上下载对应的torch 安装 例如下面:pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

安装环境: pip isntall -r requirements.txt

遇到问题:

0.先到项目git的Issues上面查找,一般都能找到。

1.GPT等工具查找问题

2.google或者百度

3.技术群询问

  1. .10秒视频准备。
  1. 可以自己拍摄(必须是脸部清晰)
  2. 去网站上面找,这里就找了韩国美女。

    

  1. .换脸:把之前虚拟图片脸换到视频上

技术选型:facefusion

GitHub - facefusion/facefusion: Next generation face swapper and enhancer

  1. .高清修复。

   技术选型:CodeFormer

   GitHub - sczhou/CodeFormer: [NeurIPS 2022] Towards Robust Blind Face Restoration with Codebook Lookup Transformer

  1. 剪影工具裁剪出稳定脸部清晰的2到3帧再拼接成10秒视频,需要注意就是拼接时候要反向合并视频。

  1. 语音克隆。

   技术选型有2种,

  1. GitHub - Plachtaa/VITS-fast-fine-tuning: This repo is a pipeline of VITS finetuning for fast speaker adaptation TTS, and many-to-many voice conversion
  2. https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI

选择:RVC  原因就是效果比较好,这样需要知道就是现在语音克隆有两种在底模训练好情况下:

一种是Text-to-speed 也就是文字到语音,测试下来效果不太稳定,10句同样文字输出速率都有可能不一样!

第二种RVC,speed-to-speed 语音到语音,比较稳,但是这里就要多做一步文字转语音再转,这里推荐使用微软免费tts,多国语言选择参考:https://github.com/rany2/edge-tts

pip install edge-tts

edge-tts --voice zh-CN-YunxiNeural --rate=-4% --text "hello 大家好" --write-media hello1.mp3

速度其实和第一种区别不大,RVC转换很快。

  1. 对口型video-retalking

GitHub - OpenTalker/video-retalking: [SIGGRAPH Asia 2022] VideoReTalking: Audio-based Lip Synchronization for Talking Head Video Editing In the Wild

  1. 通过上面的项目进行串联使用api形式进行调用(暂无)。

输入文字=》tts==>RVC  ==>video-retalking==>视频

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/179703.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis概述

Redis是一款NoSql(非关系型)数据库,实现了主从同步。 使用场景: 对数据高并发的读写。 海量数据的读写。 对数据的可扩展性的。 NoSql数据库举例: Memcache:数据都在内存中,但是数据不持久化,而且只支…

ChatGPT助力高效办公——神奇的效率工具Airy

Airy是一款免费而又强大的高效办公软件,用户可以通过快捷键和丰富的内置插件,充分发挥GPT-3.5模型的强大功能,轻松实现搜索、翻译、文本生成与写作、文本概括与总结,同时还可以作为一款日程提醒工作,记录和提醒每天要做…

python之 flask 框架(2)项目拆分的 执行逻辑

项目的结构图 app.py # 导入__init__.py 比较特殊 from APP import create_appapp create_app() if __name__ __main__:app.run(debugTrue)init.py # __inti__.py # 初始化文件,创建Flask应用 from flask import Flask from .views import bluedef create_ap…

基于MS16F3211芯片的触摸控制灯的状态变化和亮度控制(11.15)

1.任务所需实现基本功能 关机状态时白灯亮蓝灯灭,此时长按按键无反应,白灯亮度降低的状态,蓝灯保持灭的状态。点按按键一次,白灯熄灭,蓝灯亮此时W引脚控制的灯亮。继续点按按键。蓝灯亮,此时W引脚控制的灯…

vue中ref的用法

vue中ref的用法 在项目中使用ref时有时候直接取值,有时候返回的却是一个数组,不知其中缘由,后查了一下ref用法,所以总结一下. 1.绑定在dom元素上时&#xff0c;用起来与id差不多&#xff0c;通过this.$refs来调用: <div id"passCarEchart" ref"passCarEch…

HDR 成像技术学习(四)

HDR(High Dynamic Range,高动态范围)仿佛是成像领域永恒的话题,动态范围越大,图像能清晰呈现的明暗差别也就越大。与传统的SDR(标准动态范围)相比,HDR图像能够以更高质量同时显示画面的亮部和暗部。 随这些年CMOS图像传感器工艺技术进步,以及后端数字信号处理算力的提升…

如何挑选护眼灯?光照均匀度、色温、眩光这3点!

光照环境对我们的生活质量影响深远&#xff0c;尤其在孩子的成长过程中&#xff0c;良好的光照环境对其学习效率、视力保护都至关重要。光照中的很多因素都对视力有着或大或小的影响&#xff0c;本文将从光照均匀度、眩光、色温三个关键点&#xff0c;深入浅出地让消费者了解其…

第28章_mysql缓存策略

文章目录 MySQL缓存方案目的分析缓存层作用举例 缓存方案选择场景分析 提升MySQL访问性能的方式MySQL主从复制读写分离连接池异步连接 缓存方案缓存和MySQL一致性状态分析制定读写策略 同步方案canalgo-mysql-transfer 缓存方案的故障问题及解决缓存穿透缓存击穿缓存雪崩缓存方…

TOUGH系列软件教程

查看原文>>>全流程TOUGH系列软件实践技术应用 TOUGH系列软件是由美国劳伦斯伯克利实验室开发的&#xff0c;旨在解决非饱和带中地下水、热运移的通用模拟软件。和传统地下水模拟软件Feflow和Modflow不同&#xff0c;TOUGH系列软件采用模块化设计和有限积分差网格剖分…

Python 获取北上广深历史天气数据并做数据可视化

嗨喽&#xff0c;大家好呀~这里是爱看美女的茜茜呐 知识点: 动态数据抓包 requests发送请求 结构化非结构化数据解析 开发环境: python 3.8 运行代码 pycharm 2022.3.2 辅助敲代码 专业版 requests 发送请求 pip install requests parsel 解析数据 pip install parsel …

k8s之Helm

理论&#xff1a; 什么是 He lm 在没使用 helm 之前&#xff0c;向 kubernetes 部署应用&#xff0c;我们要依次部署 deployment、svc 等&#xff0c;步骤较繁琐。 况且随着很多项目微服务化&#xff0c;复杂的应用在容器中部署以及管理显得较为复杂&#xff0c;helm 通过打包…

微信公众号会员系统怎么做

一、引言 在这个信息爆炸的时代&#xff0c;微信公众号已经成为了企业和个人品牌的重要宣传阵地。而在公众号运营过程中&#xff0c;会员系统是非常重要的一环。通过建立会员系统&#xff0c;你可以更好地管理粉丝、提升用户黏性&#xff0c;让你的品牌更加强大。本文将为你详…