oms-Diffusion:用户可上传服装图片与参考姿势图进行试穿,解决服装行业高昂成本问题

        之前已经向大家介绍了很多关于虚拟试穿的项目,如谷歌的Tryon Diffusion, 阿里的Outfit Anyone, 亚马的Diffuse to Choose。东京大学的OOTDiffusion虚拟服装试穿工具。基于扩散模型的技术基本已经成为现在主流应用的基石。感兴趣的小伙伴可以点点击下面链接阅读~

        电商模特危机!谷歌最新模型Tryon Diffusion一键试衣,线上购物被革命

        AI一键换衣,阿里Outfit Anyone来了,电商人的福音!

        亚马逊虚拟试衣终于来了,Diffuse to Choose:为网购客户提供身临其境的虚拟试穿服务

        OOTDiffusion:一个可控的虚拟服装试穿工具,已开源,效果接近商用!

        今天向大家介绍一个新的开源项目oms-Diffusion,该项目致力于协助中小服装商家解决约拍模特导致的高昂成本问题。只需一张服装图片,可以生成各种身穿该服装的模特。支持IPadapter-faceID结合controlnet_openpose,用户可上传服装图片与参考姿势图进行试穿。一起来看下虚拟试穿的效果吧!

项目地址

https://github.com/ShineChen1024/oms-Diffusion?tab=readme-ov-fileicon-default.png?t=N7T8https://github.com/ShineChen1024/oms-Diffusion?tab=readme-ov-file

效果展示

IPadapter-faceID + controlnet_openpose demo

IPadapter-faceID demo 

generative demo 

controlnet demo (openpose, inpainting) 

 some unexpected funny application (need more effort) 

 

项目使用指导

1、默认的提示词是"a photography of a model", 你可以通过增加词汇像 "sunglasses" 或者 "red skirt" 来设定模特,或者把"model"换成"man"来指定性别,但是作者也不清楚它对最终的试衣结果有何影响。

2、512权重的默认的图像分辨率是(512,384),此分辨率可能会生成扭曲的面部。你可以增加图像分辨率来获得优秀的细节,但是有些情况会导致衣服失控,需要多次尝试不同随机种子才能得到较好的结果。

3、如果你发现衣服细节和你期望的对应不上,请尝试不同的随机种子。

4、guidance Scale来控制试衣服装的强度,但较大的值会导致图像失真。推荐2.0左右。

5、本项目内置了一个将服装从背景分离出来的权重,但是它可能不是最优的,如果你有更好的权重,像SAM,请替换它。

权重下载

该权重是一个实验性质的版本,在VITON-HD一万多张训练集(女模特,上半身,夏装,4:3分辨率)上训练,所以它对某些颜色或类别可能有所偏好。训练分辨率为(512,384),对较小的字体可能会导致模糊变形(在高分辨率下已解决)。下载地址如下:

https://huggingface.co/shinehugging/oms-diffusion

https://pan.baidu.com/s/1UJgARIfXyZz5AyLUWYEWgg?pwd=ae6f

我们在768分辨率上调优训练策略,增加模型分辨率,拓展衣服类别和模特类别,敬请期待。

安装运行

  1. Clone the repository

git clone https://github.com/chenshine1/oms-Diffusion.git

2.Create a conda environment and install the required packages

conda create -n oms-diffusion python==3.10
conda activate oms-diffusion
pip install torch==2.0.1 torchvision==0.15.2 numpy==1.25.1 diffusers==0.25.1 opencv-python==4.8.0  transformers==4.31.0 gradio==4.16.0 safetensors==0.3.1 controlnet-aux==0.0.6 accelerate-0.21.0

模型推理

1.python demo

python inference.py --cloth_path[your cloth path] --model_path[your model path]

2.gradio demo

python gradio_generate.py --model_path[your model path] 

        感谢你看到这里,也欢迎点击关注下方公众号,一个有趣有AI的AIGC公众号:关注AI、深度学习、计算机视觉、AIGC、Stable Diffusion,Sora等相关技术,欢迎一起交流学习💗~ 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/506440.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

LabVIEW光偏振态转换及检测仿真系统

LabVIEW光偏振态转换及检测仿真系统 随着光学技术的发展,光偏振态的研究与应用越来越广泛。为了深入理解光的偏振现象,开发了一套基于LabVIEW的光偏振态转换及检测仿真系统。该系统不仅能够模拟线偏振光、圆偏振光、椭圆偏振光等不同偏振态的产生与转换…

2024免费mac苹果电脑的清理和维护软件CleanMyMac X

对于 Mac 用户来说,电脑的清理和维护是一件让人头疼的事情。但是,有了 CleanMyMac X,这一切都将变得轻松愉快。CleanMyMac X 是一款专为 Mac 设计的电脑清理软件,它以其强大的功能和简单的操作,让无数用户为之倾倒。 C…

(二)逻辑回归与交叉熵--九五小庞

什么是逻辑回归 线性回归预测的是一个连续值,逻辑回归给出的“是”和“否”的回答 Singmoid sigmoid函数是一个概率分布函数,给定某个输入,它将输出为一个概率值 逻辑回归损失函数 平方差所惩罚的是与损失为同一数量级的情形&#xff0…

Sora核心之一:可变时长、分辨率、尺寸

Overview 一、总览二、摘要三、引言四、方法4.1、架构改动4.2、训练改变4.3、NaViT的效率 NaViT 一、总览 题目: Patch n’ Pack: NaViT, a Vision Transformer for any Aspect Ratio and Resolution 机构:Google DeepMind 论文: https://arxiv.org/pdf/2307.06304…

代码随想录day10(2)字符串:反转字符串Ⅱ (leetcode541)

题目要求:给定一个字符串 s 和一个整数 k,从字符串开头算起, 每计数至 2k 个字符,就反转这 2k 个字符中的前 k 个字符。如果剩余字符少于 k 个,则将剩余字符全部反转。如果剩余字符小于 2k 但大于或等于 k 个,则反转前…

#WEB前端(CSS基础)

1.实验&#xff1a;HTML是网页骨架&#xff0c;CCS是网页装修 2.IDE&#xff1a;VSCODE 3.记录&#xff1a; style 4.代码&#xff1a; <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"view…

SUV也卷起来了?零跑C10上市12.88万元起

2024年新春伊始&#xff0c;汽车市场的价格大战便此起彼伏&#xff0c;好不热闹。而一向以“卷王”闻名业界的零跑&#xff0c;也在这时候给钟爱SUV的消费者送上了一个巨大的惊喜。 3月2日&#xff0c;零跑C10暨24年新品全家桶焕新发布会在杭州盛大召开。作为零跑LEAP 3.0技术架…

从C向C++9——typeid和RTTI

一.typeid运算符 1.语法 typeid 运算符用来获取一个表达式的类型信息。类型信息对于编程语言非常重要&#xff0c;它描述了数据的各种属性&#xff1a; 对于基本类型&#xff08;int、float 等C内置类型&#xff09;的数据&#xff0c;类型信息所包含的内容比较简单&#xf…

trivy扫描出了mvn dependency:tree中不存在的jar

Dependency appears in Trivy but not when running maven tree. #2287 Dependency appears in Trivy but not when running maven tree. Issue #2287 aquasecurity/trivy GitHub 方法&#xff1a; step 1: 用这个命令&#xff0c;可以打印出详细的路径 trivy -d rootfs…

MySQL数据库运维第一篇(日志与主从复制)

文章目录 一、错误日志二、二进制日志三、查询日志四、慢查询日志&#xff08;记录超时的sql语句&#xff09;五、主从复制概括六、主从复制原理七、搭建主从复制八、主从复制的测试 在这篇深入的技术文章中&#xff0c;作者将以明晰透彻的方式详细介绍MySQL数据库中关键的日志…

CSM是什么意思?

CSM(Customer Service Management)是企业客户服务管理的信息化&#xff08;IT&#xff09;解决方案架构。本着以客户为中心的管理理念&#xff0c;搭建企业客户服务管理平台&#xff0c;实现企业以客户为中心的管理时代的竞争战略。 CSM的核心是以客户为中心&#xff0c;实现对…

Vins-Moon配准运行

Vins-Moon运行 源码地址电脑配置环境配置编译适配Kitti数据集运行结果Euroc数据集kitti数据集 evo评估&#xff08;KITTI数据&#xff09;输出轨迹(tum格式)结果 源码地址 源码链接&#xff1a;https://github.com/HKUST-Aerial-Robotics/VINS-Mono.git 电脑配置 Ubuntu 18.…