IDM-VTON可以实现一键对照片内的模特进行换装
视频版:
0. 部署环境:
Git :版本随意
Python :3.10.6 (牛哥一直推荐的版本)
PIP :常规安装即可
显卡驱动 :456.12
CUDA :12.3
相关安装包都已放网盘
1. 克隆代码
git工程:
https://github.com/yisol/IDM-VTON
git clone https://github.com/yisol/IDM-VTON.git
不想Clone的直接选择下载代码zip也可以:
后续的团队新工程:
https://github.com/rlawjdghek/StableVITON
2. 下载模型等资源:
git工程:
https://github.com/shadow2496/VITON-HD
模型文件:
https://huggingface.co/yisol/IDM-VTON/tree/main
可以知下载下面这三个目录,其他的会自动下载:
3. 创建虚拟环境:
有效避免环境依赖库的版本冲突
python -m venv venv
创建之后,加载:
./venv/Script/activate
4. 配置torch:
与我们惯用的torch版本一致:
pip install torch==2.2.2+cu121 torchvision==0.17.2+cu121 torchaudio==2.2.2+cu121 --index-url https://download.pytorch.org/whl/cu121
5. 安装依赖:
工程默认是 conda 支持的,考虑能少一层环境就简单一点的原则,我把相关依赖转成了pip依赖,执行以下命令安装:
pip install -r requeirment.txt
6. 启动Gradio APP:
python ./gradio_demo/app.py
启动之后,会自动继续下载相关资源,文件有大有小,最大的12G,一共要下载30几个G……,等待完成即可:
如果是中国国内网络,有个速度好的代理非常重要
7. 使用示例进行运行:
我使用自带的模特进行测试,速度超级慢,跑了有接近十分钟才处理完,我确认显卡加速是正常的,不太清楚是就是这个样子,还是说我哪里没弄对,下图为基本的资源占用情况,显卡,显存,内存基本都是满的了,CPU倒是还好。
整个项目跑了 1844.3s,感觉有点闹啊,目前看加速也都正常工作的,可能还是哪里有问题
本期内容相关资源:
123网盘
https://www.123pan.com/s/r11hTd-b2wsv.html
提取码:NIGG
Google Drive
https://drive.google.com/drive/folders/1-AbrPv09a7YRTYM4Od_Byvc8UqqQj0J1?usp=drive_link
百度云
链接:https://pan.baidu.com/s/1pWaziAC7xMV908TuOkYdyw?pwd=niug
提取码:niug