最近看新闻博客说零一科技的Yi-VL-Plus视觉大模型效果很不错,那就想着尝尝鲜。这是第四篇关于视觉大模型的博客。之前有写过一篇零一科技的chat大模型
一、环境搭建
1、模型下载
git clone
2、代码下载
git clone
3、安装环境
docker run -it -v /datas/work/zzq/:/workspace --gpus=all pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel bash
cd /workspace/Yi-vl/Yi/VL
pip install -r requirements.txt -i
二、代码运行
1、接口运行
python single_inference.py --model-path model/Yi-VL-6B/ --image-file images/cats.jpg --question "Describe the cats and what they are doing in detail."
报错,显卡不支持格式,修改如下:
继续运行
2、命令行交互
python cli.py --model-path model/Yi-VL-6B/ --image-file images/cats.jpg
报错,显卡不支持格式,修改如下: