【模型部署】vLLM 部署 Qwen2-VL 踩坑记 03 - 多图支持和输入格式问题

news/2024/12/26 2:05:42/文章来源:https://www.cnblogs.com/fasterai/p/18553752

【模型部署】vLLM 部署 Qwen2-VL 踩坑记 03 - 多图支持和输入格式问题

NLP Github 项目：

NLP 项目实践：fasterai/nlp-project-practice

介绍：该仓库围绕着 NLP 任务模型的设计、训练、优化、部署和应用，分享大模型算法工程师的日常工作和实战经验
AI 藏经阁：https://gitee.com/fasterai/ai-e-book

介绍：该仓库主要分享了数百本 AI 领域电子书
AI 算法面经：fasterai/nlp-interview-handbook#面经

介绍：该仓库一网打尽互联网大厂NLP算法面经，算法求职必备神器
NLP 剑指Offer：https://gitee.com/fasterai/nlp-interview-handbook

介绍：该仓库汇总了 NLP 算法工程师高频面题

其他细节（非常重要）

多图支持问题

多张图片请求失败，状态码400：

在启动命令中添加多图支持的参数：

nohup python -m vllm.entrypoints.openai.api_server --served-model-name Qwen2-VL-7B-Instruct --model Qwen/Qwen2-VL-7B-Instruct --limit-mm-per-prompt image=5 > ./logs/output.log 2>&1 &

重新启动服务：

多图请求成功：

输入格式问题

本地推理：

vllm部署：

系列文章：

【模型部署】vLLM 部署 Qwen2-VL 踩坑记 01 - 环境安装
【模型部署】vLLM 部署 Qwen2-VL 踩坑记 02 - 推理加速
【模型部署】vLLM 部署 Qwen2-VL 踩坑记 03 - 多图支持和输入格式问题

本文由mdnice多平台发布

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/836407.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

centos7创建逻辑卷

1.fdisk /dev/sdb 创建分区 2. p:查看分区 n:创建新分区 p (1-4):1输入起始号码 2048开始扇区 +1600M结束扇区 w保存 3. l 查看分区类型 8e 设置成lvm格式。 4.创建物理卷 pvcreate /dev/sdb1 查看物理卷 pvdisplay /dev/sdb15. 创建卷组 vgcreate npgroup /dev/sdb1 （npg…

Chunkr: 在线PDF文档解析与OCR工具

介绍 1 版面分割模型这部分属于另一个项目（pdf-document-layout-analysis）的内容，可以移步查看具体模型的介绍和训练过程。 1.1 机器学习模型基于LIGHTGBM算法，并且只需要使用CPU资源，因此对硬件要求不高，速度快，但是只能处理文字类型的PDF。 1.2 VGT模型能处理图片P…

关于一些哈希

关于一些简单但我不会的哈希随缘更新，但考虑到马上要退役，毕业前应该没机会力。求字符串的最长公共前缀标准空间复杂度：\((\sum_i |s_i|)\)，但根据具体场景通常可以缩小至\(O(n)\)。时间复杂度：\(O(\sum_i |s_i|)\)预处理，\(O(\log min(|s_i|,|s_j|))\)求两字符串的最…

NFLS 图论题单笔记（完结）

John的农场是一张 N*N 的方格图，贝茜住在左上角（1,1），John住在右下角（N,N）。现在贝茜要去拜访John，每次都只能往四周与之相邻的方格走，并且每走一步消耗时间 T。同时贝茜每走三步就要停下来在当前方格吃草，在每个方格吃草的用时是固定的，为 H[i][j]。 John想知道贝…

基于Java+SSM+JSP+MYSQL实现的宠物领养收养管理系统功能设计与实现七

基于SSM整合maven开发的一款宠物收养领养管理系统附带源码指导运行视频，该项目前端模板是借鉴别人的，自己写的后台代码，该系统分为前台和后台，前台功能有：登录注册、领养中心、活动中心等。后台管理员功能有：用户管理、宠物管理、活动管理、领养管理、志愿者管理等。该项…

例子 class CTest {char a;int b;double c; };int main() {cout << sizeof(CTest) << endl;return 0; }输入命令 cl ConsoleApplication1.cpp /d1reportSingleClassLayoutCTest其中ConsoleApplication1.cpp 表示这个例子所在的cpp文件名 /d1reportSingleClassLayou…

CUBEMX配置

遥控器配置 cubemx配置在 Connectivity 标签页下将 USART3 打开,将其 Mode 设置为 Asynchronous 异步通讯方式将其波特率设置为 100000，数据帧设置为9位数据位（实测8位有错误），单校验位，1 位停止位接着开启USART3 的 DMA 功能，在 USART3 下找到 DMA Settings 标签呀，在 …

GPR模型的一些高斯原理介绍

一、几个概念区分：高斯的几个概念：高斯分布（Gaussian Distribution）：高斯分布是统计学中最常见的概率分布之一，也称为正态分布。它具有钟形曲线的形状，由两个参数决定：均值（mean）和方差（variance）。高斯分布在自然界和工程应用中经常出现，其形状由均值和方差决定…

20222411 2024-2025-1 《网络与系统攻防技术》实验六实验报告

1.实验内容 1.1 实践内容（1）前期渗透 ①主机发现（可用Aux中的arp_sweep，search一下就可以use） ②端口扫描：可以直接用nmap，也可以用Aux中的portscan/tcp等。 ③选做：也可以扫系统版本、漏洞等。（2）Vsftpd源码包后门漏洞（21端口）漏洞原理：在特定版本的vsftpd服务…

如何控制java虚拟线程的并发度？

jdk 21中的虚拟线程已经推出好一段时间了，确实很轻量，先来一段示例：假如有一段提交订单的业务代码：1 public void submitOrder(Integer orderId) { 2 sleep(1000); 3 System.out.println("order:" + orderId + " is submitted");…