ModaHub AI模型社区:向量数据库CPU 版 Milvus和GPU 版 Milvus 版本比较

目录

CPU 版 Milvus 版本比较

概述

CPU 版 Milvus 支持的索引类型

浮点型向量

二值型向量

GPU 版 Milvus 版本比较

概述

GPU 版 Milvus 支持的索引类型

浮点型向量

二值型向量


CPU 版 Milvus 版本比较

概述

Milvus 提供两个发行版本:CPU 版本和 GPU 版本。

  • CPU 版 Milvus 仅支持使用 CPU 建索引和搜索。
  • GPU 版 Milvus 在 CPU 版的基础上进行了 GPU 加速:支持同时进行索引创建和搜索计算以提高查询效率。你可以在同一时间内使用 GPU 建索引,使用 CPU 搜索向量。

如果你的计算机上安装了支持 CUDA 功能的 GPU 设备,你可以安装 Milvus 的 GPU 版本以获取针对海量数据的更优的查询性能。

CPU 版 Milvus GPU 版 Milvus

CPU 版 Milvus 支持的索引类型

Milvus 会根据不同的向量类型提供不同的索引支持。请根据你的向量类型查看适用于你的索引:

浮点型向量

索引类型

CPU 建索引

GPU 建索引

CPU 搜索

GPU 搜索

FLAT

N/A

N/A

✔️

IVF_FLAT

✔️

✔️

IVF_SQ8

✔️

✔️

IVF_PQ

✔️

✔️

RNSG

✔️

✔️

HNSW

✔️

✔️

ANNOY

✔️

✔️

二值型向量

索引类型

CPU 建索引

GPU 建索引

CPU 搜索

GPU 搜索

FLAT

N/A

N/A

✔️

IVF_FLAT

✔️

✔️


GPU 版 Milvus 版本比较


概述


Milvus 提供两个发行版本:CPU 版本和 GPU 版本。
●CPU 版 Milvus 仅支持使用 CPU 建索引和搜索。
●GPU 版 Milvus 在 CPU 版的基础上进行了 GPU 加速:支持同时进行索引创建和搜索计算以提高查询效率。你可以在同一时间内使用 GPU 建索引,使用 CPU 搜索向量。
如果你的计算机上安装了支持 CUDA 功能的 GPU 设备,你可以安装 Milvus 的 GPU 版本以获取针对海量数据的更优的查询性能。


CPU 版 Milvus GPU 版 Milvus


GPU 版 Milvus 支持的索引类型


Milvus 会根据不同的向量类型提供不同的索引支持。请根据你的向量类型查看适用于你的索引:


浮点型向量

索引类型

CPU 建索引

GPU 建索引

CPU 搜索

GPU 搜索

FLAT

N/A

N/A

✔️

✔️

IVF_FLAT

✔️

✔️

✔️

✔️

IVF_SQ8

✔️

✔️

✔️

✔️

IVF_SQ8H

✔️

✔️

✔️

✔️

IVF_PQ

✔️

✔️

✔️

✔️

RNSG

✔️

✔️

HNSW

✔️

✔️

ANNOY

✔️

✔️

●CPU 和 GPU 创建的索引完全一致,只是一般情况下 GPU 的创建索引速度快于 CPU 的创建速度。
●top_k > 2048 时,Milvus 由 GPU 查询切换为 CPU 查询。
●nprobe > 2048 时,Milvus 由 GPU 查询切换为 CPU 查询。


二值型向量

索引类型

CPU 建索引

GPU 建索引

CPU 搜索

GPU 搜索

FLAT

N/A

N/A

✔️

IVF_FLAT

✔️

✔️


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/341.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unix/Linux编程:UDS 流(Stream)

〇、前言 socket 是一种 IPC (Inter-Process Communication,进程间通信)方法,它允许位于同一主机(计算机)或使用网络连接起来的不同主机上的应用程序之间交换数据。通过使用Socket,开发人员可以…

解决不允许一个用户使用一个以上用户名与一个服务器或共享资源的多重连接的问题

问题概述: 用windows server 2012 r2 vl x64搭了个文件服务器,在使用时有个问题,老是用户登录有问题,提示“不允许一个用户使用一个以上用户名与一个服务器或共享资源的多重连接”。出现的原因不详,网上也没查到合理的…

路由器的工作原理详解

什么叫路由? 路由器的英文是 Router,也就是「找路的工具」。找什么路?寻找各个网络节点之间的路。 换句话说,路由器就像是快递中转站,包裹会经过一个个的中转站,从遥远的地方寄到你家附近,数据…

基于深度学习的高精度袋鼠检测识别系统(PyTorch+Pyside6+YOLOv5模型)

摘要:基于深度学习的高精度袋鼠检测识别系统可用于日常生活中或野外来检测与定位袋鼠目标,利用深度学习算法可实现图片、视频、摄像头等方式的袋鼠目标检测识别,另外支持结果可视化与图片或视频检测结果的导出。本系统采用YOLOv5目标检测模型…

【软件开发】MyBatis 理论篇

MyBatis 理论篇 1.MyBatis 是什么? MyBatis 是一个半 ORM(对象关系映射)框架,它内部封装了 JDBC,开发时只需要关注 SQL 语句本身,不需要花费精力去处理加载驱动、创建连接、创建 statement 等繁杂的过程。…

【机器学习】sklearn数据集的使用,数据集的获取和划分

「作者主页」:士别三日wyx 「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 sklearn数据集 二、安装sklearn二、获取数据集三、…

用Docker部署Nginx

部署步骤: 1.拉取镜像 docker pull nginx 2.创建并进入容器 docker run -d --name nginx01 -p 3344:80 nginx #注意nginx01是起的名字,3344是公网访问的端口,80是Nginx的默认端口 3.启动Nginx curl localhost:3344 4.在我的windows系统访…

(贪心) 1221. 分割平衡字符串 ——【Leetcode每日一题】

❓ 1221. 分割平衡字符串 难度:简单 平衡字符串 中,L 和 R 字符的数量是相同的。 给你一个平衡字符串 s,请你将它分割成尽可能多的子字符串,并满足: 每个子字符串都是平衡字符串。 返回可以通过分割得到的平衡字符…

【杨宗宝】Cocos Creator 3.x : 你们要的Label3D来了(升级版)

前沿 宗宝我又回来了,本次给大家带来的分享是基于之前Label3d的升级版;在上次发布了Lable3d的功能后,大家在使用的过程中多多少少的会发现各种问题:微信小游戏真机不显示,字体如何实现描边,引擎版本升级后…

本地部署开源大模型的完整教程:LangChain + Streamlit+ Llama

在过去的几个月里,大型语言模型(llm)获得了极大的关注,这些模型创造了令人兴奋的前景,特别是对于从事聊天机器人、个人助理和内容创作的开发人员。 大型语言模型(llm)是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型…

【Java】JVM学习(四)

对象的分配 JVM中对象的创建过程 对象的内存分配 虚拟机遇到一条new指令时,首先检查是否被类加载器加载,如果没有,那必须先执行相应的类加载过程。 类加载就是把class加载到JVM的运行时数据区的过程。 1)检查加载 首先检查这…

低功耗蓝牙OM6621EM 兼容Nordic 51系列2.4G私有协议

OM6621EM是一个功率优化的系统(SOC).解决蓝牙低功耗和专有的2.4 ghz应用。它集成了一个高具有蓝牙基带和丰富外设的低功耗射频收发器I0扩展。OM6621EM还集成了电源管理单元(PMU)来提供高效的电源管理。它的目标是2.4GHz低功耗蓝牙系统,专有的2.4 ghz系统&#xff0c…