milvus基础

news/2024/11/13 9:30:46/文章来源:https://www.cnblogs.com/knxhd/p/18371392

nlist和nprobe

  • nlist 是调用 create_index 时设置的参数,nprobe 则是调用 search 时设置的参数。
  • IVFLAT 和 SQ8 索引都是通过聚类算法把大量的向量划分成很多‘簇’(也可以叫‘桶’),
  • nlist 指的就是聚类时划分桶的总数。
  • 通过索引查询步骤
    1. 第一步先找到和目标向量最接近的若干个桶(nprobe:若干个桶的数量)
    2. 若干个桶里通过比较向量距离查找出最相似的 k 条向量。
  • nlist越大,也就是建立索引时,划分桶的数量越多,同时每个桶中的向量数量越少
    • 查询时,比较的向量越少,结果就是:性能和速度越好;准确率越低
    • nlist官方推荐为 4*sqrt(n),其中,n表示向量的个数
  • nprobe越大,则比较的桶和向量越多,结果就是:性能和速度相对越低,准确率越高

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/784812.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

查询硬盘序列号的参考方案

经常有客户来电,一般是公司it或资产管理部门,来询问硬盘序列号, 打开cmd

深化物料管理:APS软件系统在齐套率优化中的实践

精确的需求预测 APS系统会深度挖掘企业的历史销售数据,这些数据包含销售数量记录、季节性波动、产品生命周期、促销活动影响等多维度信息。通过搭建分析模型,系统能够识别出不同产品在不同时间段内的需求模式,并据此预测未来几个月甚至更长时间的物料需求,为生产计划和采购…

深入理解Linux内核进程的管理与调度

一,前戏 1.1 进程调度 内存中保存了对每个进程的唯一描述, 并通过若干结构与其他进程连接起来. 调度器面对的情形就是这样, 其任务是在程序之间共享CPU时间, 创造并行执行的错觉, 该任务分为两个不同的部分, 其中一个涉及调度策略, 另外一个涉及上下文切换. 1.2 进程的分类 li…

python 调用通义千问SDK API

前言通义千问在线AI助手:https://tongyi.aliyun.com/qianwen/通义千问官网文档地址:https://help.aliyun.com/zh/dashscope/developer-reference/ (通义千问2024.4.26 更新 模型的API-KEY收费,非限时免费开放模型,有使用Token数量的限制)支持python 3.8或以上版本配置流程…

rocky8中安装aspera软件

001、系统[liujiaxin01@PC1 ~]$ cat /etc/redhat-release Rocky Linux release 8.10 (Green Obsidian) 002、下载安装包(下载的4.2.12版本)[liujiaxin01@PC1 aspera]$ wget -c https://d3gcli72yxqn2z.cloudfront.net/downloads/connect/latest/bin/ibm-aspera-connect_4.2.…

DevEco Studio 调试三方库源码

有相关的官方文档:https://developer.huawei.com/consumer/cn/doc/harmonyos-faqs-V5/faqs-app-debugging-26-V5实操: 将编译好的三方库文件和符号文件整理好在工程中添加对库文件的使用,一般是将库文件放到 libs/arm64-v8a 下 点击顶栏的选项,Run->Edit Configurations…

centos7中aspera软件的安装

001、查看系统[liujiaxin01@PC1 aspera]$ cat /etc/redhat-release CentOS Linux release 7.6.1810 (Core) 002、下载安装包[liujiaxin01@PC1 aspera]$ ls [liujiaxin01@PC1 aspera]$ wget -c https://download.asperasoft.com/download/sw/connect/3.8.3/ibm-aspera-connect-…

车载以太网交换机入门基本功(3)—VLAN 转发

本文将介绍携带Tag报文在VLAN下的转发过程。而在实际转发过程中,交换机的端口属性起到关键作用。 在《车载以太网交换机入门基本功(2)》中提到,报文通过携带Tag字段,表明报文所属的VLAN。本文将介绍携带Tag报文在VLAN下的转发过程。而在实际转发过程中,交换机的端口…

【2】Kaggle 医学影像数据读取

赛题名称:RSNA 2024 Lumbar Spine Degenerative Classification 中文:腰椎退行性病变分类 kaggle官网赛题链接:https://www.kaggle.com/competitions/rsna-2024-lumbar-spine-degenerative-classification/overview 文章安排①、如何用python读取dcm/dicom文件 ②、基于matp…

文章自然润色 API 数据接口

文章自然润色 API 数据接口 ai / 文本处理 基于 AI 的文章润色 专有模型 / 智能纠错。1. 产品功能基于自有专业模型进行 AI 智能润色 对原始内容进行智能纠错 高效的文本润色性能 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3); 全面兼容 Apple ATS; 全国多节点 CDN 部…

知名开源工具被用于诈骗,作者无奈清空代码。。

开发者表示,因为自己的开源项目被诈骗份子使用,导致自己被跨省,所以永久删除本项目源代码。小道消息,知名开源下载工具 Aria 的开发者最近删除了整个 GitHub 仓库的源代码,并且在项目介绍文件中留下了这样一段话:开发者表示,因为自己的开源项目被诈骗份子使用,导致自己…