向量检索服务产品规格

news/2025/2/22 2:36:44/文章来源:https://www.cnblogs.com/DashVector/p/18567426

本文介绍向量检索服务DashVector的产品规格,以帮助用户选择贴合自身业务场景的实例规格。

实例类型

向量检索服务DashVector当前支持三种四种实例(Cluster)类型,以支持不同的业务场景和需求:

  • 性能型 :适用于查询QPS高、查询延迟低的场景,同时性能型也是写入效率最高的实例类型。对于高并发、大流量、低延迟场景,或对写入效率有较高的要求的场景,可选择性能型实例。

  • 存储型(推荐) :存储型相对于性能型有5倍的存储容量优势,能够存储和管理更多的向量数据,适用于大规模数据量的场景。存储型实例同样也具备优秀的技术指标, 可满足大部分场景需求 ,同时也是 性价比最高 的实例类型,推荐用户选择使用。

  • Serverless型: 不限数据容量,基于用户数据自动扩缩,按实际请求收费,适用于低频QPS查询(QPS<2),延迟不敏感等场景。总体性能与存储型实例接近。

  • 免费试用 :适用于测试、体验场景, 请勿用于线上生产环境 。免费试用实例有效期为1个月,到期后可再次申请试用。免费实例有部分试用限制,详情可参考约束与限制。

重要

免费试用实例有效期为1个月,到期后免费试用实例将自动释放,实例中的数据将被全部删除并清空且不可恢复,为了保证实例可持续使用,请您于创建免费试用实例之后的30个自然日内将免费试用实例升级为付费实例。免费试用实例由于到期且没有升级为付费实例而导致的数据被删除的情况,阿里云将不承担相关责任。

实例规格

向量检索服务DashVector针对性能型和存储型实例提供不同档位的实例(Cluster)规格,不同规格的主要区别在于存储容量的不同。Serverless实例与已有性能型和存储型不同,无容量限制。

说明

若您有更高规格需求,或有任何反馈、期望获取更多技术支持,欢迎通过如下方式联系我们:

  • 官方钉钉群:25130022704

  • 技术支持邮箱:dashvector@service.aliyun.com

存储容量参考

重要

  1. 以上数据均已通过实际测试验证,但仅供参考!

  2. 上述用于容量测试的 Doc中不包含任何Fields,仅包含主键和向量数据 ,主键为从零开始自增正整数转字符串。大部分实际生产场景中,Fields是不可或缺的,Fields数据同样会占用存储空间,从而导致实际存储的Doc数低于上述表格。

检索性能参考

重要

  1. 以上数据为基于Cohere数据集实测结果,但由于不同数据集的数据分布对性能有影响,上述数据仅供参考。

  2. 上述用于性能测试的 Doc中不包含任何Fields,仅包含主键和向量数据 ,主键为从零开始自增正整数转字符串。

  3. 向量检索服务DashVector会定时在后台进行向量索引优化,通常在写入完成后4小时完成,届时性能达到最优状态。

  4. 不同规格在写满数据情况下,QPS与上述表格中保持一致或更高,不因数据量的增加而下降。如,P.2xlarge规格,在写满2百万768维FP32向量数据情况下,topk=100的QPS可达到600+。

副本数

向量检索服务DashVector支持调整副本数,可选范围为1-5。副本之间数据完全相同,副本数越大,可支持的QPS越高,呈线性关系。同时副本数越大,服务可用性越高, 建议对可用性有较高要求的生产环境选择>=2的副本数 。{#4d1b3cb1c1c9m}
说明

  • 需要注意,副本数的增加和减少不会影响存储容量,仅影响QPS和可用性。

  • Serverless实例无副本概念,由系统管理。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/840840.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

记录一个Linux代码移植到Windows平台下的Visual Studio 2022的代码编码格式的问题

一、前言 工作上与公司的前辈对接,他给了我一份在linux下面编写的代码压缩包,按照道理来说使用条件宏编译不同的windows和linux的API即可实现代码的通用。但是我在Visual Studio 2022下面编译的时候缺发生了非常奇怪的事情。随便编译就出现很多报错,但实际上这些报错并不是真…

CPU使用率和负载区别及分析

当我们使用top命令查看系统的资源使用情况时会看到 load average,如下图所示。它表示系统在1、5、15分钟的平均工作负载。那么什么是负载(load)呢?它和CPU的利用率又有什么关系呢?load average:系统平均负载是CPU的Load,它所包含的信息不是CPU的使用率状况,而是在一段时间…

高并发下单例模式的线程安全探索

单例模式是常用的软件设计模式之一,同时也是设计模式中最简单的形式之一,在单例模式中对象只有一个实例存在。 单例模式的实现方式有两种,分别是懒汉式和饿汉式。1、饿汉式 饿汉式在类加载时已经创建好实例对象,在程序调用时直接返回该单例对象即可,即在编码时就已经指…

分组向量检索

本文介绍如何在向量检索时将结果按照字段值进行分组返回。本文介绍如何在向量检索时将结果按照字段值进行分组返回。 背景介绍 在向量检索的实际应用中,有些场景需要将向量检索的结果分组返回。例如:在RAG中,一篇文档往往需要拆分为多个段落,每个段落生成一个向量存入DashV…

【触想智能】工业一体机在工业机器视觉领域应用的特点与注意事项

随着工业化的进程和技术的不断发展,工业机器视觉成为现代工业生产中不可或缺的一部分。作为工业机器视觉技术的核心组件之一,工业一体机因其便携、集成度高和易于操作的特点,在工业机器视觉应用中得到广泛应用。触想工业一体机TPC-W500系列一、工业一体机在工业机器视觉领域…

WPF笔记2——路由事件

WPF的路由事件(Routed Events),允许事件在UI元素层次结构中传播。 在WPF中,UI元素被组织成一棵树,成为可视化树(Visual Tree)。 当一个事件(如鼠标点击)在某个控件上触发时,这个事件可以沿着Visual Tree向上(向树的根部)或向下(向树的枝叶)传播;如果不广播就是直…

vxe-table 秒级渲染万级数据、极致流畅横向虚拟滚动与纵向虚拟滚动+自适应动态行高

官网:https://vxetable.cn/ 以前老版本不支持虚拟滚动动态行高,vxe-table 新版本发布后,已经可以支持虚拟滚动和动态行高了。如果需要同等行高,只需加上 show-overflow 就可以了,同等行高的渲染性能是最优的,动态行高支持的最大数量低非常多。 建议非必要的场景应该使用同…

C# 高效餐饮管理系统设计与实现

前言 推荐一个C#开发全面、高效的商用餐饮管理系统。该系统集成了餐饮业日常运营所需的各种功能,包括但不限于订单管理、库存控制、财务结算等,通过信息技术手段,帮助餐饮企业实现管理的自动化和智能化。 系统介绍 本系统设计的主要意义在于它能够切实有效地指导工作人员规范…

Docker:Docker搭建Jenkins并共用宿主机Docker部署服务(四)配置Jenkins用户与权限

前言 继续完成Jenkins权限配置管理,Jenkins的搭建与插件安装可以观看上一篇文章:https://www.cnblogs.com/nhdlb/p/18561435 授权策略 首页 -> 系统管理 -> 全局安全配置选择授权策略 :Role-based Authorization Strategy插件创建用户 首页 -> 系统管理 -> 管理…

ENSP之虚拟化安全性的图形界面和命令行不一致的问题

问题报错:40报错 原因:命令行和图形界面不一致 图形界面显示未启用命令行里面并不是如下显示,显示的是hyper-v监控程序正在运行(CMD中输入systeminfo)如果你也遇到此类情况,请参考我的另一份文档 如何关闭VBS的随笔:https://www.cnblogs.com/never-say-die/p/16840030.h…

(原创)odoo Binary字段类型保存文件名称

需要单独指定保存文件名称的字段 清风明月入怀抱,猿鹤听我再抚琴

罗马尼亚-未被完全开发的欧洲瑰宝

罗马尼亚,未被完全开发的欧洲瑰宝自从10月中旬来参加第12届罗马尼亚国际太阳能展(CISOLAR)后,小编同事近日参加完慕尼黑电子展后又杀回到罗马尼亚,结合前线最新消息,给到大家一些信息供参考:罗马尼亚的家庭储能市场正在经历显著的增长,主要得益于政府政策的支持和市场需…