为何AI更懂你:向量搜索,了解一下!

news/2024/9/20 22:21:44/文章来源:https://www.cnblogs.com/mangod/p/18370817

现在,你有没有发现自己越来越多地依赖推荐系统,有时候自己搜到的结果好像还没有AI推荐的精准。

那估计有人好奇了,推荐系统怎么这么“聪明”的呢?答案就是:“向量搜索”。今天,我们来聊聊这个技术,看看它是怎么改变了我们获取信息的方式的。

1、向量搜索是什么鬼?

首先,向量搜索到底是什么呢?简单来说,它是一种“懂你”的搜索技术。

传统搜索引擎一般会根据你输入的关键词,去找那些完全匹配的内容。但是向量搜索不一样,它更聪明,不仅是匹配关键词,而且会试图理解你真正的意图和上下文,然后去找那些最符合你需求的内容。

你可以把它想象成一个特别懂你的“老朋友”,它知道你要的是什么,即使你好像啥也没说清楚。

向量搜索的2个明显应用就是推荐系统知识库。无论是购物、音乐推荐 还是 知识库检索,都是向量搜索在背后默默工作。

比如说,你在某个音乐平台听了一首歌,平台不仅会推荐风格相似的歌曲,还会根据歌表达的情绪、歌词的内容给你推荐一些更加相似的歌曲。

2、向量搜索的核心是向量和维度

那么,向量搜索是怎么做到这些的呢?关键就在“向量”和“维度”。

在数学里,向量是有方向和大小的,而在向量搜索中,文字或数据会被转换成一个“高维向量”。

每个维度代表着数据的不同特性,比如情感、语义或者上下文。想象一下,这些向量在高维空间中变成了一个个点,而搜索的过程就是在这个复杂的空间中找离你需求最近的点。

以上的解释可能有点抽象,可以这样理解下:传统搜索就像在一张平面地图上精确找点,而向量搜索则是在一个3D立体空间(多维空间)中找近似点,而且考虑的因素更多更复杂。

3、向量搜索改变了搜索方式

向量搜索不仅让搜索变得更智能了,也改变了我们获取信息的方式。

信息化社会下,信息是爆发式增长的,数据不仅量大而且非常混乱。

向量搜索能够将这些数据转化为我们可以理解和操作的形式。它不仅能够帮助我们寻找精确的信息,还能够通过多个维度寻找最接近的信息,包括从 同义词、含义、意图和上下文等各个角度。

向量搜索不仅是对单个词进行搜索,而且还会分析词与词之间的复杂关系,从而更好地理解每次选择是否更接近或偏离检索句子的含义。

这样一来,我们不仅获取到信息,而且找到了更有意义的结果。

过去,我们需要输入非常精确的关键词才能找到想要的信息,但现在即使描述得比较模糊,向量搜索也能帮我们找到最相关的内容。

这对普通用户来说太方便了,不需要搞懂各种专业术语,只要使用自然语言大致将需求表达清楚,就能得到准确的结果。

4、总结

向量搜索的出现,悄然改变了我们获取信息的方式,标志着搜索技术的一次飞跃。它在推荐系统、生成式AI等领域都在大显身手。

本篇完结!欢迎 关注、加V(yclxiao)交流、全网可搜(程序员半支烟)

原文链接:https://mp.weixin.qq.com/s/eRSZhtMOW2UZ-mt0UnxjlQ

最近推出了《开发者AI加持》,一个AI应用开发专栏,旨在助力开发者在这个艰难和变革的时代多一技傍身。还有1V1技术咨询,扫清职业发展和技术道路上的障碍。早鸟价9元,加V(yclxiao)咨询。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/784625.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

dotnet X11 简单使用 MIT-SHM 共享内存推送图片

这是我在尝试优化 Avalonia 在 Linux 上的低端设备的渲染性能时所研究的方式,本文将告诉大家如何简单使用 XShmPutImage 等 X11 的 XShm Extension 扩展方法,通过共享内存的方式推送图片众所周知,在 X11 里面有经典的 Client-Server 模型。客户端程序是属于 Client 角色,需…

读软件开发安全之道:概念、设计与实施04缓解

读软件开发安全之道:概念、设计与实施04缓解1. 缓解 1.1. 安全思维转换为有效行动的方法就是首先预判威胁,然后针对可能的漏洞加以保护 1.2. 主动响应的做法就叫做“缓解”1.2.1. mitigation1.2.2. 喂宝宝的时候给孩子围上围嘴,避免掉下来的食物粘在宝宝的衣服上,还有安全带…

Java虚拟机精选面试题20道

原文地址:https://www.jb51.net/article/215065.htm 1.介绍下Java内存区域(运行时数据区)。 Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为以下6个运行时数据区域。程序计数器(Program Counter Register) 一块较小的内存空间,可以看作当前线程所执行的字节码…

INE - Advanced Web Application Penetration Testing (eWPTx)

Encoding and Filtering URL编码:https://perishablepress.com/stop-using-unsafe-characters-in-urls/ HTML编码:需要知道如何编码以及如何解码文档字符编码:HTTP协议或指令 https://datatracker.ietf.org/doc/html/rfc2616 Content-Type:text/html; charset=utf-8 如果未定…

RCE漏洞常用的Payload总结

关于远程代码执行 常用的payload(linux和windows) RCE:远程代码执行 (RCE) 使攻击者能够通过注入攻击执行恶意代码。代码注入攻击不同于命令注入攻击。攻击者的能力取决于服务器端解释器的限制。在某些情况下,攻击者可能能够从代码注入升级为命令注入。远程代码评估可能导致…

第十一周-云计算运维作业

总结 tomcat实现多虚拟机vim ../conf/server.xml <Host name="www.b.com" appBase="/data/website2/"unpackWARs="true" autoDeploy="true"> </Host><Host name="www.a.com" appBase="/data/website3…

从高斯消元法到特征值特征向量

帮助具有特征值和特征向量等线性代数的基础概念但不能理解其意义的读者理解特征值和特征向量出现的意义。从高斯消元法到矩阵乘法、用矩阵乘法的两套解释逻辑解释相似矩阵,用相似矩阵解释特征值和特征向量。摘要: 帮助具有特征值和特征向量等线性代数的基础概念但不能理解其意…

[rCore学习笔记 025]分时多任务系统与抢占式调度

写在前面 本随笔是非常菜的菜鸡写的。如有问题请及时提出。 可以联系:1160712160@qq.com GitHhub:https://github.com/WindDevil (目前啥也没有 本节重点 本章最开始的时候讲解了有类似于多道程序与协作式调度的区别. 回想上一节,我们提到的,如果我们仍然是不使用上一节实现…

自动化部署、通知、分布式构建与并行构建(jenkins pipeline)

jenkins与ansible集成应该需要在Jenkins上安装一下[root@mcw15 plugins]# yum install -y ansible打开配置[root@mcw15 plugins]# vim /etc/ansible/ansible.cfg [root@mcw15 plugins]# grep host_key_checking /etc/ansible/ansible.cfg host_key_checking = False [root@mcw…

【待做】Windows反沙箱检测

免责声明 本文仅用于学习和技术研究,读者利用本文所提供的信息造成的任何直接或间接的影响和损失均由该读者负责,文章作者不为此承担任何责任,请遵守国家网络安全法,维护良好的网络环境。前言 本文将介绍有关杀软行为检测中沙箱云传的一些对抗技巧,比较知名的杀软都会将可…

PyCharm 使用 Anaconda 管理多版本 Python 环境

1、开始 ——> 打开Anaconda Prompt工具2、 conda --version3、查看当前版本 python --version4、 conda create --name python-310 python=3.10# 执行后,会提示要安装相关数据包 Proceed ([y]/n)? 输入y, 回车5、打开pycharm,file-->setting-->Project:xxx--> …

WSL2共享Windows代理网络

1. 打开clsh局域网连接2. 在Windows用户目录下新建文件.wslconfig3. 关闭wsl并编写文件内容 wsl --shutdown [wsl2] memory=8GB processors=8 [experimental] autoMemoryReclaim=gradual networkingMode=mirrored dnsTunneling=true firewall=true autoProxy=true sparseVhd=tr…