Elasticsearch 向量搜索

目标记录

["你好,我的爱人","你好,我的爱妻","你好,我的病人","世界真美丽"]

搜索词

爱人

预期返回

["你好,我的爱人","你好,我的爱妻"]

示例代码:

代码连接 es8以及bge-large-zh模型,

bge-large-zh用来将文本转换为向量数据

es用来存储向量数据,并根据向量来搜索相似度最高的文本(相似度可以用阈值调整)

from flask import Flask, request  # 导入Flask类
from FlagEmbedding import FlagModel
from elasticsearch import Elasticsearch
from elasticsearch.helpers import bulkapp = Flask(__name__)  # 实例化并命名为app实例
model = FlagModel('./models/bge/bge-large-zh', query_instruction_for_retrieval="为这个句子生成表示以用于检索相关文章:")
# 创建Elasticsearch客户端对象
es = Elasticsearch(hosts="http://localhost:9200")
es.ping()@app.route('/ins', methods=['POST'])
def index():    data = request.get_json()print(data)strs = data["strs"]documents = []for str in strs:            print(str)tmp = model.encode(str)documents.append({"general_text": str,"general_text_vector": tmp,# "domain":"001"})documentsbulk(es, documents, index="demo")return success(1)@app.route('/search', methods=['POST'])
def search():data = request.get_json()doc_vector = model.encode(data["name"])results = es.search(index="demo",source=["general_text",            ],min_score= 1.83,query={"script_score": {"query": { "match_all": {} },"script": {"source": "cosineSimilarity(params.queryVector, 'general_text_vector') + 1.0","params": {"queryVector": doc_vector.tolist()}}}},size=1000)# return resultsreturn results['hits']['hits']def success(data):return {"status": "success","result": data}def fail(data):return {"status": "fail","result": data}if __name__ == "__main__":# Runport = 5000app.run(host='127.0.0.1', port=port, debug=False, use_reloader=False)

es存储数据

搜索结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/577004.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

RFID智慧书柜:全民阅读新趋势,24小时借书不打烊。

近年来,促进全民阅读已经是一种趋势。“书香校园”“书香社区”“文化企业建设”等口号不断被提出,国家也在不断鼓励并提倡营造全民阅读的氛围。在这一趋势下,RFID智慧书柜的出现无疑为众多社区、校园、企业的首选对象。 RFID智慧书柜将纸质书…

pygame用chatgpt绘制3d沿x轴旋转的

import pygame from pygame.locals import * import sys import mathpygame.init()width, height 800, 600 screen pygame.display.set_mode((width, height))vertices [(0, 100, 0), (100, 200, 0), (300, 100, 0)]angle 0 rotation_speed 2 # 可根据需要调整旋转速度 c…

HarmonyOS 应用开发之ExtensionAbility组件

ExtensionAbility组件是基于特定场景(例如服务卡片、输入法等)提供的应用组件,以便满足更多的使用场景。 每一个具体场景对应一个 ExtensionAbilityType,开发者只能使用(包括实现和访问)系统已定义的类型。…

如何缩短职场人与人之间的差距?答案或许就隐藏在一纸社科院与杜兰大学能源管理硕士学位之中

你是否曾惊叹于同事某某的飞速进步,短短两年内连升三级,如同职场上的彗星划破夜空?每当看到他们晋升的喜讯在群里传播,你的内心是否也曾涌起一股难以名状的涟漪?与你一同踏入公司的伙伴,如今已是经理级别&a…

postgresql多选功能实现

一、背景介绍 在一所乡村小学,教师资源紧张,所以会出现一个教师身兼多职的情况,既是语文老师又是数学老师甚至还是体育老师,这个系统就是为各个班级分配老师,这样一个场景实现 二、代码实现及效果 后端country_teac…

基于springboot实现校园周边美食探索及分享平台系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现园周边美食探索及分享平台系统演示 摘要 美食一直是与人们日常生活息息相关的产业。传统的电话订餐或者到店消费已经不能适应市场发展的需求。随着网络的迅速崛起,互联网日益成为提供信息的最佳俱渠道和逐步走向传统的流通领域,传统的…

Java学习记录第十三天

面向对象编程 核心思想就是OOP(面向对象编程) 面向过程&面向对象 面向过程思想 步骤清晰简单,第一步做什么,第二步做什么... 面对过程适合处理一些较为简单的问题 面向对象思想 物以类聚,分类的思维模式&…

Oracle 中部分不兼容对象迁移到 OceanBase 的处理方式

本文总结分析了 3 种 Oracle 对象和 OB 对象不兼容时的处理方法和提前统计发现的操作方式,在迁移前提前发现这类问题能有效避免在迁移过程中报错的问题。 作者:余振兴,爱可生 DBA 团队成员,热衷技术分享、编写技术文档。 爱可生开…

C++从入门到精通——缺省参数

缺省参数 前言一、缺省参数概念二、缺省参数分类位置参数的缺省参数全缺省参数半缺省参数 关键字参数的缺省参数函数指针的缺省参数lambda表达式 三、缺省参数的具体代码展示main.cpp 前言 缺省参数是在函数定义时指定的默认值,当调用函数时未提供该参数的值时&…

【Android Handler】从源码出发,一步步窥探Handler在Java层的数据结构关系和执行原理

文章目录 Example for useLooperHandler sendMessagemsg插入链表头Message p mMessages;msg.next p;mMessages msg; msg插入链表中间Message p mMessages;prev p;p p.next;msg.next p;prev.next msg; LooperpreparelooploopOncelooper和message的关系next message和han…

修改 RabbitMQ 默认超时时间

MQ客户端正常运行,突然就报连接错误, 错误信息写的很明确,是客户端连接超时。 不过很疑虑,为什么会出现连接超时呢?代码没动过,网络也ok,也设置了心跳和重连机制。 最终在官网中找到了答案&am…

AIGC重塑金融 | 大模型在金融行业的应用场景和落地路径

作者:林建明 来源:IT阅读排行榜 本文摘编自《AIGC重塑金融:AI大模型驱动的金融变革与实践》,机械工业出版社出版 目录 01 大模型在金融领域的 5 个典型应用场景 02 大模型在金融领域应用所面临的风险及其防范 03 AIGC 技术的科…