ElscticSearch基础操作

Es数据格式和Mysql对比

ElasticSearch index(索引) Type(类型) Documents(文档) Fields(字段)

MySQL Databases(数据库) Table(表) Row(行) Column(列)

倒排索引

正向索引,在Mysql中使用的索引就是正排索引,索引对应的就是直接的数据

例子:

id content


1 my name is zhangsan

2 my name is lisi

倒排索引,是关键字关联主键ID,ID在去查找文章内容,一个倒排索引是由不同的关键字组成的索引库

强调的是关键字与id的关联

keyword id


name 1,2

zhangsan 1

使用ES

在这里插入图片描述

ES基础操作

在ES中,创建Index就相当于创建mysql中的Database

在PsotMan中,向ES服务器发送PUT请求:http://127.0.0.1:9200/shopping

相当与在ES服务器中创建了一个shoppping的数据库

在这里插入图片描述

我们的请求是以后幂等性的,在次发送相同的请求的时候,会报错

在这里插入图片描述

获取索引的相关信息

使用Get进行请求

在这里插入图片描述

获取所有的索引信息,使用Get进行请求下面的路径

http://127.0.0.1:9200/_cat/indices?v

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

删除索引

使用delete进行请求

http://127.0.0.1:9200/demo

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

添加数据

因为在后面的版本中是没有type的概念的,所以添加数据是直接在索引中添加数据,只能使用POST进行插入,再返回的数据中有一个_id,这个id是作为唯一性存储的

两个新增的命令是相同的

http://127.0.0.1:9200/shopping/_doc

http://127.0.0.1:9200/shopping/_create

此路径说明是要向shopping的索引中添加数据,_doc是添加文档,添加的数据格式是JSON格式

在这里插入图片描述

添加自定义ID

只需要在_doc后面添加指定的ID即可

在这里插入图片描述

主键查询

使用Get进行主键查询,在_doc后面添加主键ID,即可查询当前主键的内容,source中的内容就是doc的内容,在关系型数据库中就相当于查询了一行

http://127.0.0.1:9200/shopping/_doc/1003

在这里插入图片描述

查询当前index下所有的数据

使用_searech

http://127.0.0.1:9200/shopping/_search

返回的数据

查询的毫秒数: “took”: 56,

是否超时: “timed_out”: false,

命中结果 : “hits”: {

​ “total”: {

​ “value”: 4, 总数量

​ “relation”: “eq” 比较

​ },

}

在这里插入图片描述

数据修改

全量数据更新,操作需要修改的id,再返回的时候,返回类型是updated
在这里插入图片描述

单一修改

需要进行post进行请求,在请求时候需要明确标识_update,ID

请求体

{

 "doc":{   //进行修改"title":"华为手机"  //修改字段和数据

​ }

}

在这里插入图片描述

下标删除

使用delete进行删除操作

http://127.0.0.1:9200/shopping/_doc/1003

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

查询操作

查询指定类型的数据

使用URl进行查询

http://127.0.0.1:9200/shopping/_search?q=category:小米

URL分析:查询shopping的数据库,在这个数据库中所有品类为小米的数据

在这里插入图片描述

使用请求体查询

请求体内容和介绍

{

// 进行查询

“query”:{

 // 匹配查询"match":{  // 品类"category":"小米"}

}
在这里插入图片描述

请求体全量查询

{

“query”:{

	  "match_all":{}}

}

在这里插入图片描述

分页查询

分页计算公式: (页码-1) * 每页条数

from:开始位置

size:查询几条

返回的数据中 took表示命中数据,total表示总工有几条

在这里插入图片描述

查询指定信息

如果只需要查询想看到的数据,可以通过 _source进行控制
在这里插入图片描述

字段排序

这里的字段排序是有问题的,排序对于字段类型有一定的要求,如果是text类型是无法参与排序的

这个错误是来自于Elasticsearch的查询操作,具体是关于字段数据类型的问题。Elasticsearch中的字段可以是多种类型,比如textkeywordinteger等。每种类型都有其特定的用途和优化。

这个错误告诉你,你正在尝试对一个text类型的字段(在这里是price字段)执行聚合(aggregations)或排序(sorting)操作,但这是不被允许的。text字段是为了全文搜索而优化的,它们不是为聚合或排序这类需要每个文档字段数据的操作而优化的。

错误提供了两种解决方案:

  1. 使用keyword类型的字段:如果你的price字段实际上是一个固定的值(比如商品的价格),并且你需要对它进行聚合或排序,那么你应该将它定义为keyword类型,而不是text类型。
  2. 设置fielddata=true:这将允许你在text字段上执行聚合和排序操作。但是,请注意,这可能会消耗大量的内存,因为Elasticsearch需要为字段的每个唯一值加载数据。

在大多数情况下,建议将价格这样的字段定义为keyword类型,因为价格通常是一个固定的值,而不是需要全文搜索的文本。

如果你正在使用Elasticsearch的映射(mapping)来定义你的索引,那么你可以这样定义price字段:

{  "properties": {  "price": {  "type": "keyword"  }  // 其他字段...  }  
}

在这里插入图片描述
条件查询

    "query":{"bool":{// must 必须相等 相当于and 进行全文检索匹配 , should 或者 相当于or// "must":[  "should":[  {"match_phrase":{  // match比较,进行全文检索匹配,match_phrase进行全量匹配"category":"华为"}},{"match":{"category":"小米"}}],// 比较查询,filter进行过滤,range查询范围,条件是价格大于1000"filter":{"range":{"price":{"gt":1000}}}}}
}```
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/0b6f1be3763142eb9f68a9ece0babd7c.png)
**高亮查询**
```json
{"query":{"match":{"category":"小米"  //匹配字段}},"highlight":{  //高亮"fields":{   // 高亮字段"category":{}  //具体的高亮字段}}
}

在这里插入图片描述

聚合查询

{"aggs":{ //聚合操作"price_group":{"avg":{   // terms 分组 ,avg 平均值"field":"price" //分组字段}}},"size":0  //设置此参数,在查询的时候不会显示额外的数据,只会显示聚合操作完成的数据
}

在这里插入图片描述
映射

{"properties":{"name":{"type":"text",  // 可以分词"index":true    // true 可以被索引查询},"sex":{"type":"keyword",  //表示不能被分词"index":true // true 可以被索引查询},"tel":{"type":"keyword",   //表示不能被分词"index":false // false 不可以被索引查询}}
}

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/478731.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java系列之 重命名文件/图片,renameTo() 方法的使用

我 | 在这里 🏠 工作 | 广州 ⭐ Java 全栈开发(软件工程师) ✈️公众号 | 热爱技术的小郑 。文章底部有个人公众号二维码。回复 Java全套视频教程 或 前端全套视频教程 即可获取 300G 教程资料及项目实战案例 🚀 邮箱 | 297742996…

Linux 主机数据拷贝与 Linux 服务器之间拷贝文件的方法

Linux 主机数据拷贝与 Linux 服务器之间拷贝文件的方法 1. 使用 scp 命令2. 使用 rsync 命令3. 使用 scp 和 rsync 的图形界面工具4. 使用 FTP/SFTP 协议总结与比较 在 Linux 系统中,数据拷贝是日常操作中的常见需求,尤其是在不同主机或服务器之间进行文…

【医学大模型】Text2MDT :从医学指南中,构建医学决策树

Text2MDT :从医学指南中,构建医学决策树 提出背景Text2MDT 逻辑Text2MDT 实现框架管道化框架端到端框架 效果 提出背景 论文:https://arxiv.org/pdf/2401.02034.pdf 代码:https://github.com/michael-wzhu/text2dt 假设我们有一…

CF778A String Game 题解

文章目录 CF778A String Game 题解题面翻译Input DataOutput DataInput Sample 1Output Sample 1题目描述输入格式输出格式样例 #1样例输入 #1样例输出 #1 样例 #2样例输入 #2样例输出 #2 提示算法:二分代码: CF778A String Game 题解 link 题面翻译 …

VsCode指定插件安装目录

VsCode指定插件安装目录 VsCode安装的默认目录是在用户目录(%HomePath%)下的.vscode文件夹下的extensions目录下,随着安装插件越来越多会占用大量C盘空间。 指定VsCode的插件目录 Vscode安装目录: D:\Microsoft VS Code\Code.exeVscode插件安装目录&a…

Jenkins配置node节点

1、添加节点 2、配置node主机的java环境 注意,jdk的位置和版本要和master保持一致 sudo apt-get update sudo apt-get install openjdk-8-jre vim /etc/enviroment写入:export JAVA_HOME/usr/lib/jvm/openjdk-8-jre 按wq!退出 再输入:s…

压缩感知(Compressed Sensing,CS)的基础知识

压缩感知(Compressed Sensing,CS)是一种用于信号处理的技术,旨在以少于奈奎斯特采样定理所要求的样本频率来重构信号。该技术利用信号的稀疏性,即信号可以用较少的非零系数表示。压缩感知在图像获取中的应用使得在采集…

Linux调优指南

更多相关知识可以阅读: https://www.yuque.com/treblez/qksu6c/yxl59pkvczqot9us https://www.yuque.com/treblez/qksu6c/nqe8ip59cwegl6rk 本文不会讲解基础知识。 CPU 设置调度器 这几个调度类的优先级如下:Deadline > Realtime > Fair 如果你…

【OpenAI发布Sora视频模型,高保真AI视频成真了!】

曾梦想执剑走天涯,我是程序猿【AK】 目录 简述概要Sora技术报告总结 简述概要 隆重介绍 Sora,文本转视频模型。Sora 可以生成长达一分钟的视频,同时保持视觉质量并遵守用户的提示。又是哪些职业要被AI替代了! Sora技术报告 作为…

Error creating bean with name ‘formContentFilter‘ defined in class path

问题描述 运行之前能正常的项目出现以上报错,提示创建“formContentFilter”时错误;org.springframework.boot版本2.4.8 org.springframework.beans.factory.BeanCreationException. Message: Error creating bean with name formContentFilter define…

【医学大模型 补全主诉】BioGPT + LSTM 自动补全医院紧急部门主诉

BioGPT LSTM 自动补全医院紧急部门主诉 问题:针对在紧急部门中自动补全主诉的问题子问题1: 提高主诉记录的准确性子问题2: 加快主诉记录的速度子问题3: 统一医疗术语的使用子问题4: 减少打字错误和误解子问题5: 提高非特定主诉的处理能力 解法数据预处理神经网络方…

【MATLAB源码-第140期】基于matlab的深度学习的两用户NOMA-OFDM系统信道估计仿真,对比LS,MMSE,ML。

操作环境: MATLAB 2022a 1、算法描述 深度学习技术在无线通信领域的应用越来越广泛,特别是在非正交多址接入(NOMA)和正交频分复用(OFDM)系统中,深度学习技术被用来提高信道估计的性能和效率。…