elasticsearch简单入门语法

基本操作

创建不同的分词器

ik_smart: 极简分词 ; ik_max_word: 最细力再度分词

基本的rest命令

methodurl地址描述
PUTlocalhost:9200/索引名称/类型名称/文档id创建文档(指定文档id)
POSTlocalhost:9200/索引名称/类型名称创建文档(随机文档id)
POSTlocalhost:9200/索引名称/类型名称/文档id/_update修改文档
DELETElocalhost:9200/索引名称/类型名称/文档id删除文档
GETlocalhost:9200/索引名称/类型名称/文档id查询文档通过文档id
POSTlocalhost:9200/索引名称/类型名称/_search查询所有数据

索引基本操作

查询所有索引

Elasticsearch 7.x 版本

# 返回一个仅包含索引名称的 JSON 数组  

GET /_cat/indices?format=json&h=index

扩展:获取ES的其他信息

GET _cat/health      # 查看健康值  

GET _cat/indices?v  #查看所有东西的版本信息

新增索引

 # ElasticSearch的7.x.x版本PUT /索引名/类型名/文档id{请求体}

 # 创建索引
 

 PUT test1{"mappings": {"properties": {"name": {"type": "text"},"age":{"type": "integer"}}}}
 # 创建加索引时同时添加数据,es会自动给属性设置type# ElasticSearch的8.x.x版本,类型已经弃用,默认写_doc。PUT /索引名/_doc/文档id{请求体}​PUT test1/_doc/1{"name":"小明","age":23} # ElasticSearch的8.x.x版本,类型已经弃用,默认写_doc。PUT /索引名/_doc/文档id{请求体}
 CreateIndexRequest request = new CreateIndexRequest(INDEX);CreateIndexResponse response = client.indices().create(request, RequestOptions.DEFAULT);

查看索引

name需要指定类型

官网类型文档地址:Keyword type family | Elasticsearch Guide [8.9] | Elastic

  • 字符串类型 text、keyword

  • 数值类型 long,integer,short,byte,double,float,half float,scaled float

  • 日期类型 date

  • te布尔值类型 boolean·

  • 二进制类型 binary

  • 等等……

设置字段类型

修改索引

索引是不可修改的。一旦创建了索引,您不能直接修改其结构或字段的映射。如果要修改索引的结构,您需要重新创建索引并重新索引数据。

 POST _reindex{"source": {"index": "your_old_index"},"dest": {"index": "new_index"}}

新索引和旧索引的字段不一定需要完全一致。在重新创建索引和重新索引数据时,可以对字段进行修改、删除或添加新的字段。

如果字段在新索引中已经存在,则该字段的映射将被保留。如果字段在新索引中不存在,则会根据重新索引的数据动态创建字段的映射。

例如,假设旧索引中有一个 "field1" 字段,而新索引中没有。在重新索引数据时,如果数据中存在 "field1" 字段,Elasticsearch 将自动创建该字段的映射并将其添加到新索引中。

同样地,如果旧索引中存在一个 "field2" 字段,而新索引中也有一个名为 "field2" 的字段,那么在重新索引数据时,新索引中的 "field2" 字段的映射将保留不变。

需要注意的是,如果字段在新索引和旧索引中具有不兼容的类型或映射定义,可能会导致数据转换或丢失。因此,在进行索引结构修改时,请确保对数据和字段映射的变化有充分的了解和计划。

删除索引

关于文档的基本操作

基本操作

添加数据

PUT /index/_doc/1
{"name": "狂神说","age": 3,"desc": "工资2500","tags": ["直男","温暖","技术宅"]
}
PUT /index/_doc/2
{"name": "张三","age": 30,"desc": "没有工资","tags": ["渣男","旅游","交友"]
}

查询数据

# 查询索引下,对应文档ID的数据
GET /index/_doc/1
GET /index/_doc/2

更新 PUT(不推荐)

PUT 修改数据,需要全属性字段都存在,否则会丢失缺失的属性字段

# 修改数据
put index/_doc/1
{"name": "杨光1","age": 3,"desc": "工资2500","tags": ["直男","温暖","技术宅"]
}
# PUT 修改时,会更新该ID下的所有字段,如果缺失字段,则会删除原有字段
put index/_doc/1
{"name": "杨光1","age": 3,"desc": "工资2500"
}

更新 POST(推荐)

# POST 更新,会修改该文档ID下对应属性的值
POST index/_update/1
{"doc": {"name":"杨光3"}
}
 
# POST 更新,会修改该文档ID下对应属性的值,不推荐这样写,ES8执行不支持这种语法
POST index/_doc/1/_update
{"doc": {"name":"杨光4"}
}

 

条件查询

PUT /index/_doc/1
{"name": "杨光","age": 3,"desc": "工资2500","tags": ["直男","温暖","技术宅"]
}PUT /index/_doc/2
{"name": "张三","age": 30,"desc": "没有工资","tags": ["渣男","旅游","交友"]
}# 根据name查询
GET index/_search?q=name:张三

PUT index
{"mappings": {"properties": {"name":{"type": "keyword"},"xm":{"type": "text","analyzer": "ik_smart"},"age":{"type": "integer"},"desc":{"type": "text"},"tags":{"type": "text"}}}
}
# 测试数据
PUT /index/_doc/1
{"name": "杨光","xm": "杨光","age": 3,"desc": "工资2500","tags": ["直男","温暖","技术宅"]
}PUT /index/_doc/2
{"name": "张三","xm": "张三","age": 30,"desc": "没有工资","tags": ["渣男","旅游","交友"]
}PUT /index/_doc/3
{"name": "李三","xm": "李三","age": 23,"desc": "工资5000","tags": ["健身","旅游","购物"]
}PUT /index/_doc/4
{"name": "张三丰","xm": "张三丰","age": 10,"desc": "工资5000","tags": ["健身","旅游","购物"]
}PUT /index/_doc/5
{"name": "张","xm": "张","age": 10,"desc": "工资5000","tags": ["健身","旅游","购物"]
}PUT /index/_doc/6
{"name": "三","xm": "三","age": 10,"desc": "工资5000","tags": ["健身","旅游","购物"]
}

match和term

Match查询和Term查询是Elasticsearch中常用的查询类型,它们有以下区别:

  1. 匹配方式:

  • Term查询:对查询条件不进行分词,直接按照完全匹配的方式进行查询。

  • Match查询:对查询条件进行分词,然后对分词后的词项进行匹配。

  1. 查询字段类型:

  • Term查询:适用于精确匹配的字段,如关键字(keyword)类型或未分词的文本类型(如"张三",不会被分词)。

  • Match查询:适用于全文本字段,如全文本(text)类型或已分词的文本类型(如"张三 张三",会被分词成两个词项"张三")。

  1. 匹配精度:

  • Term查询:精确匹配,只有完全匹配的词项才会被返回。

  • Match查询:默认为词项级别的匹配,可以根据分析器的分词规则进行模糊匹配。

  1. 执行效率:

  • Term查询:由于不进行分词,查询速度较快。

  • Match查询:需要对查询条件进行分词,可能会影响查询性能。

根据具体的查询需求,选择合适的查询类型可以提高查询的准确性和效率。如果需要精确匹配的查询,且不需要分词,可以选择Term查询;如果需要对分词后的文本进行匹配,可以选择Match查询。

match查询

# match 查询时,会对查询条件先分词
# 而name字段类型为keyword,不会分词,所以只能搜到name=张三的数据
GET index/_search
{"query": {"match": {"name": "张三"}},"_source": ["name","xm"]
}
# match 查询,会对查询条件先分词
# xm字段类型为text,用ik_max_smart分词,会分词,所以只能搜到文档xm字段分词后,结果为张三分词后的所有数据
GET index/_search
{"query": {"match": {"xm": "张三"}},"_source": ["name","xm"]
}

 

term查询

# term 查询时,不会对查询条件进行分词,name为keyword,所以只能完全匹配
GET index/_search
{"query": {"term": {"name": "张三"}}
}
# term 查询,不会对查询条件进行分词
# xm字段类型为text,用ik_max_smart分词,会分词,所以能查到文档分词后为张三的数据
GET index/_search
{"query": {"term": {"xm": "张三"}},"_source": ["name","xm"]
}

 

过滤字段查询

# 查询结果只展示 name和xm两个字段
GET index/_search
{"_source": ["name","xm"]
}

排序

# 查询结果排序
GET index/_search
{"_source": ["name", "age"], "sort": [{"age": {"order": "desc"}}]
}

分页查询

# 分页查询
GET index/_search
{"_source": ["name", "age"],"from": 0,"size": 2
}

多条件查询(布尔值查询)

must

类似sql中的 and

# 查询 name = 张三 并且 age = 30 
GET index/_search
{"query": {"bool": {"must": [{"match": {"name": "张三"}},{"match": {"age": "30"}}]}}
}

should

类似sql中的 or

# 查询 name = 张三 或者 name = 李三
GET index/_search
{"query": {"bool": {"should": [{"match": {"name": "张三"}},{"match": {"name": "李三"}}]}}
}

must_not

类似sql中的 not in

# 查询 name != 张三 并且 name != 李三 
GET index/_search
{"query": {"bool": {"must_not": [{"match": {"name": "张三"}},{"match": {"name": "李三"}}]}}
}

filter

在Elasticsearch中,过滤器(Filter)是一种用于精确筛选文档的查询子句,主要用于限制搜索结果的范围。与查询(Query)不同,过滤器不会评分和排序结果,而是根据指定的条件进行筛选。这可以提高查询性能,特别是在过滤大量文档的情况下。

过滤器可以用于各种条件,如范围查询、存在性检查、逻辑运算等。常见的过滤器类型包括:

  1. Term Filter:根据指定的词项进行精确匹配筛选。

  2. Range Filter:通过指定的范围进行筛选,可以用于数值、日期等字段。

  3. Exists Filter:检查字段是否存在于文档中。

  4. Bool Filter:通过逻辑运算符(AND、OR、NOT)对其他过滤器进行组合。

  5. Geo Distance Filter:通过指定的地理位置和距离范围进行地理位置过滤。

  6. Script Filter:使用自定义脚本进行筛选。

过滤器可以单独使用,也可以与查询结合使用。如果需要对搜索结果进行精确的筛选,并且不需要评分和排序,建议使用过滤器来提高查询性能。

# 查询xm=张三,并且age < 30 且 age >= 10 ,并且age 倒序
GET index/_search
{"_source": ["xm","age"],"query": {"bool": {"must": [{"match": {"xm": "张三"}}], "filter": [{"range": {"age": {"gte": 10,"lt": 30}}}]}},"sort": [{"age": {"order": "desc"}}]
}# 查询xm=张三,并且age < 30 且 age >= 10 ,并且 xm 字段值
GET index/_search
{"_source": ["xm","age"],"query": {"bool": {"must": [{"match": {"xm": "张三"}}],"filter": [{"range": {"age": {"gte": 10,"lt": 30}}},{"exists": {"field": "xm"}}]}}
}

 

高亮查询

# 对搜索结果命中的字段添加自定义html标签
GET index/_search
{"query": {"term": {"xm": {"value": "张三"}}}, "highlight": {"pre_tags": "<font color = 'red'>","post_tags": "</font>", "fields": {"xm": {}}},"_source": "xm"
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/68545.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Spring对象装配

在spring中&#xff0c;Bean的执行流程为启动spring容器&#xff0c;实例化bean&#xff0c;将bean注册到spring容器中&#xff0c;将bean装配到需要的类中。 既然我们需要将bea装配到需要的类中&#xff0c;那么如何实现呢&#xff1f;这篇文章&#xff0c;将来阐述一下如何实…

打造专属花店展示小程序

在当今社会&#xff0c;微信小程序已经成为了各行各业拓展客户资源的利器&#xff0c;而花店行业也不例外。通过打造一个独特的花店小程序&#xff0c;你可以为你的花店带来更多的曝光和客户资源。那么&#xff0c;如何制作一个专属的花店小程序呢&#xff1f;下面我们就来一步…

网络编程(JavaEE初阶系列10)

目录 前言&#xff1a; 1.网络编程的基础 1.1为什么需要网络编程 1.2什么是网络编程 1.3网络编程中的基本概念 1.3.1发送端和接收端 1.3.2请求和响应 1.3.3客户端和服务端 2.Socket套接字 2.1概念 2.2分类 3.UDP数据报套接字编程 3.1DataGramSocket API 3.2Datagr…

Stable Diffusion 告别复制关键词,高质量提示词自动生成插件

在使用SD时,我们经常会遇到心中无想法,或不知如何描述心中所想的图像。有时由于提示词的选择不当,生成的图片质量也不尽如人意。为此,我今天为大家推荐一个高质量的提示词自动生成插件——One Button Prompt。 下面是他生成的一些样图。 文章目录 插件安装插件说明主菜单工…

【应用笔记】使用 CW32 实现电池备份(VBAT)功能

前言 电池备份&#xff08;VBAT&#xff09;功能的实现方法&#xff0c;一般是使用 MCU 自带的 VBAT 引脚&#xff0c;通过在该引脚连接钮扣电池&#xff0c;当系统电源因故掉电时&#xff0c;保持 MCU 内部备份寄存器内容和 RTC 时间信息不会丢失。 本文档介绍了如何基于 C…

vscode | linux | c++ intelliense 被弃用解决方案

每日一句&#xff0c;vscode用的爽是爽&#xff0c;主要是可配置太强了。如果也很会研究&#xff0c;可以直接去咸鱼接单了 废话少说&#xff0c;直接整。 用着用着说是c intelliense被弃用&#xff0c;很多辅助功能无法使用&#xff0c;像查看定义、查看引用、函数跳转、智能提…

macOS - 安装使用 libvirt、virsh

文章目录 关于 libvirt使用安装启动服务virsh 交互模式virsh 帮助命令 关于 libvirt libvirt 官网&#xff1a; https://libvirt.org/gitlab : https://gitlab.com/libvirt/libvirtgithub : https://github.com/libvirt/libvirt 只读&#xff0c;gitlab 的镜像 libvirt是一套…

C++的stack和queue+优先队列

文章目录 什么是容器适配器底层逻辑为什么选择deque作为stack和queue的底层默认容器优先队列优先队列的模拟实现stack和queue的模拟实现 什么是容器适配器 适配器是一种设计模式(设计模式是一套被反复使用的、多数人知晓的、经过分类编目的、代码设计经验的总 结)&#xff0c;…

三星电子首席技术官:BSPDN技术开发计划曝光,背部供电技术创新

在ETNews的报道之后&#xff0c;三星电子的代工部门首席技术官Jung Ki-tae Jung透露了该公司在BSPDN技术开发方面的计划。 BSPDN技术是一项创新技术&#xff0c;旨在更好地利用半导体晶圆背面空间的潜力。虽然该技术尚未在全球范围内实施&#xff0c;但三星电子成为首家公开披…

2024软考系统架构设计师论文写作要点

一、写作注意事项 系统架构设计师的论文题目对于考生来说&#xff0c;是相对较难的题目。一方面&#xff0c;考生需要掌握论文题目中的系统架构设计的专业知识;另一方面&#xff0c;论文的撰写需要结合考生自身的项目经历。因此&#xff0c;如何将自己的项目经历和专业知识有机…

时间序列预测任务下探索深度学习参数对模型预测性能的影响

时间序列相关的项目在我之前的很多博文中都有涉及&#xff0c;覆盖的数据领域也是比较广泛的&#xff0c;很多任务或者是项目中往往是搭建出来指定的模型之后就基本完成任务了&#xff0c;比较少去通过实验的维度去探索分析不同参数对模型性能的影响&#xff0c;这两天正好有时…