ElasticSearch之结构化搜索

写在前面

本文看下es的结构化搜索,结构化搜索顾名思义就是对结构化数据的搜索,那么什么是结构话数据呢?我的理解是具有一定规则的数据就是结构化,在es中包括但不限于如下:

1:Boolean只有true和false
2:整数就是整数,不会是其他的
3:日期日期的格式虽然可能有多种,但也是有规则的
4:枚举类的text普通的text肯定不是结构化数据,比如一条日志,但是如性别,风险等级,彩笔的颜色等,都是有限的枚举值,所以也是结构化的数据
5:文档的key是有限的枚举值,所以也是有规则的,所以也是结构化数据。

针对上述数据的搜索,我们可以采用term搜索 以及前缀搜索 等词项查询 。

结构化查询在一定程度上可以认为是精准匹配,所以可以根据具体情况考虑不算分 。

1:例子

1.1:布尔,数字

# 1:删除老的,避免影响
DELETE /products
POST /products/_bulk
{"index": {"_id": 1}}
{"price":10,"available":true,"date":"2018-01-01","productID":"XHDK-A-1293-#fJ3"}
{"index": {"_id": 2}}
{"price":20,"available":true,"date":"2019-01-01","productID":"KDKE-B-9947-#kL5"}
{"index": {"_id": 3}}
{"price":30,"available":true,"productID":"JODL-X-1937-#pV7"}
{"index": {"_id": 4}}
{"price":30,"available":false,"productID":"QQPX-R-3956-#aD8"}# 2:对布尔查询,并且算分,可以查询到3条
POST products/_search
{"profile": "true","explain": true,"query": {"term": {"available": true}}
}
# 3:对布尔查询,不算分,可以查询到3条
POST products/_search
{"profile": "true","explain": true,"query": {"constant_score": {"filter": {"term": {"available": true}}}}
}# 4:数字range
POST products/_search
{"query": {"constant_score": {"filter": {"range": {"price": {"gte": 20,"lte": 30}}}}}
}

1.2:日期

# 1:删除老的,避免影响
DELETE /products
POST /products/_bulk
{"index": {"_id": 1}}
{"price":10,"available":true,"date":"2018-01-01","productID":"XHDK-A-1293-#fJ3"}
{"index": {"_id": 2}}
{"price":20,"available":true,"date":"2019-01-01","productID":"KDKE-B-9947-#kL5"}
{"index": {"_id": 3}}
{"price":30,"available":true,"productID":"JODL-X-1937-#pV7"}
{"index": {"_id": 4}}
{"price":30,"available":false,"productID":"QQPX-R-3956-#aD8"}# 2:日期range
POST products/_search
{"query": {"constant_score": {"filter": {"range": {"date": {"gte": "now-7y"}}}}}
}

日期的语法糖:
在这里插入图片描述

1.3:Exist

# 1:删除老的,避免影响
DELETE /products
POST /products/_bulk
{"index": {"_id": 1}}
{"price":10,"available":true,"date":"2018-01-01","productID":"XHDK-A-1293-#fJ3"}
{"index": {"_id": 2}}
{"price":20,"available":true,"date":"2019-01-01","productID":"KDKE-B-9947-#kL5"}
{"index": {"_id": 3}}
{"price":30,"available":true,"productID":"JODL-X-1937-#pV7"}
{"index": {"_id": 4}}
{"price":30,"available":false,"productID":"QQPX-R-3956-#aD8"}# 2:exists,必须包含date key并且有值才行(null和空字符串都不可以)
POST products/_search
{"query": {"constant_score": {"filter": {"exists": {"field": "date"}}}}
}

1.4:多值字段

# 1:删除老的,避免影响
DELETE movies
POST /movies/_bulk
{"index": {"_id": 1}}
{"title":"Father of the Bridge Part II","year":1995,"genre":"Comedy"}
{"index": {"_id": 2}}
{"title":"Dave","year":1993,"genre":["Comedy","Romance"]}# 2:会查询出{"_id": 2}的数据,它是个数组,其实不应该查出来
POST movies/_search
{"query": {"constant_score": {"filter": {"term": {"genre.keyword": "Comedy"}}}}
}

在这里插入图片描述
上述的查询,将"_id": 2}的数据的数据也查询出来了,其实这是不对的,是es对数组的实现机制导致了这个问题,该怎么办呢?

写在后面

其实结构化搜索的内容是包含在我们前面学习过的这篇文章 中的,只不过这里为了更加明确结构化的概念又进行了专门的的分析。

参考文章列表

ElasticSearch之search API

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/483376.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

机器学习基本概念(李宏毅课程)

目录 一、概念:1、机器学习概念:2、深度学习概念: 二、深度学习中f(.)的输入和输出:1、输入:2、输出: 三、三种机器学习任务:1、Regression回归任务介绍:2、Classification分类任务介绍:3、Stru…

线性代数:向量空间

目录 向量空间 Ax 0 的解空间S Ax b 的全体解向量所构成集合不是向量空间 基、维数、子空间 自然基与坐标 例1 例2 向量空间 Ax 0 的解空间S Ax b 的全体解向量所构成集合不是向量空间 基、维数、子空间 自然基与坐标 例1 例2

B端系统:工作台页面,如何从平庸走向出众

Hi,大家好,我是贝格前端工场,从事8年前端开发的老司机。大家看过很多平庸的工作台页面,但是仔细分析过平庸的表现吗,仔细思考过如何实现出众的效果吗?这篇文章为你解读。 一、工作台页面是什么,…

jpg图片太大怎么压缩?3种压缩方法,一学就会

jpg图片太大怎么压缩?在日常生活和工作中,JPG图片过大不仅会导致存储空间的迅速消耗,还影响网络传输的速度,甚至在某些情况下,过大的图片文件还可能造成应用程序运行缓慢或崩溃,严重影响工作效率。因此&…

设计模式四:适配器模式

1、适配器模式的理解 适配器模式可以理解为有两个现成的类Adaptee和Target,它们两个是不能动的,要求必须使用B这个类来实现一个功能,但是A的内容是能复用的,这个时候我们需要编写一个转换器 适配器模式 Adaptee:被适…

猫头虎分享:什么是Web3撸毛?

博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通鸿蒙》 …

基于SpringBoot + Layui的社区物业管理系统

项目介绍 社区物业管理系统是基于java编程语言,springboot框架,idea工具,mysql数据库进行开发,本系统分为业主和管理员两个角色,业主可以登陆系统,查看车位费用信息,查看物业费用信息&#xff0…

顺序表详解(如何实现顺序表)

文章目录 前言 在进入顺序表前,我们先要明白,数据结构的基本概念。 一、数据结构的基本概念 1.1什么是数据结构 数据结构是由“数据”和“结构”两词组合而来。所谓数据就是?常见的数值1、2、3、4.....、姓名、性别、年龄,等。…

django rest framework 学习笔记-实战商城

01项目环境搭建_哔哩哔哩_bilibili 本博客借鉴至大佬的视频学习笔记 # 创建项目 django-admin startproject MyShop# 创建app E:\desktop\my_drf\MyShop>django-admin startapp goodsE:\desktop\my_drf\MyShop>django-admin startapp orderE:\desktop\my_drf\MyShop>…

写给正在迷茫的你:4年程序员职业生涯感悟

前言 最近有许多小伙伴找我来咨询Python,我来讲几个极其重要,但是大多数Python小白都在一直犯的思维错误吧!如果你能早点了解清楚这些,会改变你的编程学习生涯的。小编这一期专门总结了大家问的最多的,关于学习Python…

负载均衡.

简介: 将请求/数据【均匀】分摊到多个操作单元上执行,负载均衡的关键在于【均匀】。 负载均衡的分类: 网络通信分类 四层负载均衡:基于 IP 地址和端口进行请求的转发。七层负载均衡:根据访问用户的 HTTP 请求头、URL 信息将请求转发到特定的主机。 载体维度分类 硬…

Github代码仓库SSH配置流程

作者: Herman Ye Auromix 测试环境: Ubuntu20.04 更新日期: 2024/02/21 注1: Auromix 是一个机器人爱好者开源组织。 注2: 由于笔者水平有限,以下内容可能存在事实性错误。 相关背景 在为Github代码仓库配…