SQL进阶理论篇(五):什么是Hash索引

文章目录

  • 简介
  • MySQL中的Hash索引
  • 与B+树的区别
  • 总结
  • 参考文献

简介

hash,即哈希,也被称为是散列函数。

Hash在数据库中的应用,可以帮助我们大幅度提升检索数据的效率。

大名鼎鼎的MD5其实就是Hash函数的一种变体。

Hash算法,是通过某种确定性的算法(如MD5、SHA1、SHA2、SHA3)来将输入转换为输出。相同的输入永远会得到相同的输出。

MySQL中的Hash索引

采用Hash进行检索的效率非常高,基本上一次检索就可以找到数据,而B+树需要从上至下依次访问多个节点之后才能找到数据,从效率上来讲,Hash的效率要高于B+树。

Hash索引的示意图如下:

在这里插入图片描述

键值Key通过Hash映射后找到自己的桶bucket。这里的bucket指的是一个能存储一条或者多条记录的存储单位。一个桶可以理解成是一个链表,当遇到Hash冲突的时候(Hash值相同),会在桶里进一步进行键值的查找,从而找到最终的数据行。

什么是Hash冲突呢?

如果桶的数量小于输入的数量,那么势必会出现不同的输入被映射到同一个桶里的情况,这时候就会产生Hash冲突,如果Hash冲突的量很大,就会影响读取的性能。

在简单的应用下,Hash的字节数一般比较少,比如4个字节。多的情况下可以是16位或者是32位。比如说采用MD5函数,就可以得到一个16位或者32位的数值,32位的MD5就已经足够安全了,重复率非常低。

与B+树的区别

  • Hash索引无法进行区间查询,因为Hash索引指向的数据是无序的。B+树可以,是因为B+树的叶子节点是个有序链表。
  • Hash索引不支持联合索引的最左侧原则(其无法使用联合索引的部分索引,要用的话只能全用),而B+树支持。这是因为Hash索引在计算Hash值的时候,是将所有索引键合并后统一计算Hash值,而不会对每个索引键单独计算Hash。
  • Hash索引不支持order by排序,因为其指向的数据是无序的,无法排序优化;
  • Hash索引无法进行模糊匹配,因为即使输入数据有一丁点差异,输出都会千差万别。

对于等值查询来讲,通常Hash索引的效率更高,除非是索引项的重复值过多,即Hash冲突的现象过于严重。这是因为遇到Hash 冲突的时候,就需要遍历桶中的链表来一个一个比较,从而找到待查询的关键字,这个遍历的过程是很耗时的。所以,Hash索引通常不会用到重复值多的列上。比如说性别。

总结

可以看到,Hash索引有着诸多的限制,因此在数据库中,B+树索引的应用面是更加广泛的。但也有一些特殊的场景下,使用Hash索引会更好,比如说键值型数据库中,redis存储的核心就是Hash表。

另外,MySQL的Memory存储引擎也支持Hash存储。而InnoDB引擎也有一个“自适应Hash索引”的功能,就是当某个索引值使用的非常频繁的时候,它会在 B+ 树索引的基础上再创建一个 Hash 索引,这样让 B+ 树也具备了 Hash 索引的优点。

参考文献

  1. 25丨Hash索引的底层原理是什么?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/277840.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

电商控制台前台整合优化

前台逻辑 显示商品菜单输入id,进入某个商品检测登录和注册 根据登录和注册的状态,订单或者是购物车都需要登录。 登录:生成订单(先生成订单表,再生成订单详情表) 开发直接购买,加入购物车, …

ETL.NET 助力海量数据轻松处理

ETL.NET 助力海量数据轻松处理 什么是 ETL & EtlT ?About ETLAbout EtlT 谈谈 ETL 作用ETL 对企业的作用ETL 对个人职业发展的作用 ETL.NET 介绍ETL.NET 功能特点1、它包含 SSIS 的所有转换和功能2、开箱即用的功能 如何使用 ETL.NET ?ETL.NET 相关资源Paillav…

一分钟教你打造高效接口文档(Swagger+knife4j)

在前后端分离开发过程中,前端人员和后端人员要进行配合来共同完成一个开发任务,这个时候需要使用到接口(API接口:是一个http的请求地址,主要是定义:请求路径、请求方式、请求参数、响应数据等内容&#xff…

SpringIOC之Jsr330ScopeMetadataResolver

博主介绍:✌全网粉丝5W,全栈开发工程师,从事多年软件开发,在大厂呆过。持有软件中级、六级等证书。可提供微服务项目搭建与毕业项目实战,博主也曾写过优秀论文,查重率极低,在这方面有丰富的经验…

计算机毕业设计 基于SpringBoot的日常办公用品直售推荐系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精…

在IDEA 2023.3中Jrebel debug 模式无法启动

目录 版本说明问题描述解决方式 版本说明 IDEA:IntelliJ IDEA 2023.3 (Ultimate Edition) Jrebel: JRebel Agent 2023.4.2 (202312041035) 问题描述 在IDEA中启动debug模式时无法正常启动 解决方式 在 IDEA 2023.3 版本修改了默认的配置&#xff…

系列十五、Redis面试题集锦

一、Redis面试题集锦 1.1、Redis到底是单线程还是多线程 Redis6.0版本之前的单线程指的是其网络IO和键值对读写是由一个线程完成的; Redis6.0引入的多线程指的是网络请求过程采用了多线程,而键值对读写命令仍然是单线程的,所以多线程环境下&…

基于Java (spring-boot)的二手物品交易平台

​ 一、项目介绍 1、管理员功能 (1)登录:管理员能够根据账号访问系统。 (2)用户管理:管理员可以添加、删除、修改用户信息,查看用户列表,对用户进行管理和控制。例如&#xff0c…

策略模式-大道至简

文章目录 摆个类图本质 摆个类图 本质 定义一个标准策略接口Strategy,这个接口中声明一个场景下应该使用的策略(执行的逻辑)。随后具体的执行器(具体的场景)应当实现这个接口,并实现自己的策略执行逻辑。为…

SpringBoot使用自带的日志框架(开箱即用,同时输出到文件与控制台)

在SpringBoot内部中,默认就集成了LogBack的日志依赖,所以我们其实在实际开发中不需要直接添加该依赖。 你会发现spring-boot-starter其中包含了 spring-boot-starter-logging,Spring Boot为我们提供了很多默认的日志配置,所以&…

【C语言】C的面向对象

一、BREW接口实现 高通的BREW(Binary Runtime Environment for Wireless)是一个早期为手机设备开发的应用程序平台,用于开发在CDMA手机上运行的软件。尽管这个平台目前已经不太流行,但是在其使用高峰时期,开发者需要使…

【正点原子STM32连载】第十三章 串口通信实验 摘自【正点原子】APM32E103最小系统板使用指南

1)实验平台:正点原子APM32E103最小系统板 2)平台购买地址:https://detail.tmall.com/item.htm?id609294757420 3)全套实验源码手册视频下载地址: http://www.openedv.com/docs/boards/xiaoxitongban 第十…