Mysql高级——数据库设计规范(1)

数据库设计规范

1. 为什么需要数据库设计

数据库设计是为了有效地组织和管理数据。它是一个重要的步骤,用于创建一个结构良好、高效和可靠的数据库系统。以下是一些需要数据库设计的原因:

  1. 数据组织:数据库设计帮助我们将数据按照一定的结构进行组织,使得数据可以被轻松地存储、访问和管理。这样可以提高数据的可用性和可靠性。
  2. 数据一致性:通过数据库设计,我们可以定义数据之间的关系和约束条件,确保数据的一致性。这样可以减少数据冗余和错误,并提高数据的准确性。
  3. 数据安全:数据库设计可以考虑数据的安全性,包括访问控制、加密和备份等措施,以保护数据免受未经授权的访问、损坏或丢失。
  4. 数据性能:良好的数据库设计可以提高数据的查询和处理性能。通过合理地设计表结构、索引和查询语句,可以加快数据的检索和处理速度。
  5. 数据可扩展性:数据库设计需要考虑未来的需求和扩展性。通过合理地设计表结构和关系,可以方便地添加新的功能和数据,而不需要对整个数据库进行重构。

综上所述,数据库设计是为了提高数据的组织性、一致性、安全性、性能和可扩展性。它是构建一个高效和可靠的数据库系统的关键步骤。

2. 范 式

2.1 范式简介

在关系型数据库中,关于数据表设计的基本原则、规则就称为范式

可以理解为,一张数据表的设计结构需要满足的某种设计标准的级别。要想设计一个结构合理的关系型数据库,必须满足一定的范式

2.2 范式都包括哪些

目前关系型数据库有六种常见范式,按照范式级别,从低到高分别是:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)和第五范式(5NF,又称完美范式)。

2.3 键和相关属性的概念

这里有两个表:

球员表(player) :球员编号 | 姓名 | 身份证号 | 年龄 | 球队编号

球队表(team) :球队编号 | 主教练 | 球队所在地

  • 超键:对于球员表来说,超键就是包括球员编号或者身份证号的任意组合,比如(球员编号)(球员编号,姓名)(身份证号,年龄)等。

  • 候选键:就是最小的超键,对于球员表来说,候选键就是(球员编号)或者(身份证号)。

  • 主键:我们自己选定,也就是从候选键中选择一个,比如(球员编号)

  • 外键:球员表中的球队编号

  • 主属性、非主属性:在球员表中,主属性是(球员编号)(身份证号),其他的属性(姓名)(年龄)(球队编号)都是非主属性。

2.4 第一范式(1st NF)

MySQL并没有显式的第一范式(1NF)的概念,因为1NF是关系数据库的基本原则,适用于所有关系型数据库系统,包括MySQL。

第一范式是指数据库中的每个列都是原子的,即不可再分的。具体来说,每个列应该只包含一个值,而不是多个值或者重复的值。这样可以确保数据的一致性和准确性。

在MySQL中,我们可以通过以下几个方面来满足第一范式的要求:

  1. 每个表应该有一个主键,用于唯一标识每条记录。
  2. 每个列应该只包含一个值,不应该存储多个值或者重复的值。如果需要存储多个值,可以考虑使用多个表和关联关系来表示。
  3. 避免使用重复的列,如果有重复的数据,可以考虑将其拆分为一个独立的表。

2.5 第二范式(2nd NF)

在MySQL中,我们可以通过以下几个方面来满足第二范式的要求:

  1. 确保每个表都有一个主键,并且主键是唯一的标识符。
  2. 将非主键列与主键建立直接的关系,即每个非主键列都完全依赖于主键。如果存在非主键列与主键的部分依赖关系,可以将这部分列拆分到一个独立的表中,以确保每个非主键列都与主键有直接的关系。
  3. 避免在表中存储冗余的数据。如果有重复的数据,可以将其拆分为一个独立的表,并通过关联关系与主表建立联系。

2.6 第三范式(3rd NF)

符合3NF后的数据模型通俗地讲,2NF和3NF通常以这句话概括:“每个非键属性依赖于键,依赖于整个键,并且除了键别无他物”。

3. 反范式化

3.1 概述

规范化 vs 性能

  1. 为满足某种商业目标 , 数据库性能比规范化数据库更重要
  2. 在数据规范化的同时 , 要综合考虑数据库的性能
  3. 通过在给定的表中添加额外的字段,以大量减少需要从中搜索信息所需的时间
  4. 通过在给定的表中插入计算列,以方便查询

在MySQL中,反范式化(Denormalization)是一种优化技术,用于提高数据库查询性能。它违反了范式化的原则,通过增加冗余数据或合并表来减少数据库查询的复杂性和提高查询性能。

反范式化可以在以下情况下使用:

  1. 经常进行复杂的连接操作:如果数据库中的查询经常需要多个表之间的连接操作,而这些连接操作会导致性能下降,可以考虑通过反范式化来减少连接操作,提高查询性能。
  2. 频繁进行聚合操作:如果数据库中的查询经常需要进行聚合操作(如SUM、AVG、COUNT等),而这些操作对大量数据进行计算,可以考虑通过反范式化来预先计算并存储聚合结果,以提高查询性能。
  3. 读取操作远远多于写入操作:如果数据库中的数据主要用于读取操作,而写入操作较少,可以考虑通过反范式化来提高读取操作的性能。通过将相关的数据合并到一个表中,可以避免频繁的连接和查询操作。

需要注意的是,反范式化可能会导致冗余数据的存在,增加数据更新的复杂性和风险。因此,在使用反范式化时,需要权衡查询性能和数据一致性之间的关系,并确保维护数据的完整性和准确性。

总之,反范式化是一种在特定情况下用于提高查询性能的技术。在使用反范式化时,需要谨慎考虑,并确保权衡查询性能和数据一致性的需求。

当冗余信息有价值或者能大幅度提高查询效率的时候,我们才会采取反范式的优化。

5. 第四范式

在关系数据库中,第四范式(4NF)是一种进一步的范式化原则,用于消除非平凡多值依赖关系。然而,在MySQL中,并没有显式的第四范式的概念,因为MySQL作为关系型数据库,遵循范式化的原则,包括第四范式。

第四范式要求在满足第三范式的基础上,消除非平凡多值依赖关系。非平凡多值依赖指的是,当一个表的某个非主键列依赖于该表的部分候选键而不是整个候选键时,就存在非平凡多值依赖。

通过分解表来消除非平凡多值依赖,可以将其拆分为两个或多个表,并通过关联关系来建立联系。这样可以减少数据冗余和提高数据的一致性和准确性。

在MySQL中,我们可以通过遵循第三范式的要求来最大程度地消除非平凡多值依赖。确保每个非主键列直接依赖于主键,避免存在部分候选键之间的依赖关系。

综上所述,第四范式是关系数据库的进一步范式化原则,用于消除非平凡多值依赖。在MySQL中,我们可以通过遵循第三范式的要求来最大程度地满足第四范式的要求,以提高数据的一致性和准确性。

举例1:职工表(职工编号,职工孩子姓名,职工选修课程)。

在这个表中,同一个职工可能会有多个职工孩子姓名。同样,同一个职工也可能会有多个职工选修课程,即这里存在着多值事实,不符合第四范式。

如果要符合第四范式,只需要将上表分为两个表,使它们只有一个多值事实,例如: 职工表一(职工编号,职工孩子姓名), 职工表二(职工编号,职工选修课程),两个表都只有一个多值事实,所以符合第四范式。

6. 第五范式、域键范式

除了第四范式外,我们还有更高级的第五范式(又称完美范式)和域键范式(DKNF)。
在满足第四范式(4NF)的基础上,消除不是由候选键所蕴含的连接依赖。如果关系模式R中的每一个连接依赖均由R的候选键所隐含,则称此关系模式符合第五范式。

函数依赖是多值依赖的一种特殊的情况,而多值依赖实际上是连接依赖的一种特殊情况。但连接依赖不像函数依赖和多值依赖可以由语义直接导出,而是在关系连接运算时才反映出来。存在连接依赖的关系模式仍可能遇到数据冗余及插入、修改、删除异常等问题。

第五范式处理的是无损连接问题,这个范式基本没有实际意义,因为无损连接很少出现,而且难以察觉。而域键范式试图定义一个终极范式,该范式考虑所有的依赖和约束类型,但是实用价值也是最小的,只存在理论研究中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/115874.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

NVR添加rtsp流模拟GB28181视频通道

一、海康、大华监控摄像头和硬盘录像机接入GB28181平台配置 1、海康设备接入配置 通过web登录NVR管理系统,进入网络,高级配置界面,填入GB28181相关参数。 将对应项按刚才获取的配置信息填入即可,下面的视频通道的编码ID可以保持…

Nginx使用指南

文章目录 前言一、源码编译1.1 编译1.2 第三方模块编译 二、配置文件2.1 配置语法2.2 location语法2.3 配置文件块2.4 全局变量 三、HTTP 服务器3.1 基本3.2 反向代理3.3 压缩3.4 负载均衡3.5 HTTPS 支持3.6 UrlRewrite3.7 防盗链配置3.8 跨域3.9 静态服务3.10 PC/手机端分离3.…

数据结构与算法--排序算法复习

目录 1.三种常见的简单排序: 1.1冒泡排序 1.2 选择排序 1.3 插⼊排序 2 常见高级排序算法 2.1 希尔排序 2.2 快速排序 2.3 归并排序 2.4计数排序 先上结论: 1.三种常见的简单排序: 1.1冒泡排序 1.⾸先在未排序数组的⾸位开始&#…

从统计语言模型到预训练语言模型---预训练语言模型(BERT,GPT,BART系列)

基于 Transformer 架构以及 Attention 机制,一系列预训练语言模型被不断提出。 ​BERT 2018 年 10 月, Google AI 研究院的 Jacob Devlin 等人提出了 BERT (Bidirectional Encoder Representation from Transformers ) 。具体的研究论文发布在 arXiv …

Guava Cache介绍-面试用

一、Guava Cache简介 1、简介 Guava Cache是本地缓存,数据读写都在一个进程内,相对于分布式缓存redis,不需要网络传输的过程,访问速度很快,同时也受到 JVM 内存的制约,无法在数据量较多的场景下使用。 基…

如何用好免费的ChatGPT

如何用好免费的ChatGPT 前言ChatGPT使用入口在线体验地址:点我体验 ChatGPT介绍ChatGPT初级使用技巧初级使用技巧:清晰明了的问题表达 ChatGPT中级使用语法中级使用语法:具体化问题并提供背景信息 ChatGPT高级使用高级使用:追问、…

出现 conda虚拟环境默认放在C盘 解决方法

目录 1. 问题所示2. 原理分析3. 解决方法3.1 方法一3.2 方法二1. 问题所示 通过conda配置虚拟环境的时候,由于安装在D盘下,但是配置的环境默认都给我放C盘 通过如下命令:conda env list,最后查看该环境的确在C盘下 2. 原理分析 究其根本原因,这是因为默认路径没有足够的…

MySQL常见面试题(一)

😀前言 在数据库管理系统中,存储引擎起着核心的角色,它决定了数据管理和存储的方式。MySQL作为一个领先的开源关系型数据库管理系统,提供了多种存储引擎来满足不同的需求和优化不同的应用。除了选择合适的存储引擎,数据…

差值结构的顺序偏好

( A, B )---3*30*2---( 1, 0 )( 0, 1 ) 让网络的输入只有3个节点,AB训练集各由5张二值化的图片组成,让A 中有5个点,B中有1个点,且不重合,统计迭代次数并排序。 第一种情况 差值结构 迭代次数 L E - - 2 10491.…

想搭建数字藏品平台怎么做?

搭建数字藏品平台涉及多个步骤和技术方面的考虑。以下是创建数字藏品平台的一般步骤: 技术架构 选择合适的技术架构和平台。您可以选择使用现有的电子商务平台、自定义开发、或使用数字藏品管理系统等。云托管服务如Amazon Web Services 或Microsoft Azure也可以提…

科学数据分析和图形绘制软件GraphPad Prism 9 mac中文版特点介绍

Prism 9 mac是一款专业的科学数据分析和图形绘制软件,可用于在生物、医学、化学等领域进行数据分析、绘制图形、进行统计分析等。 Prism 9 mac软件特点 1. 多种数据分析功能:Prism 9提供了多种常见的数据分析工具,包括线性回归、ANOVA、t检验…

gym_unity学习笔记

最近学了一段时间gym_unity,把一些资料留在这里 实例 实例gym_unity训练RollerBall:https://blog.csdn.net/alibutter/article/details/120908687实例gyn_unity训练3DBall:https://zhuanlan.zhihu.com/p/554927641?utm_id0 源码&#xff1…