关系型数据库设计三大范式

news/2024/12/16 10:50:33/文章来源:https://www.cnblogs.com/Jcloud/p/18609538

作者:京东科技 郑龙飞

范式定义

百度百科:设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。

人类语言: 范式可以理解为设计一张数据表的表结构,符合的标准级别、规范和要求。

而通常我们用的最多的就是第一范式(1NF)、第二范式(2NF)、第三范式(3NF),也就是本文要讲的“三大范式”。

范式的优点

采用范式可以降低数据的冗余性。

为什么要降低数据的冗余性?

  1. 十几年前,磁盘很贵,为了减少磁盘存储。
  2. 以前没有分布式系统,都是单机,只能增加磁盘,磁盘个数也是有限的。
  3. 一次修改,需要修改多个表,很难保证数据一致性。

范式的缺点

范式的缺点是获取数据时,需要通过Join拼接出最后的数据。

目前范式的分类

目前业界范式有:第一范式(1NF)、第二范式(2NF)、第三范式(3NF)、巴斯-科德范式(BCNF)、第四范式(4NF)、第五范式(5NF)。

什么是函数依赖?

百度百科:函数依赖简单点说就是:某个属性集决定另一个属性集时,称另一属性集依赖于该属性集。

人类语言:以下面表格为例,通俗易懂的解释,什么是函数依赖。

学号姓名系名系主任科名分数
001 张三 计算机系 李雷 高等数学 87
001 张三 计算机系 李雷 大学英语 88
001 张三 计算机系 李雷 数据库设计 89
002 李四 计算机系 李雷 高等数学 86
002 李四 计算机系 李雷 java程序设计 90
002 李四 计算机系 李雷 大学英语 98
003 王五 财务系 韩梅梅 高等数学 96
003 王五 财务系 韩梅梅 财务基础 95

完全函数依赖

官方定义:设X,Y是关系R的两个属性集合,X’是X的真子集,存在X→Y,但对每一个X’都有X’!→Y,则称Y完全函数依赖于X。

人类语言:比如通过,(学号,课程) 推出分数 ,但是单独用学号推断不出来分数,那么就可以说:分数 完全依赖于(学号,课程) 。

总结:即:通过A B能得出C,但 是A B单独得不出C,那么说C完全依赖于AB。

部分函数依赖

官方定义:假如 Y函数依赖于 X,但同时 Y 并不完全函数依赖于 X,那么我们就称 Y 部分函数依赖于 X。

人类语言:比如通过,(学 号,课程) 推出姓名,因为其实直接可以通过,学号推出姓名,所以:姓名 部分依赖于 (学号,课程)。

总结:通过AB能得出C,通过A也能得出C,或者通过B也能得出C,那么说C部分依赖于AB。

传递函数依赖

官方定义:传递函数依赖:设X,Y,Z是关系R中互不相同的属性集合,存在X→Y(Y !→X),Y→Z,则称Z传递函数依赖于X。

人类语言:比如:学号 推出 系名 , 系名 推出 系主任, 但是,系主任推不出学号,系主任主要依赖于系名。这种情况可以说:系主任 传递依赖于 学号 。

总结:即:通 过A得 到B,通 过B得 到C,但 是C得不到A,那 么说C传递依赖于A。

三范式的区别

第一范式

第一范式1NF核心原则:属性不可切割。

举例说明:

学号姓名系名系主任科名分数学籍信息
001 张三 计算机系 李雷 高等数学 87 本科,大二
002 李四 计算机系 李雷 大学英语 88 研究生,研三

很明显上面表格设计是不符合第一范式的,学籍信息列中的数据不是原子数据项,是可以进行分割的,因此对表格进行修改,让表格符合第一范式的要求,修改结果如下图所示:

学号姓名系名系主任科名分数学历所在年级
001 张三 计算机系 李雷 高等数学 87 本科 大二
002 李四 计算机系 李雷 大学英语 88 研究生 研三

实际上 ,1NF是所有关系型数据库的最基本要求 ,你在关系型数据库管理系统(RDBMS),例如SQL Server,Oracle,MySQL中创建数据表的时候,如果数据表的设计不符合这个最基本的要求,那么操作一定是不能成功的。也就是说,只要在RDBMS中已经存在
的数据表,一定是符合1NF的。

第二范式

第二范式2NF核心原则:不能存在“部分函数依赖”。

举例说明:

学号姓名系名系主任科名分数
001 张三 计算机系 李雷 高等数学 87
001 张三 计算机系 李雷 大学英语 88
001 张三 计算机系 李雷 数据库设计 89
002 李四 计算机系 李雷 高等数学 86
002 李四 计算机系 李雷 java程序设计 90
002 李四 计算机系 李雷 大学英语 98
003 王五 财务系 韩梅梅 高等数学 96
003 王五 财务系 韩梅梅 财务基础 95

以上表格明显存在,部分依赖。比 如,这张表的主键是 (学号,课名),分数确实完全依赖于(学号,课名),但是姓名并不完全依赖于(学号,课名),让表格符合第二范式的要求,修改结果如下图所示:

学号科名分数
001 高等数学 87
001 大学英语 88
001 数据库设计 89
002 高等数学 86
002 java程序设计 90
002 大学英语 98
003 高等数学 96
003 财务基础 95
学号姓名系名系主任
001 张三 计算机系 李雷
002 李四 计算机系 李雷
003 王五 财务系 韩梅梅

以上符合第二范式,去掉部分函数依赖依赖。

第三范式

第三范式 3NF核心原则:不能存在传递函数依赖。

举例说明:

学号姓名系名系主任
001 张三 计算机系 李雷
002 李四 计算机系 李雷
003 王五 财务系 韩梅梅

在上面这张表中,存 在传递函数依赖:学号->系 名->系主任,但是系主任推不出学号。

上面表需要再次拆解:

学号姓名系名
001 张三 计算机系
002 李四 计算机系
003 王五 财务系
系名系主任
计算机系 李雷
计算机系 李雷
财务系 韩梅梅

反三范式

没有冗余的数据库未必是最好的数据库,有时为了提高运行效率,就必须降低范式标准,适当保留冗余数据。具体做法是: 在概念数据模型设计时遵守第三范式,降低范式标准的工作放到物理数据模型设计时考虑。降低范式就是增加字段,减少了查询时的关联,提高查询效率,因为在数据库的操作中查询的比例要远远大于DML的比例。但是反范式化一定要适度,并且在原本已满足三范式的基础上再做调整的。

总结

引用知乎大佬对范式的理解:

数据库设计应该也是分为三个境界的:

第一个境界,刚入门数据库设计,范式的重要性还未深刻理解。这时候出现的反范式设计,一般会出问题。

第二个境界,随着遇到问题解决问题,渐渐了解到范式的真正好处,从而能快速设计出低冗余、高效率的数据库。

第三个境界,再经过N年的锻炼,是一定会发觉范式的局限性的。此时再去打破范式,设计更合理的反范式部分。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/853672.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

车载以太网TSN设计及测试解决方案

智能汽车电子电气架构全面向中央+区域式发展,车载通信新技术是新架构技术栈的重要组成部分。车载以太网时间敏感网络TSN技术凭借其低延时、高可靠的特点获得多家OEM的认可。依赖多年技术研发及数十个项目的实践积累,经纬恒润可为客户提供全面、专业且本土化的TSN设计与测试解…

看板软件:跨境电商圣诞营销加速器

看板软件在跨境电商中发挥着多重作用,特别是在圣诞节这一关键销售时期。通过清晰有序的任务管理、灵活适配的自定义功能、高效的信息整合与数据分析、以及精准有效的营销策略应用,看板软件显著提升了跨境电商团队的协作效率和销售能力。圣诞节作为全球最重要的购物节日之一,…

LameUI:轻量级嵌入式图形用户界面的绝佳选择

在信息技术迅猛发展的今天,嵌入式系统逐渐成为各种智能设备的核心。这些系统往往面临资源有限的挑战,因此在开发用户界面时,使用轻量级、易于实现的库显得尤为重要。在这种背景下,LameUI 应运而生。作为一个轻量级且平台无关的图形用户界面库,LameUI 旨在为开发者提供简便…

分享图片

测试图片分享

LT1121IST-5#TRPBF 规格书 数据手册具有关断功能的微功率低压差稳压器芯片

LT1121/LT1121-3.3/LT1121-5是具有关断功能的微功率低压差稳压器。这些设备能够以0.4V的压降提供150mA的输出电流。这些设备设计用于电池供电系统,低静态电流(30A运行,16A关断)使其成为理想的选择。静态电流得到良好控制,不会像许多其他低压差PNP稳压器那样在压降时上升。…

OPA828IDR OPA2828 数据手册一款低失调电压、低温漂、低噪声输入运算放大器芯片

OPA828 和 OPA2828 (OPAx828) JFET 输入运算放大器是 OPA627 和 OPA827 的下一代产品,兼具高速度、高直流精度和高交流性能。这些运算放大器可提供低失调电压、低温漂、低偏置电流和低噪声,噪声仅为60nVRMS 0.1Hz 至 10Hz。OPAx828 在 4V 至 18V的宽电源电压范围内工作,每通…

vue2 脚手架安装及使用

1.安装npm install -g @vue/cli 2.查看版本vue -V 3.使用3.1 命令形式vue create my-project 3.2可视化操作

.NET8升级.NET9,CodeFirst模式迁移Add-Migration执行Update-DataBase报错

在做netcore开发时,如果net8一直是正常的,只升级了一下框架net9,在使用Entity Framework Core的Code First模式进行迁移时,执行Add-Migration后尝试使用Update-DataBase时出现了如下错误。Unhandled exception. System.InvalidOperationException: An error was generated …

响应式圆形js轮播图插件

jcircle.js是一款响应式圆形js轮播图插件。该轮播图插件能够将图片或文字以圆形轮播图的方式进行展示。并且该轮播图以响应式设计,可以自动进行圆形轮播。在线演示 下载使用方法 在页面中引入jCircle.css和jCircle.min.js文件<link href="jCircle.css" rel=&quo…

阿里云联合中国信通院等单位发布首个云计算智能化可观测性能力成熟度模型标准

随着云计算技术与现代企业技术架构的飞速发展,IT 运维场景愈发多元与复杂,需要观测的对象、观测数据类型、数据规模、数据结构复杂度相较于传统监控发生了翻天覆地的变化。这给企业可观测性的准确、实时、高效与智能化发展带来了巨大挑战。如何借助大模型等智能化技术成为应对…

交易系统:应用层、领域层分层架构设计

大家好,我是汤师爷~ 线上线下交易系统的应用架构包括终端、应用层、领域层和关联系统。应用层能力 应用层定义软件的应用功能,负责接收用户请求、协调领域层执行任务并返回结果。主要包括以下模块: 1)C端服务模块 为消费者提供完整的交易链路功能,包括加购、下单、支付、结…

卖点

什么是埋点? 埋点是一种用于跟踪用户在网站或应用中行为的数据采集技术,通过记录点击、浏览等操作,帮助团队进行用户行为分析、AB 实验、错误监听,指导优化方向和资源分配 监控类型 基于要监控的内容,可以分为:数据监控、性能监控、异常监控 上报方式 手动上报在用户点击…