chp6nullnull
数据库系统概论
An Introduction to Database System
第六章 关系数据理论天津师范大学计算机与信息工程学院 王岚第六章 关系数据理论第六章 关系数据理论6.1 问题的提出
6.2 规范化
6.3 数据依赖的公理系统
*6.4 模式的分解
6.5 小结6.1 问题的提出6.1 问题的提出关系数据库逻辑设计
针对具体问题,如何构造一个适合于它的数据模式
数据库逻辑设计的工具──关系数据库的规范化理论问题的提出问题的提出一、概念回顾
二、关系模式的形式化定义
三、什么是数据依赖...
nullnull
数据库系统概论
An Introduction to Database System
第六章 关系数据理论天津师范大学计算机与信息工程学院 王岚第六章 关系数据理论第六章 关系数据理论6.1 问题的提出
6.2
化
6.3 数据依赖的公理系统
*6.4 模式的分解
6.5 小结6.1 问题的提出6.1 问题的提出关系数据库逻辑设计
针对具体问题,如何构造一个适合于它的数据模式
数据库逻辑设计的工具──关系数据库的规范化理论问题的提出问题的提出一、概念回顾
二、关系模式的形式化定义
三、什么是数据依赖
四、关系模式的简化定义
五、数据依赖对关系模式影响一、概念回顾一、概念回顾关系
关系模式
关系数据库
关系数据库的模式二、关系模式的形式化定义二、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组:
R(U, D, DOM, F)
R: 关系名
U: 组成该关系的属性名集合
D: 属性组U中属性所来自的域
DOM: 属性向域的映象集合
F: 属性间数据的依赖关系集合三、什么是数据依赖三、什么是数据依赖1. 完整性约束的
现形式
限定属性取值范围:例如学生成绩必须在0-100之间
定义属性值间的相互关连(主要体现于值的相等与否),这就是数据依赖,它是数据库模式设计的关键什么是数据依赖(续)什么是数据依赖(续)2. 数据依赖
一个关系内部属性与属性之间的约束关系
现实世界属性间相互联系的抽象
数据内在的性质
语义的体现什么是数据依赖(续)什么是数据依赖(续)3. 数据依赖的类型
函数依赖(Functional Dependency,简记为FD)
多值依赖(Multivalued Dependency,简记为MVD)
其他四、关系模式的简化表示四、关系模式的简化表示关系模式R(U, D, DOM, F)
简化为一个三元组:
R(U, F)
当且仅当U上的一个关系r满足F时,r称为关系模式 R(U, F)的一个关系五、数据依赖对关系模式的影响五、数据依赖对关系模式的影响[例1]建立一个描述学校教务的数据库:
学生的学号(Sno)、所在系(Sdept)
系主任姓名(Mname)、课程名(Cname)
成绩(Grade)
单一的关系模式 : Student
U ={ Sno, Sdept, Mname, Cname, Grade }数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续) 属性组U上的一组函数依赖F:
F ={ Sno → Sdept, Sdept → Mname,
(Sno, Cname) → Grade }关系模式Student中存在的问题关系模式Student中存在的问题1. 数据冗余太大
2. 更新异常(Update Anomalies)
3. 插入异常(Insertion Anomalies)
4. 删除异常(Deletion Anomalies)数据依赖对关系模式的影响(续)数据依赖对关系模式的影响(续)结论:
Student关系模式不是一个好的模式。
“好”的模式:
不会发生插入异常、删除异常、更新异常,
数据冗余应尽可能少
原因:由存在于模式中的某些数据依赖引起的
解决方法:通过分解关系模式来消除其中不合适
的数据依赖
分解关系模式分解关系模式把这个单一模式分成3个关系模式:
S(Sno,Sdept,Sno → Sdept);
SC(Sno,Cno,Grade,(Sno,Cno) → Grade);
DEPT(Sdept,Mname,Sdept→ Mname)第六章 关系数据理论第六章 关系数据理论6.1 问题的提出
6.2 规范化
6.3 数据依赖的公理系统
*6.4 模式的分解
6.5 小结6.2 规范化6.2 规范化
规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结6.2.1 函数依赖6.2.1 函数依赖函数依赖
平凡函数依赖与非平凡函数依赖
完全函数依赖与部分函数依赖
传递函数依赖
一、函数依赖一、函数依赖定义6.1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。
若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作X→Y。 说明 说明 1. 所有关系实例均要满足
2. 语义范畴的概念
3. 数据库设计者可以对现实世界作强制的规定二、平凡函数依赖与非平凡函数依赖二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,
如果X→Y,但Y X,则称X→Y是非平凡的函数依赖
若X→Y,但Y X, 则称X→Y是平凡的函数依赖
例:在关系SC(Sno, Cno, Grade)中,
非平凡函数依赖: (Sno, Cno) → Grade
平凡函数依赖: (Sno, Cno) → Sno
(Sno, Cno) → Cno
平凡函数依赖与非平凡函数依赖(续)平凡函数依赖与非平凡函数依赖(续)若X→Y,则X称为这个函数依赖的决定属性组,也称为决定因素(Determinant)。
若X→Y,Y→X,则记作X←→Y。
若Y不函数依赖于X,则记作X→Y。三、完全函数依赖与部分函数依赖三、完全函数依赖与部分函数依赖定义6.2 在R(U)中,如果X→Y,并且对于X的任何一个真子集X’,都有X’ Y, 则称Y对X完全函数依赖,记作
X F Y。
若X→Y,但Y不完全函数依赖于X,则称Y对X部分函数依赖,记作X P Y。
完全函数依赖与部分函数依赖(续)完全函数依赖与部分函数依赖(续)
[例1] 中(Sno,Cno)→Grade是完全函数依赖,
(Sno,Cno)→Sdept是部分函数依赖
因为Sno →Sdept成立,且Sno是(Sno,Cno)的真子集
FP四、传递函数依赖四、传递函数依赖定义6.3 在R(U)中,如果X→Y,(Y X) ,Y→X Y→Z, 则称Z对X传递函数依赖。
记为:X → Z
注: 如果Y→X, 即X←→Y,则Z直接依赖于X。
例: 在关系Std(Sno, Sdept, Mname)中,有:
Sno → Sdept,Sdept → Mname
Mname传递函数依赖于Sno传递6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结6.2.2 码6.2.2 码定义6.4 设K为R中的属性或属性组合。若K U, 则K称为R的侯选码(Candidate Key)。
若候选码多于一个,则选定其中的一个做为主码(Primary Key)。F码(续)码(续)主属性与非主属性
包含在任何一个候选码中的属性 ,称为主属性(Prime attribute)
不包含在任何码中的属性称为非主属性(Nonprime attribute)或非码属性(Non-key attribute)
全码
整个属性组是码,称为全码(All-key) 码(续)码(续)[例2]
关系模式S(Sno,Sdept,Sage),单个属性Sno是码,
SC(Sno,Cno,Grade)中,(Sno,Cno)是码
[例3]
关系模式R(P,W,A)
P:演奏者 W:作品 A:听众
一个演奏者可以演奏多个作品
某一作品可被多个演奏者演奏
听众可以欣赏不同演奏者的不同作品
码为(P,W,A),即All-Key 外部码外部码定义6.5 关系模式 R 中属性或属性组X 并非 R的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码
如在SC(Sno,Cno,Grade)中,Sno不是码,但Sno是关系模式S(Sno,Sdept,Sage)的码,则Sno是关系模式SC的外部码
主码与外部码一起提供了表示关系间联系的手段6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结6.2.3 范式6.2.3 范式范式是符合某一种级别的关系模式的集合
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式
范式的种类:
第一范式(1NF)
第二范式(2NF)
第三范式(3NF)
BC范式(BCNF)
第四范式(4NF)
第五范式(5NF)6.2.3 范式6.2.3 范式各种范式之间存在联系:
某一关系模式R为第n范式,可简记为R∈nNF。
一个低一级范式的关系模式,通过模式分解可以转换为若干个高一级范式的关系模式的集合,这种过程就叫规范化 6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结6.2.4 2NF6.2.4 2NF1NF的定义
如果一个关系模式R的所有属性都是不可分的基本数据项,则R∈1NF
第一范式是对关系模式的最起码的要求。不满足第一范式的数据库模式不能称为关系数据库
但是满足第一范式的关系模式并不一定是一个好的关系模式2NF(续)2NF(续)[例4] 关系模式 S-L-C(Sno, Sdept, Sloc, Cno, Grade)
Sloc为学生住处,假设每个系的学生住在同一个地方
函数依赖包括:
(Sno, Cno) F Grade
Sno → Sdept
(Sno, Cno) P Sdept
Sno → Sloc
(Sno, Cno) P Sloc
Sdept → Sloc 2NF(续) 2NF(续)
S-L-C的码为(Sno, Cno)
S-L-C满足第一范式。
非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno)SnoCnoGradeSdeptSlocS-L-CS-L-C不是一个好的关系模式(续)S-L-C不是一个好的关系模式(续)(1) 插入异常
(2) 删除异常
(3) 数据冗余度大
(4) 修改复杂
S-L-C不是一个好的关系模式(续)S-L-C不是一个好的关系模式(续)原因
Sdept、 Sloc部分函数依赖于码。
解决方法
S-L-C分解为两个关系模式,以消除这些部分函数依赖
SC(Sno, Cno, Grade)
S-L(Sno, Sdept, Sloc)2NF(续)2NF(续)函数依赖图:关系模式SC的码为(Sno,Cno)
关系模式S-L的码为Sno
这样非主属性对码都是完全函数依赖 2NF(续) 2NF(续)2NF的定义
定义6.6 若R∈1NF,且每一个非主属性完全函数依赖于码,则R∈2NF。
例:S-L-C(Sno, Sdept, Sloc, Cno, Grade) ∈1NF
S-L-C(Sno, Sdept, Sloc, Cno, Grade) ∈2NF
SC(Sno, Cno, Grade) ∈ 2NF
S-L(Sno, Sdept, Sloc) ∈ 2NF
2NF(续) 2NF(续)采用投影分解法将一个1NF的关系分解为多个2NF的关系,可以在一定程度上减轻原1NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。
将一个1NF关系分解为多个2NF的关系,并不能完全消除关系模式中的各种异常情况和数据冗余。6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结 6.2.5 3NF 6.2.5 3NF3NF的定义
定义6.7 关系模式R 中若不存在这样的码X、属性组Y及非主属性Z(Z Y), 使得X→Y,Y→Z成立,
Y → X,则称R ∈ 3NF。
若R∈3NF,则每一个非主属性既不部分依赖于码也不传递依赖于码。 3NF(续)3NF(续)例:2NF关系模式S-L(Sno, Sdept, Sloc)中
函数依赖:
Sno→Sdept
Sdept → Sno
Sdept→Sloc
可得:
Sno→Sloc,即S-L中存在非主属性对码的传递函数依
赖,S-L ∈ 3NF传递 3NF(续) 3NF(续)函数依赖图:3NF(续)3NF(续)解决方法
采用投影分解法,把S-L分解为两个关系模式,以消除传递函数依赖:
S-D(Sno, Sdept)
D-L(Sdept,Sloc)
S-D的码为Sno, D-L的码为Sdept。
分解后的关系模式S-D与D-L中不再存在传递依赖 3NF(续)3NF(续)S-D的码为Sno, D-L的码为Sdept S-L(Sno, Sdept, Sloc) ∈ 2NF
S-L(Sno, Sdept, Sloc) ∈ 3NF
S-D(Sno,Sdept) ∈ 3NF
D-L(Sdept, Sloc)∈ 3NF3NF(续)3NF(续)采用投影分解法将一个2NF的关系分解为多个3NF的关系,可以在一定程度上解决原2NF关系中存在的插入异常、删除异常、数据冗余度大、修改复杂等问题。
将一个2NF关系分解为多个3NF的关系后,仍然不能完全消除关系模式中的各种异常情况和数据冗余。6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结 6.2.6 BC范式(BCNF) 6.2.6 BC范式(BCNF)定义6.8 关系模式R∈1NF,若X→Y且Y X时X必含有码,则R ∈BCNF。
等价于:每一个决定属性因素都包含码
BCNF(续)BCNF(续)若R∈BCNF
所有非主属性对每一个码都是完全函数依赖
所有的主属性对每一个不包含它的码,也是完全函数依赖
没有任何属性完全函数依赖于非码的任何一组属性
R ∈BCNF R ∈3NFBCNF(续)BCNF(续)[例5] 关系模式C(Cno,Cname,Pcno)
C∈3NF
C∈BCNF
[例6] 关系模式S(Sno,Sname,Sdept,Sage)
假定S有两个码Sno,Sname
S∈3NF。
S ∈ BCNFBCNF(续)BCNF(续)[例7]关系模式SJP(S,J,P)
函数依赖:(S,J)→P;(J,P)→S
(S,J)与(J,P)都可以作为候选码,属性相交
SJP∈3NF,
SJP∈BCNF BCNF(续) BCNF(续)[例8]在关系模式STJ(S,T,J)中,S表示学生,T表示教师,J表示课程。
函数依赖:
(S,J)→T,(S,T)→J,T→J
(S,J)和(S,T)都是候选码 BCNF(续) BCNF(续) JBCNF(续)BCNF(续)STJ∈3NF
没有任何非主属性对码传递依赖或部分依赖
STJ∈BCNF
T是决定因素,T不包含码BCNF(续)BCNF(续)解决方法:将STJ分解为二个关系模式:
ST(S,T) ∈ BCNF, TJ(T,J)∈ BCNF
没有任何属性对码的部分函数依赖和传递函数依赖3NF与BCNF的关系3NF与BCNF的关系R ∈BCNF R ∈3NF
如果R∈3NF,且R只有一个候选码
R ∈BCNF R ∈3NF
6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结6.2.7 多值依赖6.2.7 多值依赖[例9] 学校中某一门课程由多个教师讲授,他们使用相同的一套参考书。每个教员可以讲授多门课程,每种参考书可以供多门课程使用。
null…
…
…多值依赖(续)非规范化关系多值依赖(续)多值依赖(续)用二维表表示Teaching多值依赖(续)多值依赖(续)Teaching∈BCNF
Teaching具有唯一候选码(C,T,B), 即全码
多值依赖(续)多值依赖(续) Teaching模式中存在的问题
(1)数据冗余度大
(2)插入操作复杂
(3) 删除操作复杂
(4) 修改操作复杂存在
多值依赖多值依赖(续)多值依赖(续)定义6.9
设R(U)是一个属性集U上的一个关系模式, X、 Y和Z是U的子集,并且Z=U-X-Y。关系模式R(U)中多值依赖 X→→Y成立,当且仅当对R(U)的任一关系r,给定的一对(x,z)值,有一组Y的值,这组值仅仅决定于x值而与z值无关
例 Teaching(C, T, B)多值依赖(续)多值依赖(续)多值依赖的另一个等价的形式化的定义:
在R(U)的任一关系r中,如果存在元组t,s 使得t[X]=s[X],那么就必然存在元组 w,v r,(w,v可以与s,t相同),使得w[X]=v[X]=t[X],而w[Y]=t[Y],w[Z]=s[Z],v[Y]=s[Y],v[Z]=t[Z](即交换s,t元组的Y值所得的两个新元组必在r中),则Y多值依赖于X,记为X→→Y。 这里,X,Y是U的子集,Z=U-X-Y。多值依赖(续)多值依赖(续)平凡多值依赖和非平凡的多值依赖
若X→→Y,而Z=φ,则称
X→→Y为平凡的多值依赖
否则称X→→Y为非平凡的多值依赖多值依赖(续)多值依赖(续)[例10]关系模式WSC(W,S,C)
W表示仓库,S表示保管员,C表示商品
假设每个仓库有若干个保管员,有若干种商品
每个保管员保管所在的仓库的所有商品
每种商品被所有保管员保管
多值依赖(续)多值依赖(续)多值依赖(续)多值依赖(续)W→→S且W→→C用下图表示这种对应 多值依赖的性质多值依赖的性质(1)多值依赖具有对称性
若X→→Y,则X→→Z,其中Z=U-X-Y
(2)多值依赖具有传递性
若X→→Y,Y→→Z, 则X→→Z –Y
(3)函数依赖是多值依赖的特殊情况。
若X→Y,则X→→Y。
(4)若X→→Y,X→→Z,则X→→Y Z。
(5)若X→→Y,X→→Z,则X→→Y∩Z。
(6)若X→→Y,X→→Z,则X→→Y-Z,X→→Z -Y。多值依赖与函数依赖的区别多值依赖与函数依赖的区别(1) 多值依赖的有效性与属性集的范围有关
(2)
若函数依赖X→Y在R(U)上成立,则对于任何Y' Y均有X→Y' 成立
多值依赖X→→Y若在R(U)上成立,不能断言对于任何Y' Y有X→→Y' 成立
6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结6.2.8 4NF6.2.8 4NF定义6.10 关系模式R∈1NF,如果对于R的每个非平凡多值依赖X→→Y(Y X),X都含有码,则R∈4NF。
如果R ∈ 4NF, 则R ∈ BCNF
不允许有非平凡且非函数依赖的多值依赖
允许的非平凡多值依赖是函数依赖4NF(续)4NF(续)例: Teaching(C,T,B) ∈ 4NF
存在非平凡的多值依赖C→→T,且C不是码
用投影分解法把Teaching分解为如下两个关系模式:
CT(C, T) ∈ 4NF
CB(C, B) ∈ 4NF
C→→T, C→→B是平凡多值依赖
6.2 规范化6.2 规范化6.2.1 函数依赖
6.2.2 码
6.2.3 范式
6.2.4 2NF
6.2.5 3NF
6.2.6 BCNF
6.2.7 多值依赖
6.2.8 4NF
6.2.9 规范化小结6.2.9 规范化小结6.2.9 规范化小结关系数据库的规范化理论是数据库逻辑设计的工具
目的:尽量消除插入、删除一场,修改复杂,数据冗余
基本思想:逐步消除数据依赖中不合适的部分
实质:概念的单一化规范化小结(续)规范化小结(续)关系模式规范化的基本步骤
1NF
↓ 消除非主属性对码的部分函数依赖
消除决定属性 2NF
集非码的非平 ↓ 消除非主属性对码的传递函数依赖
凡函数依赖 3NF
↓ 消除主属性对码的部分和传递函数依赖
BCNF
↓ 消除非平凡且非函数依赖的多值依赖
4NF规范化小结(续)规范化小结(续)不能说规范化程度越高的关系模式就越好
在设计数据库模式结构时,必须对现实世界的实际情况和用户应用需求作进一步分析,确定一个合适的、能够反映现实世界的模式
上面的规范化步骤可以在其中任何一步终止第六章 关系数据理论第六章 关系数据理论6.1 问题的提出
6.2 规范化
6.3 数据依赖的公理系统
*6.4 模式的分解
6.5 小结6.3 数据依赖的公理系统6.3 数据依赖的公理系统逻辑蕴含
定义6.11 对于满足一组函数依赖 F 的关系模式R ,其任何一个关系r,若函数依赖X→Y都成立, (即r中任意两元组t,s,若tX]=sX],则tY]=sY]),则称F逻辑蕴含X →Y1. Armstrong公理系统1. Armstrong公理系统 关系模式R 来说有以下的推理规则:
A1.自反律(Reflexivity):若Y X U,则X →Y为F所蕴含。
A2.增广律(Augmentation):若X→Y为F所蕴含,且Z U,则XZ→YZ为F所蕴含。
A3.传递律(Transitivity):若X→Y及Y→Z为F所蕴含,则X→Z为F所蕴含。定理 6.1 Armstrong推理规则是正确的定理 6.1 Armstrong推理规则是正确的(l)自反律: 若Y X U,则X →Y为F所蕴含
证: 设Y X U
对R 的任一关系r中的任意两个元组t,s:
若t[X]=s[X],由于Y X,有t[y]=s[y],
所以X→Y成立,自反律得证定理 6.l Armstrong推理规则是正确的(续)定理 6.l Armstrong推理规则是正确的(续)(2)增广律: 若X→Y为F所蕴含,且Z U,则XZ→YZ 为F所蕴含。
证:设X→Y为F所蕴含,且Z U。
设R 的任一关系r中任意的两个元组t,s:
若t[XZ]=s[XZ],则有t[X]=s[X]和t[Z]=s[Z];
由X→Y,于是有t[Y]=s[Y],所以t[YZ]=s[YZ],所以
XZ→YZ为F所蕴含,增广律得证。定理 6.l Armstrong推理规则是正确的(续)定理 6.l Armstrong推理规则是正确的(续)(3) 传递律:若X→Y及Y→Z为F所蕴含,则 X→Z为 F所蕴含。
证:设X→Y及Y→Z为F所蕴含。
对R 的任一关系 r中的任意两个元组 t,s:
若t[X]=s[X],由于X→Y,有 t[Y]=s[Y];
再由Y→Z,有t[Z]=s[Z],所以X→Z为F所蕴含,传递
律得证。2. 导出规则2. 导出规则1.根据A1,A2,A3这三条推理规则可以得到下面三条推理规则:
合并规则:由X→Y,X→Z,有X→YZ。
(A2, A3)
伪传递规则:由X→Y,WY→Z,有XW→Z。
(A2, A3)
分解规则:由X→Y及 ZY,有X→Z。
(A1, A3)导出规则导出规则2.根据合并规则和分解规则,可得引理6.1
引理6.l X→A1 A2…Ak成立的充分必要条件是X→Ai成立(i=l,2,…,k)Armstrong公理系统Armstrong公理系统Armstrong公理系统是有效的、完备的
有效性:由F出发根据Armstrong公理推导出来的每一个函数依赖一定在F+中;
完备性:F+中的每一个函数依赖,必定可以由F出发根据Armstrong公理推导出来3. 函数依赖闭包3. 函数依赖闭包定义6.l2 在关系模式R中为F所逻辑蕴含的函数依赖的全体叫作 F的闭包,记为F+。
定义6.13 设F为属性集U上的一组函数依赖,X U, XF+ ={ A|X→A能由F 根据Armstrong公理导出},XF+称为属性集X关于函数依赖集F 的闭包
F的闭包F的闭包F={XY, YZ}
F+={
Xφ, Yφ, Zφ, XYφ, XZφ, YZφ, XYZφ,
XX, YY, ZZ, XYX, XZX, YZY, XYZX,
XY, Y Z, XYY, XZY, YZZ, XYZY,
XZ, YYZ, XYZ, XZZ, YZYZ,XYZZ,
XXY, XYXY,XZXY, XYZXY,
XXZ, XYYZ,XZXZ, XYZYZ,
XYZ, XYXZ,XZXY, XYZXZ,
XZYZ, XYXYZ,XZXYZ, XYZXYZ }
F={XA1, …… , XAn}的闭包F+计算是一个NP完全问题关于闭包的引理关于闭包的引理引理6.2
设F为属性集U上的一组函数依赖,X,Y U,X→Y能
由F 根据Armstrong公理导出的充分必要条件是Y XF+
用途
将判定X→Y是否能由F根据Armstrong公理导出的问题,转化为求出XF+ 、判定Y是否为XF+的子集的问题求闭包的算法求闭包的算法算法6.1 求属性集X(X U)关于U上的函数依赖集F 的闭包XF+
输入:X,F 输出:XF+
步骤:
(1)令X(0)=X,i=0
(2)求B,这里B = { A |( V)( W)(V→WF∧V X(i)∧A W)};
(3)X(i+1)=B∪X(i)
(4)判断X(i+1)= X (i)吗?
(5)若相等或X(i)=U , 则X(i)就是XF+ , 算法终止。
(6)若否,则 i=i+l,返回第(2)步。算法6.1算法6.1 对于算法6.1, 令ai =|X(i)|,{ai }形成一个步长大于1的严格递增的序列,序列的上界是 | U |,因此该算法最多 |U| - |X| 次循环就
会终止。函数依赖闭包函数依赖闭包[例1] 已知关系模式R,其中
U={A,B,C,D,E};
F={AB→C,B→D,C→E,EC→B,AC→B}。
求(AB)F+ 。
解 设X(0)=AB;
(1) X(1)=AB∪CD=ABCD。
(2) X(0)≠ X(1)
X(2)=X(1)∪BE=ABCDE。
(3) X(2)=U,算法终止
(AB)F+ =ABCDE。4. Armstrong公理系统的有效性与完备性4. Armstrong公理系统的有效性与完备性定理6.2 Armstrong公理系统是有效的、完备的
证明:
1. 有效性
可由定理6.1得证
2. 完备性
只需证明逆否命题: 若函数依赖X→Y不能由F从Armstrong公理导出,那么它必然不为F所蕴含Armstrong公理系统完备性证明Armstrong公理系统完备性证明(1) 引理: 若V→W成立,且V XF+,则W XF+
(2) 构造一张二维表r,它由下列两个元组构成,可以证明r必是R(U,F)的一个关系,即F+中的全部函数依赖在 r上成立。
XF+ U-XF+
11......1 00......0
11......1 11......1
(3) 若X→Y 不能由F从Armstrong公理导出,则Y 不是XF+ 的子集。5. 函数依赖集等价5. 函数依赖集等价定义6.14 如果G+=F+,就说函数依赖集F覆盖G(F是G的覆盖,或G是F的覆盖),或F与G等价。
引理6.3 F+ = G+ 的充分必要条件是F G+ ,和G F+
证: 必要性显然,只证充分性。
(1)若FG+ ,则XF+ XG++ 。
(2)任取X→YF+ 则有 Y XF+ XG++ 。
所以X→Y (G+)+= G+。即F+ G+。
(3)同理可证G+ F+ ,所以F+ = G+。6. 最小依赖集6. 最小依赖集定义6.15 如果函数依赖集F满足下列条件,则称F为一个极小函数依赖集。亦称为最小依赖集或最小覆盖。
(1) F中任一函数依赖的右部仅含有一个属性。
(2) F中不存在这样的函数依赖X→A,使得F与F-{X→A}等价。
(3) F中不存在这样的函数依赖X→A, X有真子集Z使得F-{X→A}∪{Z→A}与F等价。 最小依赖集最小依赖集[例2] 关系模式S,其中:
U={ Sno,Sdept,Mname,Cno,Grade },
F={ Sno→Sdept,Sdept→Mname,(Sno,Cno)→Grade }
设F’={Sno→Sdept,Sno→Mname,Sdept→Mname,
(Sno,Cno)→Grade,(Sno,Sdept)→Sdept}
F是最小覆盖,而F’不是。
因为:F ’ - {Sno→Mname}与F ’等价
F ’ - {(Sno,Sdept)→Sdept}也与F ’等价 7. 极小化过程7. 极小化过程定理6.3 每一个函数依赖集F均等价于一个极小函数依赖
集Fm。此Fm称为F的最小依赖集。
证明: 构造性证明,找出F的一个最小依赖集。
极小化过程(续)极小化过程(续)(1)逐一检查F中各函数依赖FDi:X→Y,若Y=A1A2 …Ak,k > 2,
则用 { X→Aj |j=1,2,…, k} 来取代X→Y。
(2)逐一检查F中各函数依赖FDi:X→A,令G=F-{X→A},
若AXG+, 则从F中去掉此函数依赖。
(3)逐一取出F中各函数依赖FDi:X→A,设X=B1B2…Bm,
逐一考查Bi (i=l,2,…,m),若A (X-Bi )F+ ,
则以X-Bi 取代X。极小化过程(续)极小化过程(续)[例3] F = {A→B,B→A,B→C,A→C,C→A}
Fm1、Fm2都是F的最小依赖集:
Fm1= {A→B,B→C,C→A}
Fm2= {A→B,B→A,A→C,C→A}
F的最小依赖集Fm不唯一
极小化过程( 定理6.3的证明 )也是检验F是否为极小依赖集的一个算法第六章 关系数据理论第六章 关系数据理论6.1 问题的提出
6.2 规范化
6.3 数据依赖的公理系统
*6.4 模式的分解
6.5 小结6.4 模式的分解6.4 模式的分解把低一级的关系模式分解为若干个高一级的关系模式的方法不是唯一的
只有能够保证分解后的关系模式与原关系模式等价,分解方法才有意义关系模式分解的标准关系模式分解的标准
三种模式分解等价的定义:
⒈ 分解具有无损连接性
⒉ 分解要保持函数依赖
⒊ 分解既要保持函数依赖,又要具有无损连接性模式的分解(续)模式的分解(续)定义6.16 关系模式R的一个分解:
ρ={ R1,R2,…,Rn}
U= ∪Ui,且不存在 Ui Uj,Fi 为 F在 Ui 上的投影
定义6.17 函数依赖集合{X→Y | X→Y F+∧XY Ui} 的一个覆盖 Fi 叫作 F 在属性 Ui 上的投影i=1n模式的分解(续)模式的分解(续)例:S-L(Sno, Sdept, Sloc)
F={ Sno→Sdept,Sdept→Sloc,Sno→Sloc}
S-L∈2NF
分解方法可以有多种:
1. S-L分解为三个关系模式:SN(Sno)
SD(Sdept)
SO(Sloc)
2. SL分解为下面二个关系模式: NL(Sno, Sloc)
DL(Sdept, Sloc)
3. 将SL分解为下面二个关系模式: ND(Sno, Sdept)
NL(Sno, Sloc)
具有无损连接性的模式分解具有无损连接性的模式分解关系模式R的一个分解 ρ={ R1,R2, …,Rn}
若R与R1、R2、…、Rn自然连接的结果相等,则称关系模式R的这个分解ρ具有无损连接性(Lossless join)
具有无损连接性的分解保证不丢失信息
无损连接性不一定能解决插入异常、删除异常、修改复杂、数据冗余等问题模式的分解(续)模式的分解(续) 第3种分解方法具有无损连接性
问题:这种分解方法没有保持原关系中的函数依赖
SL中的函数依赖Sdept→Sloc没有投影到关系模式ND、NL上
保持函数依赖的模式分解保持函数依赖的模式分解设关系模式R被分解为若干个关系模式
R1,R2,…,Rn
(其中U=U1∪U2∪…∪Un,且不存在Ui Uj,Fi为F在Ui上的投影),若F所逻辑蕴含的函数依赖一定也由分解得到的某个关系模式中的函数依赖Fi所逻辑蕴含,则称关系模式R的这个分解是保持函数依赖的(Preserve dependency)模式的分解(续)模式的分解(续)4. 将SL分解为下面二个关系模式:
ND(Sno, Sdept)
DL(Sdept, Sloc)
这种分解方法就保持了函数依赖模式的分解(续)模式的分解(续)如果一个分解具有无损连接性,则它能够保证不丢失信息
如果一个分解保持了函数依赖,则它可以减轻或解决各种异常情况
分解具有无损连接性和分解保持函数依赖是两个互相独立的标准。具有无损连接性的分解不一定能够保持函数依赖;同样,保持函数依赖的分解也不一定具有无损连接性。模式的分解(续)模式的分解(续)第1种分解方法既不具有无损连接性,也未保持函数依赖,
它不是原关系模式的一个等价分解
第2种分解方法保持了函数依赖,但不具有无损连接性
第3种分解方法具有无损连接性,但未持函数依赖
第4种分解方法既具有无损连接性,又保持了函数依赖分解算法分解算法算法6.2 判别一个分解的无损连接性
算法6.3(合成法)转换为3NF的保持函数依赖的分解。
算法6.4 转换为3NF既有无损连接性又保持函数依赖的分解
算法6.5 (分解法)转换为BCNF的无损连接分解
算法6.6 达到4NF的具有无损连接性的分解 第六章 关系数据理论第六章 关系数据理论6.1 问题的提出
6.2 规范化
6.3 数据依赖的公理系统
*6.4 模式的分解
6.5 小结6.5 小结6.5 小结关系模式的规范化,其基本思想: 小结(续)小结(续)若要求分解具有无损连接性,那么模式分解一定能够达到4NF
若要求分解保持函数依赖,那么模式分解一定能够达到3NF,但不一定能够达到BCNF
若要求分解既具有无损连接性,又保持函数依赖,则模式分解一定能够达到3NF,但不一定能够达到BCNF小结(续)小结(续)规范化理论为数据库设计提供了理论的指南和工具
也仅仅是指南和工具
并不是规范化程度越高,模式就越好
必须结合应用环境和现实世界的具体情况合理地选择数据库模式
下课了。。。 下课了。。。休息一会儿。。。
本文档为【chp6】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑,
图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。