为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

数据库原理数据库原理

2018-09-06 50页 doc 365KB 80阅读

用户头像

is_125367

暂无简介

举报
数据库原理数据库原理总复习 一、关系数据模型的基本概念 · 实体、实体集、属性、属性值域、关系、元组、表、行、列、侯选键等概念。 · 主键和外键概念。以及关系与关系之间的联系的实现方法。            关系与关系之间的联系:通过公共属性。公共属性是一个表的主键,是另一个表的外键。这是关系数据库的重要特点。 · 关系模型可提供3种完整性约束:         实体完整性、参照完整性、用户自定义的完整性。    其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,称为关系完整性约束条件规则。 二、关系代...
数据库原理数据库原理
总复习 一、关系数据模型的基本概念 · 实体、实体集、属性、属性值域、关系、元组、表、行、列、侯选键等概念。 · 主键和外键概念。以及关系与关系之间的联系的实现方法。            关系与关系之间的联系:通过公共属性。公共属性是一个表的主键,是另一个表的外键。这是关系数据库的重要特点。 · 关系模型可提供3种完整性约束:         实体完整性、参照完整性、用户自定义的完整性。    其中实体完整性和参照完整性是关系模型必须满足的完整性约束条件,称为关系完整性约束条件规则。 二、关系代数与关系数据库操作    关系代数是关系数据库系统查询语言的理论基础。 · 关系代数的9种操作:      并、交、差、乘、选择、投影、联接、除、自然联接运算。 五个基本操作:    并(∪)    差(-)     笛卡尔积(×)   投影(σ)   选择(π) 四个组合操作:    交(∩)    联接(等值联接)   自然联接(R · 关系代数表达式:     由关系代数运算经有限次复合而成的式子称为关系代数表达式。这种表达式的运算结果仍然是一个关系。可以用关系代数表达式表示对数据库的查询和更新操作。 关系代数(演算)要求掌握各种语句的应用,多做书中的例题可以帮助自己熟能生巧。 关系代数表达式举例   · 关系代数表达式的优化:   目的:为了系统在执行时既省时间又能提高效率。   基本策略:先做选择,运用投影去除多余属性等等。   优化算法:语法树(详见教材。尽量提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值)     对于一些简单的代数表达式,直接用“尽量提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值”直接写出即可。 比如,设有三个关系:     S(S#,SNAME,AGE,SEX)     SC(S#,C#,GRADE)     C(C#,CNAME,TEACHER) 关系代数表达式为:               πS#,SNAME(σGRADE>60(SSC)) 优化为:πS#,SNAME(πS#,SNAME(S)πS#(σGRADE>60(SC))) 语法树举例     三、关系演算     关系演算(把数理逻辑的谓词演算引入到关系运算中),该理论也应掌握。掌握的深度要求比关系代数略低一些。 · 理解一些量词及符号的含义:、、=>、∧、∨、┐ · 元组演算表达式的一般形式为:{t|P(t)} 理解一些量词及符号的含义,理解元组表达式的含义就简单多了(要多作习题):        比如,设有三个关系:                 S(S#,SNAME,AGE,SEX)                 SC(S#,C#,GRADE)                 C(C#,CNAME,TEACHER)     {t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])} 可以这样理解:       t是所求元组       对于t ,存在元组U,U是关系C的一个元组并且C的第三个分量是“LIU",t的第一个分量等于U的第一个分量,t的第二个分量等于U的第二个分量       综上,题意:检索LIU老师所授课程的课程号(第一个分量)、课程名(第二个分量)。      · 域关系演算     域演算表达式的一般形式为:{t1...tk|P(t1...,tk)}     其含义为:这是一个域集合,其中每个域变量的取值关系满足公式P所规定的条件。     元组关系表达式转换成域表达式: (1)对于k元的元组变量t,引入k个域变量t1...tk,在公式中t用t1...tk替换,元组量t[i]用ti替换。 (2)对于每个量词(u)或(u),若u是m元的元组变量,则引入m个新的域变量u1...um。在量词的辖域内,u用u1...um替换,u[i]用ui替换,(u)用(u1)...(um)替换,(u)用(u1)...(um)替换。   比如,{t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])}转换为       {t1t2|(u1)(u2)(C(u1u2u3)∧u2='LIU'∧t1=u1∧t2=u2)}      表达式的转换不用强记,关键要从语义上理解。     比如,{t1t2|(u1)(u2)(C(u1u2u3)∧u3='LIU'∧t1=u1∧t2=u2)}     可以这样理解:       所求结果有t1、t2两个域,存在u1,u2与它们分别相等(u1,u2为关系C中两个域,对应的U3为'LIU')。   综上,题意:检索LIU老师所授课程的课程号(第一个域)、课程名(第二个域)。 四、SQL语言 结构化查询语句SQL是本教材的重点,应多做例题、习题加以领会。 1.SQL数据库的体系结构要点。  2. SQL语言的四个主要部分。 3. 数据定义命令。 · 建立数据库(模式):CREATE SCHEMA 命令。 · 撤消数据库:DROP SCHEMA 命令          CASCADE(连锁式)、RESTRICT(约束式)的区别 · 建立表结构:CREATE TABLE命令。要会使用数据类型说明属性的性质。 · 对表结构进行修改的操作用ALTER命令(删除列用DROP,或增加新的列用ADD)。        e.g.  ALTER TABLE S ADD ADDRESS VARCHAR(30)              ALTER TABLE  S  DROP  AGE  CASCADE              ALTER TABLE  S  DROP  AGE  RESTRICT CASCADE为连锁删除,RESTRICT为约束删除,即没有对本列的任何引用时才能删除。 · 建立视图的CREATE VIEW命令。 · 撤消视图的DROP VIEW命令。 4. 索引的创建与撤消。 · 建立索引的CREATE INDEX命令,学用UNIQUE建立唯一(性)索引。 · 撤消索引的CREATE INDEX命令。 5.数据查询,要求达到综合应用的层次。     用SELECT命令实现选择与投影操作,选择对应于WHERE子句,投影对应于SELECT子句。 对于条件表达式中要用到的所有运算符(关系、逻辑、特殊),都应使用。 · 对输出的目标列进行排序的ORDER BY子句。 · 消除重复的DISTINCT。 · SQL的数值函数(COUNT 、MIN 、MAX 、AVG 、SUM)和查询嵌套。 · 按属性(列名)的值进行分组的GROUP BY子句。 · 多表连接操作(联接查询、嵌套查询) 用SELECT命令表达查询的较完整的语法格式是:         SELECT<目标表的列名或列表达式序列>         FROM<表名序列>         [WHERE<行条件表达式>]         [GROUP BY<列名>         [HAVING<组条件表达式>]]         [ORDER BY<列名>[DESC],…]; 其执行过程如下:     (1) 读取FROM子句中表或视图的数据,执行笛卡尔乘积操作。     (2) 选取满足WHERE子句中给出的条件表达式的元组。     (3) 按GROUP子句中指定列的值分组,同时提取满足HAVING子句中组条件表达式的那些组。     (4) 按SELECT 子句中给出 的列名或列表达式求值输出。     (5) 按ORDER子句对输出的目标表进行排序,按附加说明DESC降序排列,默认为升序排列。 6. SQL的数据更新 · 插入(增加)一行或多行到表中的操作用INSERT  INTO命令。 · 从表中删除行(元组)的操作用DELETE FROM命令。 · 修改列值用UPDATE命令 事务提交用COMMIT命令,事务回滚用ROLLBACK命令。 注意UPDATE命令ALTER命令、DELETE命令与DTOP命令含义的不同 7. SQL中的完整性约束 · 用PRIMARY KEY指明主键; · 用 FOREIGN KEY…REFERENCES…指明外键和参照关系,即参照完整性规则。 · 在属性值上的约束:非空值约束NOT NULL;CHECK子句 · 全局约束:CHECK子句;断言ASSERTIONS 举例:     断言          CHECK子句   五、ER模型 在E-R模型中,主要有实体、属性、联系三个部分组成。 含义 表示方式 实体 考虑问题的对象(学生) 属性 实体或联系的某一特性(姓名) 联系 实体之间的联系(学习)   建立E-R图的过程如下:     (1) 首先确定实体类型。     (2) 确定联系类型(1:1,1:N,M:N)。     (3) 把实体类型和联系类型组成E-R图。     (4) 确定实体类型和联系类型的属性。     (5) 确定实体类型的键,在属于键的属性名下划一条横线。   E-R图示例   六、将ER模型转换成关系数据库  ER模型转换关系数据库的 一般规则:    (1) 将每一个实体类型转换成一个关系模式,实体的属性为关系模式的属性。    (2) 对于二元联系,按各种情况处理,如下面所示。 二元关系 ER图 转换成的关系 联系的处理 主键 外键 1:1 (2个关系) 模式A 模式B (有两种)   处理方式(1): (1)把模式B的主键,联系的属性加入模式A 处理方式(2): (2)把模式A的主键,联系的属性加入模式B   (略)   (依据联系的处理方式) 方式(1): 模式B的主键为模式A外键  方式(2): 表A的主键为表B的外键 1:N (2个关系) 模式A 模式B   把模式A的主键,联系的属性加入模式B     (略) 模式A的主键为模式B的外键 M:N (3个关系) 模式A 模式B 模式A-B 联系类型转换成关系模式A-B; 模式A-B的属性: (a)联系的属性 (b)两端实体类型的主键 两端实体类型的主键一起构成模式A-B主键 两端实体类型的主键分别为模式A-B的外键     M:N联系的示例     1:N联系的示例   七、函数依赖及范式 函数依赖基本概念: · 函数依赖:FD(function dependency),设有关系模式R(U),X,Y是U的子集, r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X函数决定Y,或Y函数依赖于X,记为X→Y。X→Y为模式R的一个函数依赖。 · 部分函数依赖:即局部依赖,对于一个函数依赖W→A,如果存在XW(X包含于W)有X→A成立, 那么称W→A是局部依赖,否则称W→A为完全函数依赖。 · 传递依赖:在关系模式中,如果Y→X,X→A,且XY(X不决定Y), AX(A不属于X),那么称Y→A是传递依赖。 · 函数依赖集F的闭包F+: 被逻辑蕴涵的函数依赖的全体构成的集合,称为F的闭包(closure),记为F+。 · 最小依赖集:如果函数集合F满足以下三个条件(1)F中每个函数依赖的右部都是单属性; (2)F中的任一函数依赖X→A,其F-{X→A}与F是不等价的;(3)F中的任一函数依赖X→A,Z为X的子集,(F-{X→A})∪{Z→A}与F不等价。则称F为最小函数依赖集合,记为Fmin。 函数依赖的公理系统:     设有关系模式R(U),X,Y,Z,W均是U的子集,F是R上只涉及到U中属性的函数依赖集,推理规则如下: · 自反律:如果YXU,则X→Y在R上成立。 · 增广律:如果X→Y为F所蕴涵,ZU,则XZ→YZ在R上成立。(XZ表示X∪Z,下同) · 传递律:如果X→Y和Y→Z在R上成立,则X→Z在R上成立。 以上三条为Armstrong公理系统 · 合并律:如果X→Y和X→Z成立,那么X→YZ成立。 · 伪传递律:如果X→Y和WY→Z成立,那么WX→Z成立。 · 分解律:如果X→Y和ZY成立,那么X→Z成立。 这三条为引理    注意: · 函数依赖推理规则系统(自反律、增广律和传递律)是完备的。 · 由自反律所得到的函数依赖均是平凡的函数依赖。 四种范式的含义: · 如果某个数据库模式都是第一范式的,则称该数据库模式是属于第一范式的数据库模式。 · 如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键,则称为第二范式模式。 · 如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键,则称R为第三范式模式。 · 若关系模式R是第一范式,且每个属性都不传递依赖于R的候选键。这种关系模式就是BCNF模式。 四种范式,可以发现它们之间存在如下关系:         BCNF3NF2NF1NF 1NF ↓ 消去非主属性对键的部分函数依赖 2NF ↓ 消去非主属性对键的传递函数依赖 3NF ↓ 消去主属性对键的传递函数依赖 BCNF  范式举例   模式分解 模式分解的三个准则: · 分解具有“无损连接性” · 分解要“保持函数依赖” · 分解既要“保持函数依赖”,又要具有“无损连接性”  模式分解举例   模式分解与范式的关系 如果关系模式没有达到所需的范式,则需要模式分解 模式分解的几个重要事实: · 若只要求分解具有“无损连接性”,一定可以达到4NF; · 若要求分解要“保持函数依赖”,可以达到3NF,但不一定能达到BCNF; · 若要求分解既要“保持函数依赖”,又要具有“无损连接性”,可以达到3NF,但不一定能达到BCNF;    八、数据库设计与并发控制  设计步骤; 并发控制带来的三类问题   (1)丢失更新的问题   (2)不一致问题   (3)“脏数据”的读出。(在数据库技术中,未提交的随后又被撤消的数据为“脏数据”。) 以上三类问题结合多事务的并行操作进行理解。 举例     为解决并发控制带来的问题,通常要采用封锁(locking)技术,常用的封锁有:排它型封锁(X封锁)和共享型封锁(S封锁)两种。 并发控制中,有许多概念都要掌握:封锁,X封锁,S封锁,PX协议,PXC协议,PS协议,PSC协议,活锁,死锁,可串行化调度,不可串行化调度,两段封锁协议 习题 复 习 习 题 习题1 1.1 名词解释 (1) DB:即数据库(Database),是统一管理的相关数据的集合。 DB能为各种用户共享,具有最小冗余度,数据间联系密切,而又有较高的数据独立性。 (2) DBMS:即数据库管理系统(Database Management System),是位于用户与操作系统之间的一层数据管理软件, 为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各种数据控制。 DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型、面向对象型DBMS。 (3) DBS:即数据库系统(Database System),是实现有组织地、动态地存储大量关联数据, 方便多用户访问的计算机软件、硬件和数据资源组成的系统,即采用了数据库技术的计算机系统。 (4) 1:1联系:如果实体集E1中的每个实体最多只能和实体集E2中的一个实体有联系,反之亦然, 那么实体集E1对E2的联系称为“一对一联系”,记为“1:1”。 (5) 1:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系, 而E2中每个实体至多和E1中的一个实体有联系,那么E1对E2的联系是“一对多联系”,记为“1:N”。 (6) M:N联系:如果实体集E1中每个实体与实体集E2中任意个(零个或多个)实体有联系, 反之亦然,那么E1对E2的联系是“多对多联系”,记为“M:N”。 (7) 数据模型:模型是对现实世界的抽象。在数据库技术中,表示实体类型及实体类型间联系的模型称为“数据模型”。 它可分为两种类型:概念数据模型和结构数据模型。 (6) 概念数据模型:是独门于计算机系统的模型,完全不涉及信息在系统中的表示, 只是用来描述某个特定组织所关心的信息结构。 (9) 结构数据模型:是直接面向数据库的逻辑结构,是现实世界的第二层抽象。 这类模型涉及到计算机系统和数据库管理系统,所以称为“结构数据模型”。 结构数据模型应包含:数据结构、数据操作、数据完整性约束三部分。它主要有:层次、网状、关系三种模型。 (10) 层次模型:用树型结构表示实体类型及实体间联系的数据模型。 (11) 网状模型:用有向图结构表示实体类型及实体间联系的数据模型。 (12) 关系模型:是目前最流行的数据库模型。其主要特征是用二维表格结构表达实体集,用外鍵表示实体间联系。 关系模型是由若干个关系模式组成的集合。 (13) 概念模式:是数据库中全部数据的整体逻辑结构的描述。它由若干个概念类型组成。 概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 (14) 外模式:是用户与数据库系统的接口,是用户用到的那部分数据的描述。 (15) 内模式:是数据库在物理存储方面的描述,定义所有的内部记录类型、索引和文件的组成方式, 以及数据控制方面的细节。 (16) 模式/内模式映象:这个映象存在于概念级和内部级之间,用于定义概念模式和内模式间的对应性, 即概念记录和内部记录间的对应性。此映象一般在内模式中描述。 (17) 外模式/模式映象:这人映象存在于外部级和概念级之间,用于定义外模式和概念模式间的对应性, 即外部记录和内部记录间的对应性。此映象都是在外模式中描述。 (18) 数据独立性:在数据库技术中,数据独立性是指应用程序和数据之间相互独立,不受影响。 数据独立性分成物理数据独立性和逻辑数据独立性两级。 (19) 物理数据独立性:如果数据库的内模式要进行修改,即数据库的存储设备和存储方法有所变化, 那么模式/内模式映象也要进行相应的修改,使概念模式尽可能保持不变。也就是对模式的修改尽量不影响概念模式。 (20) 逻辑数据独立性:如果数据库的概念模式要进行修改(如增加记录类型或增加数据项), 那么外模式/模式映象也要进行相应的修改,使外模式尽可能保持不变。 也就是对概念模式的修改尽量不影响外模式和应用程序。 (21) 宿主语言:在数据库技术中,编写应用程序的语言仍然是一些高级程序设计语言, 这些语言称为宿主语言(host language),简称主语言。 (22) DDL:数据定义语言(Data Definition Language),用于定义数据库的三级结构,包括外模式、概念模式、内模式及其相互之间的映象,定义数据的完整性、安全控制等约束。 (23) DML:数据操纵语言(Data Manipulation Language),由DBMS提供,用于让用户或程序员使用,实现对数据库中数据的操作。 DML分成交互型DML和嵌入型DML两类。依据语言的级别,DML又可分成过程性DML和非过程性DML两种。 (24) 交互型DML:如果DML自成系统,可在终端上直接对数据库进行操作,这种DML称为交互型DML。 (25) 嵌入型DML:如果DML嵌入在主语言中使用,此时主语言是经过扩充能处理DML语句的语言,这种DML称为嵌入型DML。 (26) 过程性DML:用户编程时,不仅需要指出“做什么”(需要什么样的数据),还需要指出“怎么做”(怎么获得数据)。层状、网状的DML属于过程性语言。 (27) 非过程性DML:用户编程时,只需要指出“做什么”,不需要指出“怎么做”。 Notice:以上关于DML的各个概念单独出现时,首先要解释DML的含义。 (28) DD:数据字典(Data Dictionary),数据库系统中存放三级结构定义的数据库称为数据字典。 对数据库的操作都要通过访问DD才能实现。 (29) DD系统:管理DD的实用程序称为“DD系统”。 1.2 文件系统阶段的数据管理有些什么缺陷?试举例说明。 文件系统有三个缺陷:  (1)数据冗余性(redundancy)。由于文件之间缺乏联系,造成每个应用程序都有对应的文件, 有可能同样的数据在多个文件中重复存储。  (2)数据不一致性(inconsistency)。这往往是由数据冗余造成的,在进行更新操作时,稍不谨慎, 就可能使同样的数据在不同的文件中不一样。  (3)数据联系弱(poor data relationship)。这是由文件之间相互独立,缺乏联系造成的。 1.3 数据库阶段的数据管理有些什么特点?   (1) 采用复杂的数据模型表示数据结构   (2) 有较高的数据独立性(数据结构分成用户的逻辑结构、整体逻辑结构和物理结构三级)   (3) 数据库系统为用户提供方便的用户接口,可以使用查询语言、终端命令或程序方式操作数据, 也可以用程序方式操作数据库。   (4) 系统提供了四个方面的数据控制功能:数据库的恢复、并发控制、数据完整性和数据安全性, 以保证数据库中数据是安全的、正确的和可靠的。   (5) 对数据的操作不一定以记录为单位,还可以数据项为单位,增加了系统的灵活性。 1.4 你怎样理解实体、属性、记录、字段这些概念的类型和值的差别?试举例说明。     实体(entity):是指客观存在可以相互区别的事物。实体可以是具体的对象,如:一个学生,一辆汽车等; 也可以是抽象的事件,如:一次借书、一场足球赛等。     属性(attribute):实体有很多特性,每一个特性称为属性。每个属性有一个值域, 其类型可以是整数型、实数型、字符串型。比如,学生(实体)有学号、姓名、年龄、性别等属性, 相应值域为字符、字符串、整数和字符串型。     字段(field):标记实体属性的命名单位称为字段或数据项。它是可以命名的最小信息单位, 所以又称为数据元素或初等项。字段的命名往往和属性名相同,比如,学生有学号、姓名、年龄、性别等字段。     记录(record):字段的有序集合称为记录。一般用一个记录描述一个实体, 所以记录又可以定义为能完整地描述一个实体的字段集。如:一个学生记录,由有序的字段集(学号、姓名、年龄、性别等)组成。 1.5 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别? 联系:   (1)逻辑记录与物理记录都是记录,是字段的有序集合;   (2)逻辑文件与物理文件都是文件,是同一类记录的汇集。 区别:  (1)逻辑记录与逻辑文件是逻辑数据描述,物理记录与物理文件是物理数据描述。  (2)物理数据描述是指数据在存储设备上的存储方式,物理记录、物理文件(还有物理联系、物理结构等术语), 都是用来描述实际存储设备上的数据。  (3)逻辑数据描述是指程序员或用户用以操作的数据形式,是抽象的概念化数据。 逻辑记录、逻辑文件(还有逻辑联系、逻辑结构等术语),都是用户观点的数据描述。 1.6 为某百货公司设计一个ER模型。 百货管辖若干个连锁商店,每家商店经营若干商品, 每家商店有若干职工,但每个职工只能服务于一家商店。实体类型“商店”的属性有:商店编号,店名,店址,店经理。 实体类型“商品”的属性有:商品编号,商品名,单价,产地。实体类型“职工”的属性有:职工编号,职工名,性别,工资。 在联系中应反映出职工参加某商店工作的开始时间,商店销售商品的月销售量。   试画出反映商店、商品、职工实体类型及联系类型的ER图,并将其转换成关系模式集。 实体:商店(商店编号,店名,店址,店经理)      商品(商品编号,商品名,单价,产地)      职工(职工编号,职工名,性别,工资)   联系:SC(商店—商品之间1:N的联系,联系属性为“职工参加商店工作的开始时间”。      SE(商店—职工之间1:N的联系),联系属性为“月销售量”。        ER图: 关系模式集:商店模式(商店编号,店名,店址,店经理)         商品模式(商品编号,商品名,单价,产地,商店编号,月销售量)         职工模式(职工编号,职工名,性别,工资,商店编号,开始时间) 1.7 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。 ER模型的主要特点:   (1)优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。   (2)缺点:只能说明实体间语义的联系,不能进一步说明详细的数据结构。   层次模型的特点:   (1)优点:记录之间的联系通过指针实现,查询效率较高。   (2)缺点:只能表示1:N联系,实现M:N结构较复杂;由于层次顺序的严格和复杂,引起数据的查询和更新操作也很复杂。   网状模型的特点:   (1)优点:记录之间联系通过指针实现,M:N联系也容易实现(每个M:N联系可拆成两个1:N联系),查询效率较高。   (2)缺点:编写应用程序比较复杂,程序员必须熟悉数据库的逻辑结构。   关系模型的特点:     用关鍵码而不是用指针导航数据,表格简单,用户易懂,编程时并不涉及存储结构、访问技术等细节。 1.8 试述概念模式在数据库结构中的重要地位。     概念模式是数据库中全部数据的整体逻辑结构的描述。它由若干个概念记录类型组成。 概念模式不仅要描述概念记录类型,还要描述记录间的联系、操作、数据的完整性、安全性等要求。 数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点, 并使得两级的任何一级的改变都不受另一级的牵制。 1.9 数据独立性与数据联系这两个概念有什么区别?     数据独立性是指应用程序与数据之间相互独立,不受影响。     数据联系是指同一记录内部各字段间的联系,以及记录之间的联系。 1.10 试述DBMS在用户访问数据库过程中所起的作用.     用户对数据库进行操作,DBMS把操作从应用程序带到外部级、概念级、再导向内部级,进而操作存储器中的数据。 1.11 试述DBMS的主要功能。 DBMS的主要功能有:     (1)数据库的定义功能     (2)数据库的操纵功能     (3)数据库的保护功能     (4)数据库的存储管理     (5)数据库的维护功能     (6)数据字典 1.12 试叙DBMS对数据库的保护功能。 DBMS对数据库的保护主要通过四个方面实现:     (1)数据库的恢复。     (2)数据库的并发控制。     (3)数据库的完整性控制。     (4)数据库的安全性控制。 1.13 试叙DBMS对数据库的维护功能。 DBMS中有一些程序提供给数据库管理员运行数据库系统时使用,这些程序起着数据库维护的功能。 主要有四个实用程序:     (1)数据装载程序(loading)     (2)备份程序(backup)     (3)文件重组织程序     (4)性能监控程序 1.14 从模块结构看,DBMS由哪些部分组成? 从模块结构看,DBMS由两大部分组成:查询处理器和存储管理器   (1)查询处理器有四个主要成分:DDL编译器,DML编译器,嵌入型DML的预编译器,查询运行核心程序   (2)存储管理器有四个主要成分:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器 (以上几题具体可参照书上p20-21) 1.15 DBS由哪几个部分组成? DBS由四部分组成:数据库、硬件、软件、数据库管理员。 1.16 什么样的人是DBA?DBA应具有什么素质?DBA的职责是什么?     DBA是控制数据整体结构的人,负责DBS的正常运行。DBA可以是一个人,在大型系统中也可以是由几个人组成的小组。 DBA承担创建、监控和维护整个数据库结构的责任。    DBA应具有下列素质:        (1)熟悉企业全部数据的性质和用途;        (2)对用户的需求有充分的了解;        (3)对系统的性能非常熟悉。    DBA的主要职责有五点:        (1)概念模式定义        (2)内模式定义        (3)根据要求修改数据库的概念模式和内模式        (4)对数据库访问的授权        (5)完整性约束的说明 1.17 试对DBS的全局结构作详细解释。 1.18 使用DBS的用户有哪几类? 使用DBS的用户有四类:     1)DBA     2)专业用户     3)应用程序员     4)最终用户 1.20 DBMS的存储处理器有哪些功能? DBMS的存储处理器提供了应用程序访问数据库中数据的界面,可分成四个成分:     1)授权和完整性管理器     2)事务管理器     3)文件管理器     4)缓冲区管理器 1.21 磁盘存储器中有哪四类主要的数据结构? 数据文件:存储了数据库中的数据; 数据字典(DD):存储三级结构的描述; 索引文件:为提高查询速度而设置的逻辑排序手段; 统计数据组织:存储DBS运行时统计分析数据。 习 题 2 2.1 名词解释 (1)关系模型:用二维表格结构表示实体集,外键表示实体间联系的数据模型称为关系模型。 (2)关系模式:关系模式实际上就是记录类型。它的定义包括:模式名,属性名,值域名以及模式的主键。 关系模式不涉及到物理存储方面的描述,仅仅是对数据特性的描述。 (3)关系实例:元组的集合称为关系和实例,一个关系即一张二维表格。 (4)属性:实体的一个特征。在关系模型中,字段称为属性。 (5)域:在关系中,每一个属性都有一个取值范围,称为属性的值域,简称域。 (6)元组:在关系中,记录称为元组。元组对应表中的一行;表示一个实体。 (7)超键:在关系中能唯一标识元组的属性集称为关系模式的超键。 (8)候选键:不含有多余属性的超键称为候选键。 (9)主键:用户选作元组标识的一个候选键为主键。(单独出现,要先解释“候选键”) (10)外键:某个关系的主键相应的属性在另一关系中出现,此时该主键在就是另一关系的外键, 如有两个关系S和SC,其中S#是关系S的主键,相应的属性S#在关系SC中也出现,此时S#就是关系SC的外键。 (11)实体完整性规则:这条规则要求关系中元组在组成主键的属性上不能有空值。 如果出现空值,那么主键值就起不了唯一标识元组的作用。 (12)参照完整性规则:这条规则要求“不引用不存在的实体”。 其形式定义如下:如果属性集K是关系模式R1的主键,K也是关系模式R2的外键,那么R2的关系中, K的取值只允许有两种可能,或者为空值,或者等于R1关系中某个主键值。 这条规则在使用时有三点应注意: 1)外键和相应的主键可以不同名,只要定义在相同值域上即可。 2)R1和R2也可以是同一个关系模式,表示了属性之间的联系。 3)外键值是否允许空应视具体问题而定。 (13)过程性语言:在编程时必须给出获得结果的操作步骤,即“干什么”和“怎么干”。如Pascal和C语言等。 (14)非过程性语言:编程时只须指出需要什么信息,不必给出具体的操作步骤。 各种关系查询语言均属于非过程性语言。 (15)无限关系:当一个关系中存在无穷多个元组时,此关系为无限关系。 如元组表达式{t|┐R(t)}表示所有不在关系R中的元组的集合,这是一个无限关系。 (16)无穷验证:在验证公式时需对无穷多个元组进行验证就是无穷验证。 如验证公式(u)(P(u))的真假时需对所有的元组u进行验证,这是一个无穷验证的问题。 2.2 为什么关系中的元组没有先后顺序?     因为关系是一个元组的集合,而元组在集合中的顺序无关紧要。因此不考虑元组间的顺序,即没有行序。 2.3 为什么关系中不允许有重复元组?     因为关系是一个元组的集合,而集合中的元素不允许重复出现,因此在关系模型中对关系作了限制, 关系中的元组不能重复,可以用键来标识唯一的元组。 2.4 关系与普通的表格、文件有什么区别? 关系是一种规范化了的二维表格,在关系模型中,对关系作了下列规范性限制: 1)关系中每一个属性值都是不可分解的。 2)关系中不允许出现相同的元组(没有重复元组)。 3)由于关系是一个集合,因此不考虑元组间的顺序,即没有行序。 4)元组中,属性在理论上也是无序的,但在使用时按习惯考虑列的顺序。 2.5 笛卡尔积、等值联接、自然联接三者之间有什么区别?   笛卡尔积对两个关系R和S进行乘操作,产生的关系中元组个数为两个关系中元组个数之积。   等值联接则是在笛卡尔积的结果上再进行选择操作,从关系R和S的笛卡儿积中选择对应属性值相等的元组;   自然连接则是在等值联接(以所有公共属性值相等为条件)的基础上再行投影操作,并去掉重复的公共属性列。 当两个关系没有公共属性时,自然连接就转化我笛卡尔积。 2.6 设有关系R和S(如下:) 计算: 2.7 设有关系R和S(如下:) 计算: 2.8 如果R是二元关系,那么下列元组表达式的结果是什么? {t|(u)(R(t)∧R(u)∧(t[1]≠u[1]∨t[2]≠u[2]))}     这个表达式的意思是:从关系R中选择元组,该元组满足:第1分量值或第2分量值至少有一个不等于其他某元组。 由于R是二元关系,只有两个分量,由于没有重复元组,上述条件显然满足。 所以,这个表达式结果就是关系R。 2.9 假设R和S分别是三元和二元关系,试把表达式π1,5(σ2=4∨3=4(R×S))转换成等价的:(1)汉语查询句子;(2)元组表达式;(3)域表达式。 (1)汉语表达式: 从R×S关系中选择满足下列条件的元组: 第2分量(R中第2分量)与第4分量(S中第1分量)值相等,或第3分量(R中第3分量)与第4分量(S中第1分量)值相等;并取第1列与第5列组成的新关系。 (2)元组表达式:{t|(u)(v)(R(u)∧S(v)∧(u[2]=v[1]∨u[3]=v[1])∧t[1]=u[1]∧t[2]=v[2])} (3)域表达式:{xv|(y)(z)(u)(R(xyz)∧S(uv)∧(y=u∨z=u))} 2.10 假设R和S都是二元关系,试把元组表达式{t|R(t)∧(u)(S(u)∧u[1]≠t[2])}转换成等价的: (1)汉语查询句子;(2)域表达式:(3)关系代数表达式。 (1)汉语表达式:选择R关系中元组第2分量值不等于S关系中某元组第1分量值的元组。 (2)域表达式:{xy|(u) (v)(R(xy)∧S(uv)∧(u≠y))} (3)关系代数表达式:π1,2(σ2≠3(R×S)) 2.11 试把域表达式{ab|R(ab)∧R(ba)}转换成等价的: (1)汉语查询句子;(2)关系代数表达式;(3)元组表达式。 (1)汉语查询句子:选择R中元组第1分量值与第2分量值互换后仍存在于R中的元组。 (2)关系代数表达式:π1,2(σ1=4∧2=3(R×R)); (3)元组表达式:{t|(u)(R(t)∧R(u)∧t[1]=u[2]∧t[2]=u[1])} 2.12 设有两个关系R(A,B,C)和S(D,E,F),试把下列关系代数表达式转换成等价的元组表达式: (1)πA(R);(2)σB='17'(R);(3)R×S;(4)πA,F(σC=D(R×S)) (1){t|(u)(R(u)∧t[1]=u[1])} (2){t|R(t)∧t[2]='17')} (3){t|(u)(v)(R(u)∧S(v)∧t[1]=u[1]∧t[2]=u[2]∧t[3]=u[3]∧t[4]=v[1]∧t[5]=v[2]∧t[6]=v[3])} (4){t|(u)(v)((R(u)∧S(v)∧u[3]=v[1]∧t[1]=u[1]∧t[2]=v[3])} 2.13 设有三个关系: S(S#,SNAME,AGE,SEX) SC(S#,C#,GRADE) C(C#,CNAME,TEACHER) 试用关系代数表达式表示下列查询语句。(见下一题) 2.14 试用元组表达式表示上题中各个查询语句。 (1)检索LIU老师所授课程的课程号、课程名。 πC#,CNAME(σTEACHER='LIU'(C)) {t|(u)(C(u)∧C[3]='LIU'∧t[1]=u[1]∧t[2]=u[2])} (2)检索年龄大于23岁的男学生的学号与姓名。 πS#,SNAME(σAGE>'23'∧SEX='男'(S)) {t|(u)(S(u)∧u[3]>'23'∧u[4]='男'∧t[1]=u[1]∧t[2]=u[2])} (3)检索学号为S3学生所学课程的课程名与任课教师名。 πCNAME,TEACHER(σS#='S3'(SCC)) {t|(u)(v)(SC(u)∧C(v)∧u[1]='S3'∧v[1]=u[2]∧t[1]=v[2]∧t[2]=v[3])} (4)检索至少选修LIU老师所授课程中一门课程的女学生的姓名。 πSNAME(σSEX='女'∧TEACHER='LIU'(SSCC)) {t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[4]='女'∧v[1]=u[1]∧v[2]=w[1]∧w[3]='LIU'∧t[1]=u[2])} (5)检索WANG同学不学的课程号。 πC#(C)-πC#(σSNAME='WANG'(SSC))   或者, πC#(SC)-πC#(σSNAME='WANG'(SSC)) (全部课程号减去WANG同学所学的课程号) {t|(u)(v)(C(u)∧SC(v)∧(u[1]=v[2]=>(w)(s(w)∧w[1]=v[1]∧W[2]≠'wang'))∧t[1]=u[1])} (从C中选择满足条件的元组:SC中的所有元组,如果学号与C中所选元组相同的话,其在S中对应的姓名肯定不是'wang'。) Notice:"p1=>p2"的含义是:如果p1为真,则p2为真。 (6)检索至少选修两门课程的学生学号。 πS#(σ1=4∧2≠5(SC×SC)) SC自乘之后,再选择(同一个学号中两个课程号不同的元组),投影。 {t|(u)(v)(SC(u)∧SC(v)∧u[1]=v[1]∧u[2]≠v[2])∧t[1]=u[1]} (7)检索全部学生都选修的课程的课程号与课程名。 πC#,CNAME(C(πS#,C#(SC)÷πS#(S))) (涉及到全部值时,应用除法,“除数”是"全部") {t|(u)(v)(w)(S(u)∧SC(v)∧C(w)∧u[1]=v[1]∧v[2]=w[1]∧t[1]=v[1]∧t[2]=V[2])} (8)检索选修课程包含LIU老师所授课程的学生学号。 πS#(σTEACHER='LIU'(SCC)) {t|(u)(v)(SC(u)∧C(v)∧u[2]=v[1]∧v[3]='LIU'∧t[1]=u[1])} 如果LIU老师有多门课程,则选修课程包含LIU老师所授全部课程的学生学号为: πS#,C#(SC)÷πC#(σTEACHER='LIU'(C)) 2.15 在教学数据库S、SC、C中,用户有一查询语句:检索女同学选修课程的课程名和任课教师名。(1)试写出该查询的关系代数表达式;(2)试写出查询优化的关系代数表达式。 (1)πCNAME,TEACHER(σSEX='女'(SSCC)) (2)优化为:πCNAME,TEACHER(CπC#(πS#,C#(SC)πS#(σSEX='女'(S)))) (基本思路:尽量提前做选择操作;在每个操作后,应做个投影操作,去掉不用的属性值。 2.16 在2.15题中, (1)画出该查询初始的关系代数表达式的语法树。 (2)使用2.4.4节的优化算法,对语法树进行优化,并画出优化后的语法树。 该查询初始的关系代数表达式的语法树 优化后的语法树 2.17 为什么要对关系代数表达式进行优化?     在关系代数运算中,各个运算所费时间和空间是不一样的。如何安排若干关系的运算操作步骤, 直接影响到整个操作所需要的时间和空间。对关系代数表达式进行优化, 可以提高系统的操作效率,达到执行过程即省时间又省空间的目的。 习 题 3 3.1 名词解释 (1)SQL模式:SQL模式是表和授权的静态定义。一个SQL模式定义为基本表的集合。 一个由模式名和模式拥有者的用户名或账号来确定,并包含模式中每一个元素(基本表、视图、索引等)的定义。 (2)SQL数据库:SQL(Structured Query Language),即‘结构式查询语言’,采用英语单词表示和结构式的语法规则。 一个SQL数据库是表的汇集,它用一个或多个SQL模式定义。 (3)基本表:在SQL中,把传统的关系模型中的关系模式称为基本表(Base Table)。 基本表是实际存储在数据库中的表,对应一个关系。 (4)存储文件:在SQL中,把传统的关系模型中的存储模式称为存储文件(Stored File)。 每个存储文件与外部存储器上一个物理文件对应。 (5)视图:在SQL中,把传统的关系模型中的子模式称为视图(View),视图是从若干基本表和(或)其他视图构造出来的表。 (6)行:在SQL中,把传统的关系模型中的元组称为行(row)。 (7)列:在SQL中,把传统的关系模型中的属性称为列(coloumn)。 (8)实表:基本表被称为“实表”,它是实际存放在数据库中的表。 (9)虚表:视图被称为“虚表”,创建一个视图时,只把视图的定义存储在数据词典中,而不存储视图所对应的数据。 (10)相关子查询:在嵌套查询中出现的符合以下特征的子查询:子查询中查询条件依赖于外层查询中的某个值, 所以子查询的处理不只一次,要反复求值,以供外层查询使用。 (11)联接查询:查询时先对表进行笛卡尔积操作,然后再做等值联接、选择、投影等操作。 联接查询的效率比嵌套查询低。 (12)交互式SQL:在终端交互方式下使用的SQL语言称为交互式SQL。 (13)嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言称为嵌入式SQL。 (14)共享变量:SQL和宿主语言的接口。共享变量有宿主语言程序定义,再用SQL的DECLARE语句说明, SQL语句就可引用这些变量传递数据库信息。 (15)游标:游标是与某一查询结果相联系的符号名,用于把集合操作转换成单记录处理方式。 (16)卷游标:为了克服游标在推进时不能返回的不便,SQL2提供了卷游标技术。 卷游标在推进时不但能沿查询结果中元组顺序从头到尾一行行推进,也能一行行返回。 3.2 对于教学数据库的三个基本表      学生 S(S#,SNAME,AGE,SEX)      学习 SC(S#,C#,GRADE)      课程 C(C#,CNAME,TEACHER)     试用SQL的查询语句表达下列查询: (1)检索LIU老师所授课程的课程号和课程名。     SELECT C#,CNAME     FROM C     WHERE TEACHER=‘LIU’ (2)检索年龄大于23岁的男学生的学号和姓名。     SELECT S#,SNAME     FROM S     WHERE (AGE>23) AND (SEX=‘M’) (3)检索至少选修LIU老师所授课程中一门课程的女学生姓名。     SELECT SNAME     FROM S     WHERE SEX=‘F’ AND S# IN      (SELECT S#      FROM SC      WHERE C# IN       (SELECT C#       FROM C       WHERE TEACHER=‘LIU’) NOTICE:有多种写法,比如联接查询写法:     SELECT SNAME     FROM S,SC,C     WHERE SEX=‘F’ AND SC.S#=S.S#     AND SC.C#=C.C#     AND TEACHER='LIU' 但上一种写法更好一些。 (4)检索WANG同学不学的课程的课程号。     SELECT C#     FROM C     WHERE C# NOT IN      (SELECT C#      FROM SC      WHERE S# IN       (SELECT S#       FROM S       WHERE SNAME='WANG')) (5)检索至少选修两门课程的学生学号。     SELECT DISTINCT X.SNO     FROM SC X,SC Y     WHERE X.SNO=Y.SNO AND X.CNO<>Y.CNO Notice:对表SC进行自连接,X,Y是SC的两个别名。 (6)检索全部学生都选修的课程的课程号与课程名。     SELECT C#,CNAME     FROM C     WHERE NOT EXISTS      (SELECT *      FROM S      WHERE S# NOT IN       (SELECT *       FROM SC       WHERE  SC.C#=C.C#)) 要从语义上分解:(1)选择课程的课程号与课程名,不存在不选这门课的同学。    其中,“不选这门课的同学”可以表示为: SELECT *  FROM  S  WHERE  S# NOT IN   (SELECT  *       FROM SC         WHERE  SC.C#=C.C#)   或者 SELECT *  FROM  S  WHERE   NOT EXISTS   (SELECT  *       FROM SC         WHERE S.S#=C.S# AND  SC.C#=C.C# )          (7)检索选修课程包含LIU老师所授课的学生学号。          SELECT DISTINCT S#      FROM SC      WHERE C# IN       (SELECT C#       FROM C       WHERE TEACHER='LIU'))    3.3 设有两个基本表R(A,B,C)和S(D,E,F),试用SQL查询语句表达下列关系代数表达式:   (1)πA(R)  (2)σB='17'(R)   (3)R×S  (4))πA,F(σC=D(R×S)) (1)SELECT A FROM R (2)SELECT * FROM R WHERE B='17' (3)SELECT A,B,C,D,E,F FROM R,S (4)SELECT A,F FROM R,S WHERE R.C=S.D 3.4 3.4 设有两个基本表R(A,B,C)和S(A,B,C)试用SQL查询语句表达下列关系代数表达式:   (1)R∪S  (2)R∩S  (3)R-S  (4)πA,B(R)πB,C(S)     (1)SELECT A,B,C       FROM R       UNION       SELECT A,B,C       FROM S     (2)SELECT A,B,C       FROM R       INTERSECT       SELECT A,B,C       FROM S     (3)SELECT A,B,C       FROM R       WHERE NOT EXISTS        (SELECT A,B,C        FROM S        WHERE R.A=S.A AND R.B=S.B AND R.C=S.C)     (4)SELECT R.A,R.B,S.C       FROM R,S       WHERE R.B=S.B 3.5 试叙述SQL语言的关系代数特点和元组演算特点。 (P61-62) 3.6 试用SQL查询语句表达下列对教学数据库中三个基本表S、SC、C的查询: (1)统计有学生选修的课程门数。     SELECT COUNT(DISTINCT C#) FROM SC (2)求选修C4课程的学生的平均年龄。     SELECT AVG(AGE)     FROM S     WHERE S# IN      (SELECT S#      FROM SC      WHERE C#='C4') 或者,     SELECT AVG(AGE)     FROM S,SC     WHERE S.S#=SC.S# AND C#='004' (3)求LIU老师所授课程的每门课程的学生平均成绩。    SELECT CNAME,AVG(GRADE)    FROM SC ,C    WHERE SC.C#=C.C# AND TEACHER='LIU'    GROUP BY C#    (4)统计每门课程的学生选修人数(超过10人的课程才统计)。要求输出课程号和选修人数, 查询结果按人数降序排列,若人数相同,按课程号升序排列。     SELECT DISTINCT C#,COUNT(S#)     FROM SC     GROUP BY C#     HAVING COUNT(S#)>10     ORDER BY 2 DESC, C# ASC (5)检索学号比WANG同学大,而年龄比他小的学生姓名。     SELECT X.SNAME     FROM S AS X, S AS Y     WHERE Y.SNAME='WANG' AND X.S#>Y.S# AND X.AGE(SELECT AVG(AGE) FROM S AS Y WHERE Y.SEX='女') (9)求年龄大于所有女同学年龄的男学生姓名和年龄。     SELECT SNAME,AGE     FROM S AS X     WHERE X.SEX='男' AND X.AGE>ALL (SELECT AGE FROM S AS Y WHERE Y.SEX='女') 3.7 试用SQL更新语句表达对教学数据库中三个基本表S、SC、C的各个更新操作: (1)往基本表S中插入一个学生元组(‘S9’,‘WU’,18)。     INSERT INTO S(S#,SNAME,AGE) VALUES('59','WU',18) (2)在基本表S中检索每一门课程成绩都大于等于80分的学生学号、姓名和性别, 并把检索到的值送往另一个已存在的基本表STUDENT(S#,SANME,SEX)。     INSERT INTO STUDENT(S#,SNAME,SEX)      SELECT S#,SNAME,SEX      FROM S WHERE  NOT EXISTS       (SELECT * FROM SC WHERE        GRADE<80 AND S.S#=SC.S#) (3)在基本表SC中删除尚无成绩的选课元组。     DELETE FROM SC      WHERE GRADE IS NULL (4)把WANG同学的学习选课和成绩全部删去。     DELETE FROM SC      WHERE S# IN       (SELECT S#       FROM S       WHERE SNAME='WANG') (5)把选修MATHS课不及格的成绩全改为空值。     UPDATE SC     SET GRADE=NULL     WHERE GRADE<60 AND C# IN       (SELECT C#       FROM C       WHERE CNAME='MATHS') (6)把低于总平均成绩的女同学成绩提高5%。     UPDATE SC     SET GRADE=GRADE*1.05     WHERE GRADE<(SELECT AVG(GRADE) FROM SC) AND S# IN (SELECT S# FROM S WHERE SEX='F') (7)在基本表SC中修改C4课程的成绩,若成绩小于等于75分时提高5%, 若成绩大于75分时提高4%(用两个UPDATE语句实现)。     UPDATE SC      SET GRADE=GRADE*1.05      WHERE C#='C4' AND GRADE<=75     UPDATE SC      SET GRADE=GRADE*1.04      WHERE C#='C4' AND GRADE>75 3.8 在第1章例1.4中提到“仓库管理”关系模型有五个关系模式:      零件 PART(P#,PNAME,COLOR,WEIGHT)      项目 PROJECT(J#,JNAME,DATE)      供应商 SUPPLIER(S#,SNAME,SADDR)      供应 P_P(J#,P#,TOTOAL)      采购 P_S(P#,S#,QUANTITY) (1)试用SQL DDL语句定义上述五个基本表,并说明主键和外键。     CREATE TABLE PART     (P# CHAR(4) NOT NULL,PNAME CHAR(12) NOT NULL,     COLOR CHAR(10),WEIGHT REAL,     PRIMARY KEY(P#))          CREATE TABLE PROJECT     (J# CHAR(4) NOT NULL,JNAME CHAR(12) NOT NULL,     DATE DATE,     PRIMARY KEY(J#))          CREATE TABLE SUPLIER     (S# CHAR(4) NOT NULL,SNAME CHAR(12),SADDR VARCHAR(20),     PRIMARY KEY(S#))          CREATE TABLE P_P     (J# CHAR(4),P# CHAR(4),TOTAL INTEGER,     PRIMARY KEY(J#,P#),     FOREIGN KEY(J#) REFERENCE PROJECT(J#),     FOREIGN KEY(P#) REFERENCE PART(P#))          CREATE TABLE P_S     (P# CHAR(4),S# CHAR(4),QUANTITY INTEGER,     PRIMARY KEY(P#,S#),     FOREIGN KEY(P#) REFERENCE PART(P#),     FOREIGN KEY(S#) REFERENCE SUPLIER(S#))      (2)试将PROGECT、P_P、PART三个基本表的自然联接定义为一个视图VIEW1,PART、P_S、SUPPLIER 三个基本表的自然联接定义为一个视图VIEW2。     CREATE VIEW VIEW1(J#,JNAME,DATE,P#,PNAME,COLOR,WEIGHT,TOTAL)           AS SELECT PROJECT.J#,JNAME,DATE,PART.P#,PNAME,COLOR,WEIGHT,TOTAL           FROM PROJECT,PART,P_P           WHERE PART.P#=P_P.P# AND P_P.J#=PROJECT.J#            CREATE VIEW VIEW2(P#,PNAME,COLOR,WEIGHT,S#,SNAME,SADDR,QUANTITY)           AS SELECT PART.P#,PNAME,COLOR,WEIGHT,SUPPLIER.S#,SNAME,SADDR,QUANTITY           FROM PART,P_S,SUPPLIER           WHERE PART.P#=P_S.P# AND P_S.S#=SUPPLIER.S# (3)试在上述两个视图的基础上进行数据查询:     1)检索上海的供应商所供应的零件的编号和名字。     SELECT P#,PNAME FROM VIEW2 WHERE SADDR='SHANGHAI'     2)检索项目J4所用零件的供应商编号和名字。     SELECT S#,SNAME FROM VIEW2 WHERE P# IN(SELECT P# FROM VIEW1 WHERE J#='J4') 3.9 对于教学数据库中基本表SC,已建立下列视图:      CREATE VIEW S_GRADE(S#,C_NUM,AVG_GRADE)       AS SELECT S#,COUNT(C#),AVG(GRADE)        FROM SC        GROUP BY S#    试判断下列查询和更新是否允许执行。若允许,写出转换到基本表SC上的相应操作。   (1) SELECT *       FROM S_GRADE       允许    SELECT S#,COUNT(C#),AVG(GRADE) FROM SC GROUP BY S#   (2) SELECT S#,C_NUM        FROM S_GRADE         WHERE AVG_GRADE>80     允许    SELECT S#,COUNT(C#) FROM SC WHERE AVG(GRADE)>80   (3) SELECT S#,AVG_GRADE         FROM S_GRADE         WHERE C_NUM>(SELECT C_NUM                 FROM S_GRADE                 WHERE S#=‘S4’)     允许    SELECT S#,AVG(GRADE)    FROM SC AS X    WHERE COUNT(X.C#)>(SELECT COUNT(Y.C#) FROM SC AS Y WHERE Y.S#='S4')    GROUP BY S#   (4) UPDATE S_GRADE         SET C_NUM=C_NUM+1         WHERE S#=‘S4’     不允许   (5) DELETE FROM S_GRADE         WHERE C_NUM>4     不允许 3.10 预处理方式对于嵌入式SQL的实现有什么重要意义?     预处理方式是先用预处理程序对源程序进行扫描,识别出SQL语句,并处理成宿主语言的函数调用形式; 然后再用宿主语言的编译程序把源程序编译成目标程序。这样,不用扩充宿主语言的编译程序, 就能处理SQL语句。 3.11 在宿主语言的程序中使用SQL语句有哪些规定? 在宿主语言的程序中使用SLQ语句有以下规定: (1)在程序中要区分SQL语句与宿主语言语句 (2)允许嵌入的SQL语句引用宿主语言的程序变量(称为共享变量),但有两条规定:    1)引用时,这些变量前必须加“:”作为前缀标识,以示与数据库中变量有区别。    2)这些变量由宿主语言的程序定义,并用SQL的DECLARE语句说明。 (3)SQL的集合处理方式与宿主语言单记录处理方式之间要协调。 需要采用游标机制,把集合操作转换成单记录处理方式。 3.12 SQL的集合处理方式与宿主语言单记录处理方式之间如何协调?     由于SQL语句处理的是记录集合,而宿主语言语句一次只能处理一个记录, 因此需要用游标(cousor)机制,把集合操作转换成单记录处理方式。 2.13 嵌入式SQL语句何时不必涉及到游标?何时必须涉及到游标?     (1)INSERT、DELETE、UPDATE语句,查询结果肯定是单元组时的SELECT语句, 都可直接嵌入在主程序中使用,不必涉及到游标。     (2)当SELECT语句查询结果是多个元组时,此时宿主语言程序无法使用, 一定要用游标机制把多个元组一次一个地传送给宿主语言处理。 习 题 4 4.1 名词解释 (1) 函数依赖:FD(function dependency),设有关系模式R(U),X,Y是U的子集, r是R的任一具体关系,如果对r的任意两个元组t1,t2,由t1[X]=t2[X]导致t1[Y]=t2[Y], 则称X函数决定Y,或Y函数依赖于X,记为X→Y。X→Y为模式R的一个函数依赖。 (2) 函数依赖的逻辑蕴涵:设F是关系模式R的一个函数依赖集,X,Y是R的属性子集, 如果从F中的函数依赖能够推出X→Y,则称F逻辑蕴涵X→Y,记为F|=X→Y。 (3) 部分函数依赖:即局部依赖,对于一个函数依赖W→A,如果存在XW(X包含于W)有X→A成立, 那么称W→A是局部依赖,否则称W→A为完全依赖。 (4) 完全函数依赖:见上。 (5) 传递依赖:在关系模式中,如果Y→X,X→A,且XY(X不决定Y), AX(A不属于X),那么称Y→A是传递依赖。 (6) 函数依赖集F的闭包F+: 被逻辑蕴涵的函数依赖的全体构成的集合,称为F的闭包(closure),记为F+。 (7) 1NF:第一范式。如果关系模式R的所有属性的值域中每一个值都是不可再分解的值, 则称R是属于第一范式模式。如果某个数据库模式都是第一范式的,则称该数据库存模式属于第一范式的数据库模式。 第一范式的模式要求属性值不可再分裂成更小部分,即属性项不能是属性组合和组属性组成。 (8) 2NF:第二范式。如果关系模式R为第一范式,并且R中每一个非主属性完全函数依赖于R的某个候选键, 则称是第二范式模式;如果某个数据库模式中每个关系模式都是第二范式的,则称该数据库模式属于第二范式的数据库模式。 (注:如果A是关系模式R的候选键的一个属性,则称A是R的主属性,否则称A是R的非主属性。) (9) 3NF:第三范式。如果关系模式R是第二范式,且每个非主属性都不传递依赖于R的候选键, 则称R是第三范式的模式。如果某个数据库模式中的每个关系模式都是第三范式,则称为3NF的数据库模式。 (10) BCNF:BC范式。如果关系模式R是第一范式,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。 (11) 4NF:第四范式。设R是一个关系模式,D是R上的多值依赖集合。如果D中成立非平凡多值依赖X→→Y时, X必是R的超键,那么称R是第四范式的模式。 (12) 推理规则的正确性和完备性:正确性是指,如果X→Y是从推理规则推出的,那么X→Y在F+中。 完备性是指,不能从F使用推理规则导出的函数依赖不在F+中。 (13) 依赖集的覆盖和等价:关系模式R(U)上的两个函数依赖集F和G,如果满足F+=G+,则称F和G是等价的。 如果F和G等价,则可称F覆盖G或G覆盖F。 (14) 最小依赖集:如果函数集合F满足以下三个条件:(1)F中每个函数依赖的右部都是单属性; (2)F中的任一函数依赖X→A,其F-{X→A}与F是不等价的;(3)F中的任一函数依赖X→A,Z为X的子集,(F-{X→A})∪{Z→A}与F不等价。则称F为最小函数依赖集合,记为Fmin。 (15) 无损联接:设R是一关系模式,分解成关系模式ρ={R1,R2...,Rk},F是R上的一个函数依赖集。 如果对R中满足F的每一个关系r都有r=πR1(r)πR2(r)...πRk(r)则称这个分解相对于F是"无损联接分解"。 (16) 保持依赖集:所谓保持依赖就是指关系模式的函数依赖集在分解后仍在数据库中保持不变, 即关系模式R到ρ={R1,R2,...,Rk}的分解,使函数依赖集F被F这些Ri上的投影蕴涵。 (17) 多值依赖:设R(U)是属性集U上的一个关系模式,X,Y,Z是U的子集,并且Z=U-X-Y, 用x,y,z分别代表属性集X,Y,Z的值,只要r是R的关系,r中存在元组(x,y1,z1)和(x,y2,z2)时, 就也存在元组(x,y1,z2)和(x,y2,z1),那么称多值依赖(MultiValued Dependency MVD) X→→Y在关系模式R中成立。 4.2 关系模式R有n个属性,在模式R上可能成立的函数依赖有多少个? 其中平凡的函数依赖有多少个?非平凡的函数依赖有多少个? (要考虑所有可能的情况,数学排列组合问题。对于数据库本身而言,本题没多大意义)     所有属性相互依赖时,函数依赖最多。 · 平凡的函数依赖:对于函数依赖X→Y,如果YX,那么称X→Y是一个“平凡的函数依赖”。 4.3 建立关于系、学生、班级、社团等信息的一个关系数据库, 一个系有若干个专业,每个专业每年只招一个班,每个班有若干个学生,一个系的学生住在同一宿舍区, 每个学生可以参加若干个社团,每个社团有若干学生。     描述学生的属性有:学号、姓名、出生年月、系名、班级号、宿舍区。     描述班级的属性有:班级号、专业名、系名、人数、入校年份。     描述系的属性有:系名、系号、系办公地点、人数。     描述社团的属性有:社团名、成立年份、地点、人数、学生参加某社团的年份。 请给出关系模式,写出每个关系模式的最小函数依赖集,指出是否存在传递函数依赖, 对于函数依赖左部是多属性的情况,讨论函数依赖是完全函数依赖还是部分函数依赖。 指出各关系的候选键、外部键,有没有全键存在? 各关系模式如下:   学生(学号,姓名,出生年月,系名,班级号,宿舍区)   班级(班级号,专业名,系名,人数,入校年份)   系(系名,系号,系办公地点,人数)   社团(社团名,成立年份,地点,人数)       加入社团(社团名,学号,学生参加社团的年份)   学生(学号,姓名,出生年月,系名,班级号,宿舍区) ●“学生”关系的最小函数依赖集为: Fmin={学号→姓名,学号→班级号,学号→出生年月,学号→系名,系名→宿舍区} ●以上关系模式中存在传递函数依赖,如:学号→系名,系名→宿舍区 ●候选键是学号,外部键是班级号,系名。 notice: 在关系模式中,如果Y→X,X→A,且XY(X不决定Y), A不属于X,那么称Y→A是传递依赖。 班级(班级号,专业名,系名,人数,入校年份) ●“班级”关系的最小函数依赖集为: Fmin={(系名,专业名)→班级号,班级号→人数,班级号→入校年份,班级号→系名,班级号→专业名} (假设没有相同的系,不同系中专业名可以相同) ●以上关系模式中不存在传递函数依赖。 ●“(系名,专业名)→班级号”是完全函数依赖。 ●候选键是(系名,专业名),班级号,外部键是系名。 系(系名,系号,系办公地点,人数) ●“系”关系的最小函数依赖集为: Fmin={系号→系名,系名→系办公地点,系名→人数,系名→系号} ●以上关系模式中不存在传递函数依赖 ●候选键是系名,系号 社团(社团名,成立年份,地点,人数) ●“社团”关系的最小函数依赖集为: Fmin={社团名→成立年份,社团名→地点,社团名→人数) ●以上关系模式中不存在传递函数依赖。 ●候选键是社团名   加入社团(社团名,学号,学生参加社团的年份) ●“加入社团”关系的最小函数依赖集为: Fmin={(社团名,学号)→学生参加社团的年份) ●“(社团名,学号)→学生参加社团的年份”是完全函数依赖。 ●以上关系模式中不存在传递函数依赖。 ●候选键是(社团名,学号)。 4.4 对函数依赖X→Y的定义加以扩充,X和Y可以为空属性集,用φ表示, 那么X→φ,φ→Y,φ→φ的含义是什么? 根据函数依赖的定义,以上三个表达式的含义为: (1)一个关系模式R(U)中,X,Y是U的子集,r是R的任一具体关系,如果对r的任意两个元组t1,t2, 由t1[X]=t2[X]必有t1[φ]=t2[φ]。即X→φ表示空属性函数依赖于X。这是任何关系中都存在的。 (2)φ→Y表示Y函数依赖于空属性。由此可知该关系中所有元组中Y属性的值均相同。 (3)φ→φ表示空属性函数依赖于空属性。这也是任何关系中都存在的。 4.5 已知关系模式R(ABC),F={A→C,B→C},求F+。   可以直接通过自反律、增广律、传递律加以推广: F+={φ→φ,A→φ,B→φ,C→φ,A→C,B→C,AB→φ,AB→A,AB→B,AB→C,AB→BC,AB→AB,AB→ABC,BC→φ,BC→C,BC→B,BC→BC,AC→φ,AC→C,AC→A,AC→AC,ABC→φ,ABC→A,ABC→B,ABC→C,ABC→BC,ABC→AB,ABC→ABC} 4.6 试分析下列分解是否具有无损联接和保持函数依赖的特点: (1)设R(ABC),F1={A→B} 在R上成立,ρ1={AB,AC}。 首先,检查是否具有无损联接特点: 第1种解法--算法4.2:   A B C AB a1 a2 b13 AC a1 b22 a3 A B C a1 a2 b13 a1 a2 a3 (1) 构造表 (2)根据A→B进行处理 结果第二行全是a行,因此分解是无损联接分解。 第2种解法:(定理4.8) 设 R1=AB,R2=AC   R1∩R2=A   R2- R1=B   ∵A→B,∴该分解是无损联接分解。 然后,检查分解是否保持函数依赖   πR1(F1)={A→B,以及按自反率推出的一些函数依赖}   πR2(F1)={按自反率推出的一些函数依赖}   F1被πR1(F1)所蕴涵,∴所以该分解保持函数依赖。 (2)设R(ABC),F2={A→C,B→C}在R上成立,ρ2={AB,AC} 首先,检查是否具有无损联接特点: 第1种解法(略) 第2种解法:(定理4.8) 设 R1=AB,R2=AC   R1∩R2=A   R2- R1=C   ∵A→C,∴该分解是无损联接分解。 然后,检查分解是否保持函数依赖 πR1(F2)={按自反率推出的一些函数依赖} πR2(F2)={A→C,以及按自反率推出的一些函数依赖} ∵F1中的B→C没有被蕴涵,所以该分解没有保持函数依赖。 (3)设R(ABC),F3={A→B},在R上成立,ρ3={AB,BC}. 首先,检查是否具有无损联接特点: 第1种解法:   A B C AB a1 a2 b13 BC b21 a2 a3 A B C a1 a2 a3 a1 b22 a3 (1) 构造表 (2)根据A→B进行处理 没有一行全是a行。因此这个分解不具有无损联接特性。   第2种解法:(定理4.8)    设 R1=AB,R2=BC   R1∩R2=B   R2- R1=C,R1- R2=A   ∵B→C,B→A不在F3中 ∴该分解不具有无损联接特性。 然后,检查分解是否保持函数依赖   πR1(F3)={A→B,以及按自反率推出的一些函数依赖}   πR2(F3)={按自反率推出的一些函数依赖}   F1被πR1(F3)所蕴涵,所以该分解保持函数依赖。 (4)设R(ABC),F4={A→B,B→C}在R上成立,ρ4={AC,BC} 首先,检查是否具有无损联接特点: 第1种解法(略)   第2种解法:(定理4.8)    设 R1=AC,R2=BC   R1(AC)∩R2(BC)=C   R2- R1=B,R1- R2=A   ∵C→B,C→A不在F4中 ∴该分解不具有无损联接特性。 然后,检查分解是否保持函数依赖   πR1(F2)={按自反率推出的一些函数依赖}   πR2(F2)={B→C,以及按自反率推出的一些函数依赖}   ∵F1中的A→B没有被蕴涵,所以该分解没有保持函数依赖。 4.7 设R=ABCD,R上的函数依赖集F={A→B,B→C,A→D,D→C},R的一个分解ρ={AB,AC,AD},求:(1)F在ρ的每个模式上的投影。(2)ρ相对于F是无损联接分解吗?(3)ρ保持依赖吗? (1) πAB(F)={A→B,及按自反律所推导出的一些平凡函数依赖} πAC(F)={A→C,及按自反律所推导出的一些平凡函数依赖} πAD(F)={A→D,及按自反律所推导出的一些平凡函数依赖} (2)   A B C D AB a1 a2 b13 b14 AC a1 b22 a3 b24 AD a1 b32 b33 a4 A B C D a1 a2 a3 a4 a1 a2 a3 a4 a1 a2 a3 a4 (1) 构造表 (2)根据A→B,B→C,A→D,D→C进行处理 每一行都是a,ρ相对于F是无损联接分解。 (3)πAB(F)∪πAC(F)∪πAD(F)={A→B,A→C,A→D}, 没有满足B→C,D→C函数依赖, 因此ρ相对于F的这个分解不保持函数依赖。 4.8 设R=ABCD,R上的F={A→C,D→C,BD→A}, 试证明ρ={AB,ACD,BCD}相对于F不是无损联接分解。 根据算法4.2   A B C D AB a1 a2 b13 b14 ACD a1 b22 a3 a4 BCD b31 a2 a3 a4 A B C D a1 a2 a3 b14 a1 b22 a3 a4 b31 a2 a3 a4 (1) 构造表 (2)根据A→C,D→C,BD→A进行处理 没有一行都是a,所以,ρ相对于F不是无损联接分解。 4.9 设R=ABCD,R上的F={A→B,B→C,D→B},把R分解成BCNF模式集。 (1)若首先把R分解成{ACD,BD},试求F在这两个模式上的投影。 (2)ACD和BD是BCNF吗?如果不是,请进一步分解。 (1)πACD(F)={A→C}   πBD(F)={D→B} (2)因为根据BCNF的定义,要求关系模式是第一范式,且每个属性都不传递依赖于R的侯选键。 BCD中(A,D)为候选键,可是(A,D)→A, A→C,所以它不是BCNF模式。 它可进一步分解为:{AC,DC},此时AC,DC均为BCNF模式。 BD是BCNF,因为R2(BD)是第一范式,且每个属性都不传递依赖于D(候选键),所以它是BCNF模式。 4.10 设R=ABCD,ρ={AB,BC,CD}。F1={A→B,B→C};F2={B→C,C→D}; (1)如果F1是R上的函数依赖集,此时ρ是无损联接分解吗?若不是,试举出反例。 (2)如果F2是R上的函数依赖集呢? (1)不是无损联接。可由算法4.2判断或由定理4.8判断。 根据算法4.2   A B C D AB a1 a2 b13 b14 BC b21 a2 a3 b24 CD b31 b32 a3 a4 A B C D a1 a2 a3 b14 b21 a2 a3 b24 b31 b32 a3 a4 (1) 构造表 (2)根据A→B,B→C进行处理 结果没有出现一行全a的情况,所以它不是无损联接。举例如下: 设模式R的一关系r为{(a1b1c1d1),(a2b2c1d2)} 则有:r1=πAB(r)={(a1b1),(a2b2)}    r2=πBC(r)={(b1c1),(b2c1)}    r3=πCD(r)={(c1d1),(c1d2)} 令a=r1r2r3={ (a1b1c1d1),(a1b1c1d2),(a2b2c1d1),(a2b2c1d2)} r≠a,所以ρ不是无损联接。 (2)如果F2是R上的函数依赖,则可以判断,ρ是无损联接。判断过程同上。 4.11 设关系模式R(S#,C#,GRADE,TNAME,TADDR),其属性分别表示学生学号、 选修课程的编号,成绩、任课教师地址等意义。如果规定,每个学生每学一门课只有一个成绩; 每门课只有一个教师任教;每个教师只有一个地址(此处不允许教师同名同姓)。 (1)试写出关系模式R基本的函数依赖和候选键。 (2)试把R分解成2NF模式集并说明理由。 (3)试把R分解成3NF模式集,并说明理由。 (1)F={(S#,C#)→GRADE,C#→TNAME,TNAME→TADDR} 侯选键是(S#,C#)。 (2)在模式R中,TNAME不完全依赖于键(S#,C#),因此需进行分解,可分解为下列两个关系。 SC={S#,C#,GRADE} C={C#,TNAME,TADDR} 分解后,SC中,GRADE完全依赖于侯选键(S#,C#),在C中,主属性是C#,TNAME、TADDR均完全依赖于C#。 因此,该分解符合2NF模式。 (3)3NF:若每个关系模式是2NF,则每个非主属性都不传递于R的候选键。 按上述已分好的两个模式,SC中已满足“每个非主属性都不传递于R的候选键”,已是3NF,而在C中, C#→TNAME,TNAME→TADDR,TADDR传递依赖于C#,因此还需分成两个模式:CT(C#,TNAME), T(TNAME,TADD)。 分解后,总共有SC={S#,C#,GRADE},CT(C#,TNAME), T(TNAME,TADD)三个模式。 该分解符合3NF模式。 4.12 图4.6表示一个公司各部门的层次结构,对每个部门,数据库中包含部门号 (唯一的)D#,预算费(BUDGET)以及此部门领导人员的职工号(唯一的)E#等信息。 对每一个部门,还存有部门的全部职工,生产科研项目以及办公室的信息。 职工信息包括:职工号,他所参加的生产科研项目号(J#),他所在办公室的电话号(PHONE#)。 生产科研项目包含:项目号(唯一的),预算费。 办公室信息包含:办公室号(唯一的),面积。 对每个职工,数据库中有他曾担任过的职务以及担任某一职务时的工资历史。对每个办公室包含此办公室中全部电话号吗的信息。 请给出你认为合理的数据依赖,把这个层次结构转换成一组规范化的关系。 提示:此题可分步完成,先转换成一组1NF的关系,然后逐步转换成2NF,3NF,...。 先得到一个泛关系的模式如下: D={D#,Manager_E#,Budget,E#,J#,Phone#,Business,Sa_History,Office#,Area} D#:部门号, Manager_E#:部门领导人员的职工号, E#:职工号, J#:生产科研项目号, Phone#:办公室的电话号,Business:职工职务,Sa_History:工资历史,Office#:办公室号,Area:办公室面积 根据所给信息,给出下列数据依赖: F={D#→Manager_E#,E#→Office#,(E#,Business)→Sa_History,J#→Budget,E#→J#, Office#→Area,Office→D#,#Phone#→Office#} (假设一个部门可能有多个办公室,有多个项目,一个办公室只属于一个部门,有多部电话, 一个员工只参加一个项目,一个项目可能属于多个部门) 只要保证每个属性值不可分割,以上范式即为1NF。候选键为(E#,Business,Phone#) 转换成2NF关系(消除局部依赖): Em_Dep(E#,D#,Manager_E#,Office#,Area,J#,Budget)    对应 F={D#→Manager_E#,E#→Office#,J#→Budget,E#→J#,Office#→Area,Office→D#} History(E#,Business,History)    对应 F={(E#,Business)→Sa_History} Phone(Phone#,Office#)    对应 F={Phone#→Office#} 转换成3NF关系(消除非主属性对侯选键的传递依赖): Department(D#,Manager_E#) Office(Office#,Area,D#) Emproee(E#,J#,Office#) History(E#,Business,History) Phone(Phone#,Office#) Project(J#,Budget) 注意:由于对题意理解的不同,可能答案不唯一。 4.13 设关系模式R(ABC)上有一个多值依赖A→→B。 如果已知R的当前关系中存在三组(ab1c1)、(ab2c2)和(ab3c3),那么这个关系中至少还应存在哪些元组?    从多值依赖的定义可以得出,至少应存在下列元组: (ab1c2)、(ab1c3)、(ab2c1)、(ab2c3)、(ab3c1)、(ab3c2) 习 题 5 5.1 名词解释 (1)数据库设计:数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计, 以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系, 满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。 (2)数据库工程:指数据库应用系统的开发,它是一项软件工程,但有数据库应用自身的特点。 (3)评审:在数据库设计过程中,评审的目的是为了确认某一阶段的任务是否全部完成,避免重大的疏漏或错误, 并在生存期的早期阶段给予纠正,以减少系统研制的成本。 (4)数据字典:是对系统中数据的详尽描述,它提供对数据库数据描述的集中管理。 它的处理功能是存储和检索元数据,并且为数据库管理员提供有关的。 对数据库设计来说,数据字典是进行详细的数据收集和数据分析所获得的主要成果。 数据字典主要包括四个部分:数据项、数据结构、数据流、数据存储。 5.2 数据系统的生存期分成哪几个阶段?数据库结构的设计在生存期中的地位如何? 分成七个阶段:规划、需求分析、概念设计、逻辑设计、物理设计、实现、运行和维护。 数据库结构的设计在生存期中的地位很重要,数据库结构的设计包括逻辑设计、物理设计, 逻辑设计把概念模式转化为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构, 而物理设计主要是设计DB在物理设备上的存储结构与存取方法等。 5.3 什么是数据库设计?数据库设计过程的输入和输出有哪些内容?     数据库设计是指对于一个给定的应用环境,提供一个确定最优数据模型与处理模式的逻辑设计, 以及一个确定数据库存储结构与存取方法的物理设计,建立起既能反映现实世界信息和信息联系, 满足用户数据要求和加工要求,又能被某个数据库管理系统所接受,同时能实现系统目标,并有效存取数据的数据库。     数据库设计过程的输入包括四部分内容:1)总体信息需求;2)处理需求;(3)DBMS的特征;(4)硬件和OS(操作系统)特征。 数据库设计过程的输出包括两部分: (1)完整的数据库结构,其中包括逻辑结构和物理结构; (2)基于数据库结构和处理需求的应用程序的设计原则。这些输出一般以说明书的形式出现。 5.4 基于数据库系统生存期的数据库设计分成哪几个阶段? 分为5个阶段:简记为(规需概逻物):规划、需求分析、概念设计、逻辑设计和物理设计五个阶段。 5.5 什么是比较好的数据库设计方法?数据库设计方法应包括哪些内容? 一个好的数据库设计方法应该能在合理的期限内,以合理的工作量产生一个有实用价值的数据库结构。 一种实用的数据库设计方法应包括以下内容:设计过程、设计技术、评价准则、信息需求、描述机制。 5.6 数据库设计的规划阶段应做哪些事情?     数据库设计中的规划阶段的主要任务是进行建立数据库的必要性及可行性分析, 确定数据库系统在组织中和信息系统中的地位,以及各个数据库之间的联系。 5.7 数据库设计的需求分析阶段是如何实现的?目标是什么?     数据库设计的需求分析通过三步来完成:即需求信息的收集、分析整理和评审。     其目的在于对系统的应用情况作全面详细的调查,确定企业组织的目标, 收集支持系统总的设计目标的基础数据和对这些数据的要求,确定用户的需求, 并把这些要求写成用户和数据设计者都能够接受的文档。 5.8 评审在数据库设计中有什么重要作用?为什么允许设计过程中有多次的回溯与反复?     评审的作用在于确认某一阶段的任务是否全部完成,通过评审可以及早发现系统设计中的错误, 并在生存期的早期阶段给予纠正,以减少系统研制的成本。     如果在数据库已经实现时再发现设计中的错误,那么代价比较大。因此应该允许设计过程的回溯与反复。 设计过程需要根据评审意见修改所提交的阶段设计成果,有时修改甚至要回溯到前面的某一阶段, 进行部分乃至全部重新设计。 5.9 数据字典的内容和作用是什么? 数据字典的内容一般包括:数据项、数据结构、数据流、数据存储和加工过程。 其作用是对系统中数据做出详尽的描述,提供对数据库数据的集中管理。 5.10 对概念模型有些什么要求? 对概念模型一般有以下要求:   (1)概念模型是对现实世界的抽象和概括,它应真实、充分地反映现实世界中事物和事物之间的联系, 具有丰富的语义表达能力,能表达用户的各种需求,包括描述现实世界中各种对象及其复杂联系、 用户对数据对象的处理要求和手段。   (2)概念模型应简洁、明晰,独立于机器、容易理解、方便数据库设计人员与应用人员交换意见, 使用户能积极参与数据库的设计工作。   (3)概念模型应易于变动。当应用环境和应用要求改变时,容易对概念模型修改和补充。   (4)概念模型应很容易向关系、层次或网状等各种数据模型转换,易于从概念模式导出也DBMS有关的逻辑模式。 5.11 概念设计的具体步骤是什么? 概念设计的主要步骤为: (1)进行数据抽象、设计局部概念模式; (2)将局部概念模式综合成全局概念模式; (3)评审。 (具体解释参见教材p131) 5.12 什么是数据抽象?主要有哪两种形式的抽象?数据抽象在数据库设计过程中起什么作用?     数据抽象是对人、物、事或概念的人为处理,它抽取人们关心的共同特性,忽略非本质的细节, 并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。 数据抽象有两种形式:    (1)系统状态的抽象,即抽象对象;    (2)系统转换的抽象,即抽象运算。 数据抽象是概念设计中非常重要的一步。 通过数据抽象,可以将现实世界中的客观对象首先抽象为不依赖任何具体机器的信息结构。 5.13 什么是ER图?构成ER图的基本要素是什么? ER图是用来表示数据库概念设计ER模型的工具,它提供了表示实体、属性和联系的方法。 构成ER图的基本要素是实体、属性和联系。 5.14 试述采用ER方法的数据库概念设计的过程.     利用ER方法进行数据库的概念设计,可分成三步进行: 首先设计局部ER模式,然后把各局部ER模式综合成一个全局ER模式, 最后对全局ER模式进行优化,得到最终的ER模式,即概念模式。 5.15 逻辑设计的目的是什么?试述逻辑设计过程的输入和输出环境。     逻辑设计的目的是把概念设计阶段设计好的基本ER图转换为与选用的具体机器上的DBMS所支持的数据模型相符合的逻辑结构(包括数据库模式和外模式)。 逻辑设计过程中的输入信息有:   (1)独立于DBMS的概念模式,即概念设计阶段产生的所有局部和全局概念模式;   (2)处理需求,即需求分析阶段产生的业务活动分析结果;   (3)约束条件,即完整性、一致性、安全性要求及响应时间要求等;   (4)DBMS特性,即特定的DBMS特性,即特定的DBMS所支持的模式、子模式和程序语法的形式规则。 逻辑设计过程输出的信息有:   (1)DBMS可处理的模式;   (2)子模式;   (3)应用程序设计指南;   (4)物理设计指南。 5.16 试述逻辑设计阶段的主要内容。 逻辑设计主要是把概念模式转换成DBMS能处理的模式。 转换过程中要对模式进行评价和性能测试,以便获得较好的模式设计。 逻辑设计的主要步骤包括: (1)初始模式的形成 (2)子模式设计 (3)应用程序设计梗概 (4)模式评价 (5)修正模式。 5.17 规范化理论对数据库设计有什么指导意义? 在概念设计阶段,已经把关系规范化的某些思想用作构造实体类型和联系类型的标准, 在逻辑设计阶段,仍然要使用关系规范化的理论来设计模式和评价模式。 规范化的目的是减少乃至消除关系模式中存在的各种异常,改善完整性,一致性和存储效率。 5.18 什么是数据库结构的物理设计?试述其具体步骤。 数据库结构的物理设计是指对一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程, 所谓数据库的物理结构主要指数据库在物理设备上的存储结构和存取方法。 物理设计的步骤为: (1)设计存储记录结构,包括记录的组成、数据项的类型和长度,以及逻辑记录到存储记录的映射; (2)确定数据存储安排; (3)设计访问方法,为存储在物理设备上的数据提供存储和检索的能力; (4)进行完整性和安全性的分析、设计; (5)程序设计。 5.19 数据实现阶段主要做哪几件事情? 数据库实现阶段的主要工作有以下几点: (1)建立实际数据库结构 (2)试运行 (3)装入数据 (具体解释参见教材p150) 5.20 什么是数据的再组织设计?试述其重要性。     对数据的概念模式、逻辑结构或物理结构的改变称作数据再组织。     数据再组织,通常是由于环境,需求的变化或性能原因而进行的,如信息定义的改变, 增加新的数据类型,对原有的数据提出了新的使用要求, 改用具有不同物理特征的新存储设备以及数据库性能下降等都要求进行数据库的重新组织。 5.21 数据系统投入运行后,有哪些维护工作? 数据系统投入运行后,主要维护工作有: (1)维护数据库的安全性与完整性控制及系统的转储和恢复; (2)性能的监督、分析与改进; (3)增加新功能; (4)发现错误,修改错误。 习 题 6 6.1 名词解释 (1)事务:事务是指一个操作序列,这些操作要么什么都做,要么都不做,是一个不可分割的工作单位, 是数据库环境中的逻辑工作单位,相当于操作系统环境下的"进程"概念。 (2)封锁:封锁就是事务可以向系统发出请求,对某个数据对象加锁,此事务对这个数据对象有一定控制, 而其他事务则不能更新数据直到事务释放它的锁为止。 (3)X封锁:如果事务T对数据R实现X封锁,那么其他的事务要等T解除X封锁以后,才能对这个数据进行封锁。 只有获准X封锁的事务,才能对被封锁的数据进行修改。 (4)PX协议:X封锁的规则称为PX协议,其内容为:任何企图更新记录R的事务必须先执行LOCK X(R)操作, 以获得对该记录进行寻址的能力,并对它取得X封锁。如果未获得X封锁,那么这个事务进入等待状态, 一直到获准X封锁,事务继续进行。 (5)PXC协议:它由PX协议及一条规则"X封锁必须保留到事务终点(COMMIT或ROLLBACK)"组成。 (6)死锁:有两个或以上的事务处于等待状态,每个事务都在等待另一个事务解除封锁, 它才能继续执行下去,结果任何一个事务都无法执行,这种现象就是死锁。 (7)串行调度:多个事务依次执行,称为串行调度。 (8)并发调度:利用分时的方法,同时处理多个事务,称为事务的并发调度。 (9)可串行化调度:如果某事务集的一个并发调度的结果与某个串行调度等价, 则称此并发调度是是可串行化调度。 (10)不可串行化调度:某事务集的一个并发调度结果,如果与任一串行调度均不等价,则该并发调度是不可串行化调度。 (11)S封锁:共享型封锁。果事务T对某数据R加上S封锁,那么其它事务对数据R的X封锁便不能成功, 而对数据R的S封锁请求可以成功。这就保证了其他事务可以读取R但不能修改R,直到事务T释放S封锁。 (12)PS协议:任何要更新记录R的事务必须先执行LOCK S(R)操作,以获得对该记录寻址的能力并对它取得S封锁。 如果未获准S封锁,那么这个事务进入等待状态,一直到获准S封锁,事务才继续进行下去。 当事务获准对记录R的S封锁后,在记录R修改前必须把S封锁升级为X封锁。 (13)PSC协议:由PS协议和“将S封锁保持到事务终点”组成。 任何更新记录R的事务必须先执行LOCK S(R)操作,以获得对该记录寻址的能力并对它取得S封锁。 如果未获准S封锁,那么这个事务进入等待状态,一直到获准S封锁,事务才继续进行下去。并将S封锁保持到事务终点。 (14)两段封锁协议:(1)在对任何数据进行读写操作之前,事务首先要获得对该数据的封锁; (2)在释放一个封锁之后,事务不再获得任何其他封锁。 6.2 试叙事务的四个性质,并解释每一个性质对DBS有什么益处? 事务的四个性质是:原子性、一致性、隔离性和持久性。 (1)原子性(具体含义见教材):事务中所有操作应视为整体,不可分割。 (2)一致性(具体含义见教材):一个事务独立执行的结果将保证数据库的一致性,即数据不会因事务的执行而遭受破坏。 (3)隔离性(具体含义见教材):隔离性要求在并发事务被执行时,系统应保证与这些事务先后单独执行时结果一样, 使事务如同在单用户环境下执行一样。 (4)持久性(具体含义见教材):要求事务对数据库的所有更新应永久地反映在数据库中。 6.3 事务的COMMIT操作和ROLLBACK操作各做些什么事情? COMMIT操作表示事务成功地结束(提交),此时告诉系统,数据库要进入一个新的正确状态, 该事务对数据库的所有更新都已交付实施。 ROLLBACK操作表示事务不成功地结束,此时告诉系统,已发生错误,数据库可能处在不正确的状态, 该事务对数据库的更新必须被撤销,数据库应恢复该事务到初始状态。 6.4 UNDO操作和REDO操作各做些什么事情? UNDO操作是反向扫描"日志"文件,撤销对数据库的更新操作,使数据库恢复到更新前的状态; REDO操作正向扫描日志文件,重新做一次更新,使数据库恢复到更新后的状态。 6.5 DBS中有哪些类型的故障?哪些故障破坏了数据库? 哪些故障未破坏数据库,但其中某些数据变得不正确? 数据库系统故障有事务故障、系统故障、介质故障。 其中介质故障破坏数据库,事务故障、系统故障未破坏数据库但使其中某些数据变得不正确。 6.6 什么是“运行记录优先原则”?其作用是什么? 在数据库系统中,写一个修改到数据库中和写一个表示这个修改的登记记录到日志文件中是两个不同的操作, 在这两个操作之间有可能发生故障。这时,如果先写了数据库修改,而在运行记录中没有登记这个修改, 则以后就无法恢复这个修改,那么以后也就无法撤消这个修改。为了安全起见,采用“运行记录优先原则”。 它包括两点: (1)至少要等相应运行记录已经写入“日志”文件后,才能允许事务往数据库中写记录。 (2)直至事务的所有运行记录都已写入运行“日志”文件后,才能允许事务完成“END TRANSACTION”处理。 采用“运行记录优先原则”,可以保证所做的操作都记录在日志中,便于故障处理,维护数据库的一致性。 6.7 什么是数据库的恢复?恢复的基本原则是什么,恢复如何实现? 数据库的恢复是指当数据库系统发生故障时,通过一些技术, 使数据库从被破坏、不正确的状态恢复到最近一个正确的状态。 恢复的基本原则就是冗余,即数据的重复存储。恢复的常用方法有: (1)定期对整个数据库进行复制或转储; (2)建立日志文件; (3)恢复。用REDO或UNDO处理。 6.8 数据库的并发操作会带来哪些问题?如何解决? 数据库的并发操作会带来三类问题: (1)丢失更新问题;(具体内容见教材P158) (2)不一致分析问题 (3)“脏数据”的读出。 解决的办法通常是采用“封锁”技术。 6.9 有哪些“丢失更新”问题?如何处理? (1)并发调度引起的“丢失更新”问题。在并发调度中,如两个事务同时对某数据库进行更新操作, 在操作中丢失了其中某个事务对某数据的更新操作。处理的办法就是对并发操作采用X封锁技术。 (2)由恢复引起的更新丢失现象。采用X封锁以后,先执行事务T1,再执行事务T2,此时, 如果T2做ROLLBACK操作,就把事务T2的更新丢失了。 处理方式是采用PXC协议,不允许事务T1执行解锁操作直到事务执行到终点(COMMIT或ROLLBACK)。 6.10 为什么DML只提供解除S封锁的操作,而不提供解除X封锁的操作? 为了防止由恢复引起的更新丢失现象,PXC协议规定:X封锁必须保留到事务终点(COMMIT或ROLLBACK)。 因此在DML中,COMMIT或ROLLBACK的语义中包含了X封锁的解除,不用提供解除X封锁的操作。 而对于S封锁而言,它是一种共享型的封锁(读取但不能修改),其数据不可能是未提交的修改, 封锁不必等提交后才能解除,因此可以由事务用UNLOCK解除各自对数据的封锁。 6.11 为什么有些封锁需保留到事务终点,而有些封锁可随时解除? 因为有的封锁需要更新数据,保留到终点才能确认是否提交或回退以避免脏数据的读出, 所以这些封锁需要保留到事务终点。 而有些事务全部或部分操作只是读取数据,不涉及更新数据操作, 因此这一部分操作的封锁可以随时解除。 6.12 死锁的发生是坏事还是好事?试说明理由。如何解除死锁状态? 死锁的发生即是坏事又是好事。 (1)使并发事务不能继续执行下去,造成时间开销却不产生结果。 (2)在某些时候我们要利用它来解决更新操作导致的数据库不一致状态。 解除死锁状态:抽出某个事务作为牺牲品,把它撤消,做回退操作,解除它的所有封锁,并恢复到初始状态。 6.13 试叙述"串行调度"与"可串行化调度"的区别。 串行调度是多个事务按照一定的次序依次执行;在某一时刻只有一个事务在执行。 而可串行化调度是并发调度中的一个概念。在并发调度中,某一时刻有多个事务同时被处理。 如果某事务集的一个并发调度的结果与某个串行调度等价, 则称此并发调度是是可串行化调度。 (以上几题具体可参照书上p20-21) 6.14 什么是数据库的完整性? DBMS的完整性子系统的功能是什么? 数据库的完整性是指数据的正确性和相容性。DBMS完整性子系统的功能是: (1)监督事务的执行,并测试是否违反完整性规则; (2)如有违反,则采取恰当的操作,如拒绝、报告违反情况,改正错误等方法进行处理。 6.15 完整性规则由哪几个部分组成?关系数据库的完整性规则有哪几类? 完整性规则由三部分组成: 触发条件:即什么时候使用规则进行检查; 约束条件:即要检查什么样的错误; ELSE子句:即查出错误后该如何处理。 完整性规则有以下三类: 域完整性规则,用于定义属性的取值范围; 域联系的规则,定义一个或多个关系中,属性值间的联系、影响和约束。 关系完整性规则,定义更新操作对数据库中值的影响和限制。 6.16 试详述SQL中的完整性约束机制? SQL中的完整性约束规则有主键约束、外键约束、属性值约束和全局约束等多种形式。 △主键约束。它是数据中最重要的一种约束。在关系中主键值不允许空,也不允许出现重复, 体现了关系要满足实体完整性规则。主键可用主键子句或主键短语进行定义。 △外键约束。根据参照完整性规则,依赖关系中外键或者为空值, 或者是基本关系(参照关系)中的该键的某个值。外键用外键关系子句定义, 并考虑删除基本关系元组或修改基本关系的主键值的影响,依赖关系可按需要采用RESTRICT、SET NULL、CASCADE方式。 △属性值约束。当要求某个属性的值不允许空值时,那么可以在属性定义后加上关键字:NOT NULL , 这是非空值约束。还可以用CHECK子句对一个属性值加以限制以及使用域约束子句CREAT DOMAIN 定义新域并加以属性值检查。 △全局约束。在关系定义时,可以说明一些比较复杂的完整性约束,这些约束涉及到多个属性间的联系 或不同关系间的联系,称为全局约束。主要有基于元组的检查子句和断言。 前者是对单个关系的元组值加以约束,后者则可对多个关系或聚合操作有关的完整性约束进行定义。 6.17 参照完整性规则在SQL可以用哪几种方式实现?删除基本关系的元组时, 依赖关系可以采取的做法有哪三种?修改基本关系的主键值时,依赖关系可以采取的做法有哪三种? 参照完整性规则要求"不引用不存在的实体",参照完整性规则在SQL可用以下几种方式实现: (1)在SQL中采用外键子句定义外键,并考虑删除基本关系元组或修改基本关系的主键值, 对依赖关系产生的影响; (2)在属性值上进行约束如基于属性的检查; (3)全局约束中的基于元组的检查子句等。 删除基本关系元组或修改基本关系的主键值时,依赖关系可以采用的做法有: △RESTRICT方式:只有当依赖关系中没有一个外键值与基本关系中要删除/修改的主键值相对应时, 系统才能执行删除/修改操作,否则拒绝删除或修改。 △SET NULL方式:删除基本元组时,将依赖关系中所有与基本关系中被删除主键值相对应的外键值置为空值。 修改基本关系的主键值时,将依赖关系中所有与基本关系中被修改主键值相对应的外键值置为空值。 △CASCADE方式:若删除则将依赖关系中所有外键值与基本关系中要删除的主键值相对应的元组一并删除, 若修改则将依赖关系中所有与基本关系中要修改的主键值相对应的外键值一并修改为新值。 6.18 试对SQL2中的基于属性的检查约束、基于元组的检查约束和断言 三种完整性约束进行比较:各说明什么对象?何时激活?能保证数据库的一致性吗? 约束形式 说明对象 激活条件 是否保证一致性 基于属性的检查 只对一个属性值加以约束 插入或修改属性值时 不一定 基于元组的检查 对单个关系的元组值加以约束 在插入或修改元组时 不一定 断言 多个关系或聚合操作 任何变动 保证 6.19 设教学数据库的模式如下: S(S#,SNAME,AGE,SEX) SC(S#,C#,GRADE) C(C#,CNAME,TEACHER) 试用多种方式定义下列完整性约束: (1)在关系S中插入学生年龄值应在16~25岁之间 (2)在关系SC中插入元组时,其S#值和C#值必须分别在S和C中出现。 (3)在关系SC中修改GRADE值时,必须仍在0~100之间。 (4)在删除关系C中一个元组时,首先要把关系SC中具有同样C#的元组全部删去。 (5)在关系S中把某个S#值修改为新值时,必须同时把关系SC中那些同样的S#值也修改为新值。 (1)定义S时采用检查子句:    CREAT TABLE S(    S# CHAR(4),    SNAME char (10) NOT NULL ,    AGE SMALLINT ,    PRIMARY key(S#),    CHECK (AGE>=16 and AGE<=25) ) (2)采用外键子句约束    CREAT TABLE SC(    S# CHAR(4),    C# CHAR(4),    GRADE SMALLINT,    FOREIGN key(S#) REFERENCE S(S#),    FOREIGN key(C#) REFERENCE C(C#)    ) (3)采用元组检查    CREAT TABLE SC(    S# CHAR(4),    C# CHAR(4),    GRADE SMALLINT,    FOREIGN key(S#) REFERENCE S(S#),    FOREIGN key(C#) REFERENCE C(C#),    CHECK (GRADE>=0 and AGE<=100) ) (4)采用外键约束    CREAT TABLE SC(    S# CHAR(4),    C# CHAR(4),    GRADE SMALLINT,    FOREIGN key(S#) REFERENCE S(S#),    FOREIGN key(C#) REFERENCE C(C#)    )       若改为:在删除关系C中一个元组时,同时把关系SC中具有同样C#的元组全部删去,则为:    ......    FOREIGN key(C#) REFERENCE C(C#) ON DELETE CASCADE    ...... (5)采用外键约束    CREAT TABLE SC(    S# CHAR(4),    C# CHAR(4),    GRADE SMALLINT,    FOREIGN key(S#) REFERENCE S(S#) ON UPDATE CASCADE ,    FOREIGN key(C#) REFERENCE C(C#)    ) 6.20 在教学数据库的关系S、SC、C中,试用SQL2的断言机制定义下列两个完整性约束: (1)学生必须在选修Maths课后,才能选修其他课程。 (2)每个男学生最多选修20门课程 (1)   CREAT ASSERTION ASSE1 CHECK    ( NOT EXISTS     ( SELECT S FROM SC       WHERE C# IN        (SELECT C#         FROM C         WHERE CNAME<>'MATHS')       AND S# NOT IN         (SELECT S# FROM SC         WHERE C# IN        (SELECT C#         FROM C         WHERE CNAME='MATHS'))); (2)   CREAT ASSERTION ASSE2 CHECK    ( ALL(SELECT COUNT (SC.C#)         FROM S,SC         WHERE S.S#=SC.S AND SEX='M'         GROUP BY S#)<=20); 6.21 什么是数据库的安全性?有哪些安全措施? 数据库的安全性是指保护数据库防止不合法的使用,以免数据的泄漏、非法更改和破坏。 可以从以下方面设置数据库的安全措施:环境级、职员级、OS级、网络级和数据库系统级。 (具体可参见教材P173) 6.22 对银行的数据库系统应采取哪些安全措施?分别属于哪一级? 答案基本同上一题。 6.23 什么是"权限"?用户访问数据库可以有哪些权限?对数据库模式有哪些修改权限? 用户使用数据库的方式称为权限。 用户访问数库的权限有:读权限、插入权限、修改权限、删除权限。 用户修改数据库模式的权限有索引权限、资源权限、修改权限、撤销权限。 6.24 试解释权限的转授与回收。 在数据库系统中,为了保证数据的安全性,用户对数据的操作必须首先从DBA处获得权限,才能进行对数据的操作。 同时数据库系统也允许用户将获得的权限转授给其他用户,也允许把已授给其他用户的权限再回收上来。 但应保证转授出去的权限能收得回来。 6.25 SQL 语言中的视图机制有哪些优点? 视图机制使系统具有三个优点:数据安全性、数据独立性和操作简便性。 6.26 SQL2中用户权限有哪几类?并作必要的解释。 SQL2中定义了六类用户权限,分别是: (1)SELECT :允许用户对关系或视图执行SELECT操作。 (2)INSERT :允许用户对关系或视图执行INSERT操作,如果还说明了一个属性表, 那么表示只能插入这些属性的值,关系中其他属性值将置为缺省值或为空值。 (3)DELETE:允许用户对关系或视图执行DELETE操作。 (4)UPDATE:允许用户对关系或视图执行UPDATE操作,如果还说明了一个属性表, 那么表示只能修改这些属性的值,否则表示可以修改关系中任一属性值。 (5)REFERENCES:允许用户定义新关系时,引用其他关系的主键作为外键。 (6)USAGE:允许用户使用定义的域。 6.27 数据加密法有些什么优点?如何实现? 数据加密可以更好地保证数据的完全性。加密采用一定的加密算法给把源文变为密文来实现。 常用的加密算法有"替换方法"和明键加密法。 习 题 7 7.1 名词解释 (1)集中式DBS:是指数据库中的数据集中存储在一台计算机上,数据的处理集中在一台计算机上完成。 (2)分布式DBS:是指数据存放在计算机网络的不同场地的计算机中,每一场地都有自治处理能力并完成局部应用;而每一场地也参与(至少一种)全局应用程序的执行,全局应用程序可通过网络通信访问系统中的多个场地的数据。 (3)分布式DB:分布式数据库,是指计算机网络环境中各场地上数据库的逻辑集合。 (4)分布式DBMS:分布式数据库管理系统。是指分布式数据库系统中的一组软件, 它负责管理分布环境下逻辑集成数据的存取、一致性、有效性和完备性。同时,由于数据的分布性, 在管理机制还必须具有计算机网络通信协议上的分布管理特性。 (5)局部自治性:是指有独立处理能力并能完成的局部应用。 (6)数据分配(数据分布):是指数据计算机网络各场地上的分配策略。 (7)数据复制:是指数据在每个场地重复存储。 (8)数据分片:是指分布式数据库中的数据可以被分割和复制在网络场地的各个物理数据库中。 一般数据存放的单位不是关系而是片段,一个片段是关系的一部分。 数据分片是通过关系代数的基本运算实现的。 (9)水平分片:是指按一定条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。 (10)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上做投影运算,每个投影为垂直分片。 (11)分布透明性:指用户不必关系数据的逻辑分片,不必关系数据物理位置的细节,也不必关心各个场地上的数据库的数据模型。 (12)分片透明性:分片透明性是最高层次的分布透明性,是指用户或应用程序只对全局关系进行操作而不必考虑数据的分片。 (13)位置透明性:位置透明性位于分片视图与分配视图之间。是指用户或应用程序应当了解分片情况,但不必了解片段的存储场地。 (14)局部数据模型透明性:这个透明性位于分配视图与局部概念视图之间,指用户或应用程序要了解分片及各片段存储的场地,但不必了解局部场地上使用的是何种数据模型。 (15)复制透明性:即用户不必关心数据库在网络中各个结点的数据库复制情况,更新操作引起的波及由系统去处理。 7.2 试叙数据从集中存储、分散存储到分布存储的演变过程。      早期的数据库系统都是属于集中式数据库系统,数据集中存储在一台计算机上。该方式有一定优点, 比如,价格合理,易于管理,数据冗余少等等。但是,随着数据库应用的不断发展, 数据库规模不断扩大,如采用集中存储的数据库,其系统的设计和操作都比较复杂, 系统显得不灵活而且安全性也较差。因此采用了数据分散存储的办法,将数据库分成多个,建立在多台计算机上, 此时的各个数据库的管理和应用程序均是分开并独立的。它们之间不存在数据通信联系。 随着计算机网络通信的发展,有可能把分散在各处的数据库系统通过网络通信连接起来, 这样形成的系统称为分布式的数据库系统,这时的数据库虽然分别存在各地的计算机上, 但它们之间通过分布式数据管理系统可以进行联系。 7.3 与集中式DBS、分散式DBS相比,分布式DBS有哪些特点?     与集中式DBS相比,分布式DBS中数据库的存储是分布性的,即数据不是存储在同一场地, 而是分布存储在多个场地。与分散式DBS相比,分布式DBS中数据库具有"逻辑整体性", 即表面上看,分布式数据的数据库分散在各个场地,但这些数据在逻辑上却是一个整体, 如同一个集中式数据库。 7.4 试解释下列术语:同构同质型DDBS,同构异质型DDBS,异构DDBS。 (1)同构同质型DDBS:是指各个场地都采用同一类型的数据模型,并且是同一型号数据库管理系统。 (2)同构异质型DDBS:是指各个场地都采用同一类型的数据模型,但是数据库管理系统是不同型号的。 (3)异构型DDBS:是指各个场地的数据模型是不同的类型。 7.5 分布式数据库系统有哪些优点和缺点? 分布式数据库系统的优点:   (1)具有灵活的体系结构   (2)适应分布式的管理和控制机构   (3)经济性能优越   (4)系统的可靠性高、可用性好   (5)局部应用的响应速度快   (6)可扩展性好,易于集成现有系统 分布式数据库系统的缺点:   (1)系统开销大,主要花在通信部分;   (2)复杂的存取结构,原来在集中式系统中有效存取数据的技术,在分布式系统中都不再适用;   (3)数据的安全生和保密性较难处理。  7.6 分布式数据库中,"数据分配"有哪些策略?"数据分片"有哪些策略? 数据分片的准则是什么? 数据分配是指数据在计算机网络各场地上的分配策略。包括:   (1)集中式:所有数据均安排在同一个场地上。   (2)分割式:所有数据只有一份,分别被安置在若干个场地。   (3)全复制式:数据在每个场地重复存储。   (4)混合式:数据库分成若干可相交的子集,每一子集安置在一个或多个场地上,但是每一场地未必保存全部数据。 数据分片的方式有以下三种:   (1)水平分片:按一定的条件把全局关系的所有元组划分成若干不相交的子集,每个子集为关系的一个片段。   (2)垂直分片:把一个全局关系的属性集分成若干子集,并在这些子集上做投影运算,每个投影为垂直分片。   (3)混合型分片:将水平分片与垂直分片方式综合使用则为混合型分片。 数据分片应遵循的准则为:   (1)完备性条件:必须把全局关系的所有数据映射到各个片段中,绝不允许发生属于全局关系的某个数据不属于任何一个片段。   (2)重构条件:划分所采用的方法必须确保能够由各个片段重建全局关系。   (3)不相交条件:要求一个全局关系被划分后得到的各个数据片段互相不重叠。 7.7 试叙述分布式DBS的体系结构,它有什么特征? 分布式DBS的体系结构分为四级:全局外模式、全局概念模式、分片模式和分配模式。   (1)全局外模式:它们是全局应用的用户视图,是全局概念模式的子集。   (2)全局概念模式:全局概念模式定义了分布式数据库中所有数据的逻辑结构。   (3)分片模式:分片模式定义片段以及定义全局关系与片段之间的映象。这种映象是一对多的,即每个片段来自一个全局关系,而一个全局关系可分成多个片段。   (4)分配模式:片段是全局关系的逻辑部分,一个片段在物理上可以分配到网络的不同场地上。分配模式根据数据分配策略的选择定义片段的存放场地。 分布式DBS的分层体系结构有三个特征:   (1)数据分片和数据分配概念的分离,形成了"数据分布独立性"概念。   (2)数据冗余的显式控制。   (3)局部DBMS的独立性。 7.8 试叙述分布式DBMS的功能及组成。  主要功能有:   (1)接受用户请求,并判定把它送到哪里,或必须访问哪些计算机才能满足该请求。   (2)访问网络数据字典,或者至少了解如何请求和使用其中的信息。   (3)如果目标数据存储于系统的多个计算机上,就必须进行分布式处理。   (4)通信接口功能,在用户、局部DBMS和其他计算机的DBMS之间进行协调。   (5)在一个异构型分布式处理环境中,还需提供数据和进程移植的支持。这里的异构型是指各个场地的硬件、软件之间存在一定差别。 DDBMS组成——应包括以下四个子系统:   (1)查询子系统   (2)完整性子系统   (3)调度子系统   (4)可靠性子系统 7.9 分布式系统中影响查询的主要因素是什么?     分布式系统中,影响查询的主要因素数据经网络的传输时间,数据传输量是衡量查询时间的一个主要指标, 不同场地间的联接操作和并操作是影响数据传输量的主要原因。 7.10 基于半联接的查询优化策略的基本思想是什么?     数据在网络中传输时,如果以整个关系传输,则传输数据量大,是一种冗余的做法, 而实际上,在联接时并非每个数据都参与操作或有用。因此,考虑到不参与操作的值或无用的值不必经网络来回传输,则可以减少传输的数据量。 7.11 表7.2中有两个关系R和S,试计算下列表达式的值:   7.12 试述基于半联接查询的优化策略。    假设场地1的关系R和场地2的关系S在属性R.A和S.B上做联接操作, 为了减少数据传输量,采用半联接方法,表示方法如下:     等式右边的式子称为"半联接程序": △第一步,在场地2计算关系S在属性B上的投影πB(S),然后把πB(S)从场地2传输到场地1. △第二步,在场地1执行半联接(结果为关系R和πB(S)的自然连接)。 设结果为R',再把R'传到场地2。 △第三步,在场地2执行R'与S的联接操作得到结果。 依照以上步骤,不参与联接的值或无用的值不必在网络中来回传输,减少了数据传输量。 7.13 试述客户/服务器式DBS的一般结构。此时数据库应用的功能如何划分?     客户/服务器式DBS是在客户/服务器计算机网络上运行的DBS,这个计算机网络中,有一些计算机扮演客户, 另一些计算机扮演服务者(即客户机/服务器)。 客户/服务体系结构的关键在于功能的分布。一些功能放在客户机(前端机)上运行,另一些功能则放在服务器(后端机)上执行。此时数据库应用的功能分成两部分: 客户机(前端部分):由一些应用程序构成,例如,格式处理、输出、数据输入、图形,实现前端处理和用户界面。 服务器(后端部分):包括存取结构、查询优化、并发控制、恢复等系统程序,完成事务处理和数据访问控制。 7.14 试述分布式DBS的物理级客户/服务器体系结构。     客户/服务器式的分布式DBS中,把DBMS软件分成两级:客户级和服务器级。 如某些场地可能只运行客户机软件,某些场地可能只运行专用的服务器软件, 而在有一些场地可能客户机软件和服务器软件都运行。 7.15 在分布式DBS中,DBMS的功能如何划分? 有哪两种方法?     第一种方法是把集中式DBMS的功能放在服务器一级,提供给若干客户一个SQL服务器, 每个客户机接收用户的查询命令,并解释SQL查询,提供用户接口和宿主语言接口的功能。     第二种方法是基于面向对象方法,把DBMS的软件功能以更加集成的方式划分到客户机和服务器中。 7.16 在典型的分布式DBMS中,软件模块分成哪三级? 在典型的分布式DBMS中,软件模块分成以下三级: (1)服务器级软件:负责场地的局部数据管理 (2)客户机软件:负责进行分布式管理,从数据字典中获取数据分布的信息,并处理涉及多场地的全局查询。 (3)通信软件:负责提供各场地间的数据传输。 习 题 8 8.1 名词解释 (1)OODBS:是指面向对象数据库系统,它既具数据库管理的基本功能,又能支持面向对象的数据模型。 (2)ORDBS:基于对象关系数据模型的DBS称为对象关系数据库系统(ORDBS)。 (3)平面关系模型:传统的关系模型称为“平面关系模型”,它要求关系模式具有第一范式(1NF)性质,关系具有规范化的结构。也就是规定属性值是不可分解的,即不允许属性值具有复合结构(元组或关系)。 (4)嵌套关系模型:是从平面关系模型发展而成的。它允许关系的属性值又可以是一个关系,而且可以出现多次嵌套。嵌套关系突破了1NF的定义框架,是“非1NF关系”。 (5)复合对象模型:在嵌套关系模型上进一步放宽要求。在关系定义上,集合与元组不再有交替出现的严格限制,此时的关系中,属性类型可以是基本数据类型、结构类型(元组类型)或集体类型(即关系类型)。 (6)数据的泛化/细化:是对概念之间联系进行抽象的一种方法。当在较低层上的抽象表达了与之联系的较高层上抽象的特殊情况时,就称较高层上抽象是较低层上抽象的"泛化",而较低层上抽象是较高层上抽象的"细化"。 (7)对象关系模型:在传统关系数据基础上,提供元组、数组、集合等更为丰富的数据类型及处理新数据类型操作的能力而形成的数据模型。(注:传统关系模型只支持字符、数值、字串,布尔值等等基本数据类型及其处理功能) (8)类型级继承性:当继承性发生在类型级时,子类型继承了超类型的属性。也就是说,超类型所具有的属性,在子类上也具有。 (9)表级继承性:继承性也可发生在表级,(就是元组集合上发生继承),子表继承超表全部属性,超表中每个元组最多可以与子表中一个元组对应,而子表中的每个元组在超表中恰有一个元组对应,并在继承的属性值上具有相同的值。 (10)引用类型:数据类型可以嵌套定义,在嵌套引用时,不是引用对象本身,而是个用对象标识符(即指针),这种指针被称为引用类型。 (11)对象:客观世界中的实体经过抽象称为问题空间中的对象,它是对一组信息及其操作的描述。 (12)类:是具有相同的变量名和类型、相同的消息和使用方法的对象的集合。 (13)单重继承性:一个子类继承某一个超类的结构和特性,称为单重继承性。 (14)多重继承性:一个子类继承多个超类的结构和特性,称为多重继承性。 (15)对象标识:在面向对象语言中,对象标识是一个指针一级的概念,在对象创建的瞬间,由系统赋给每个对象一个“标识”,即系统内的一个唯一的指针,在对象生存期内,这个标识不可改变。 (16)对象包含:不同类的对象之间存在的包含关系称为对象包含。包含是一种“一部分”(is part of)的联系。 (17)类继承层次图:表示类继承关系的图,由超类名、子类名和一组线条自上而下有序的表示。 (18)类包含层次图:表示对象包含关系的图,由一些具有包含关系的对象和线条自上而下表示(下方的对象为其连线所指上方对象的一部分)。 (19)持久数据:是指创建这些数据的程序运行终止后数据依然存在于系统之中。数据库中的关系就是持久数据。 (20)持久对象:程序运行结束后,被保留下来的对象称为持久对象。 (21)持久指针:持久指针可看作是数据库中指向对象的指针。持久化指针不像内存中的指针,它在程序执行后及数据重组后仍保持有效。 (22)持久化C++系统: 基于C++的持久化扩充的OODBS。 8.2 随着计算机应用领域的扩大,关系数据库系统不能适应哪些应用需要? 答:关系数据库不适应的应用需要有: (1)多媒体数据。 (2)空间数据 (3)时态数据。 (4)复合对象。   8.3 什么是对象联系图?图中,椭园、小圆圈、单箭头(→),双箭头(→→),双线箭头(=>),双向箭头(←→)所表示的含义。 答:椭圆表示对象,小圆圈表示属性是基本数据类型,单箭头(→)表示函数值是单值,双箭头(→→)表示函数值是多值,双线箭头(=>)是泛化边,表示泛化/细化联系,双向箭头(←→)表示两个函数互逆。 8.5 子表和超表应满足哪两个一致性要求? 子表和超表应满足下列两个一致性要求: (1)超表中每个元组最多可以与每个子表中的一个元组对应。 (2)子表中每个元组在超表中恰有一个元组对应,并在继承的属性上有相同的值。   8.6 继承性体现了数据间什么联系?试举例说明。     继承是" is a "(细化/泛化)联系。比如卡车是车的子类,“卡车”“is a”“车”“卡车”和“车”之间存在继承性。   8.7 持久化语言和嵌入式SQL语言有什么区别?   持久化语言与嵌入式SQL语言的不同:    (1)格式转换对程序员透明;    (2)程序员可直接操纵持久数据。 (具体内容可参见教材P211) 8.8 在OO技术与DB技术相结合过程中,采取了哪两条不同的途径?    一条途径是在传统的关系模型基础上,提供复合数据类型,扩充SQL语言使之能处理新的数据结构。这种模型称为对象关系模型,还不能说是严格意义上的面向对象数据模型。但是用户容易接受,易于推广。     另一条途径是在OOPL C++基础上进行扩充,能操作持久数据,处理数据库,形成持久化C++系统,即OODBS。但较难提供对说明性查询的支持,因此推广使用难度较大。
/
本文档为【数据库原理数据库原理】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索