免费智能真题库 > 历年试卷 > 数据库系统工程师 > 2019年上半年 数据库系统工程师 上午试卷 综合知识
  第61题      
  知识点:   关系模式的规范化   规范化   数据操作
  关键词:   数据        章/节:   数据库设计       

 
在设计关系模式时,有时为了提高数据操作的性能,会故意增加冗余数据,使得关系模式不满足3NF或BCNF,这种方法称之为反规范化,下列不属于反规范化手段的是( )。
 
 
  A.  合并模式
 
  B.  增加冗余属性
 
  C.  创建视图
 
  D.  增加派生属性
 
 
 

 
  第34题    2015年上半年  
   25%
部门、员工和项目的关系模式及它们之间的E-R图如下所示,其中,关系模式中带实下划线的属性表示主键属性。
部门(部门代..
  第36题    2011年上半年  
   54%
设有员工实体Employee (员工号,姓名,性别,年龄,电话,家庭住址,家庭成员,关系,联系电话)。其中,“家庭住址”..
  第32题    2016年上半年  
   45%
关系规范化是在数据库设计的(32)阶段进行。
   知识点讲解    
   · 关系模式的规范化    · 规范化    · 数据操作
 
       关系模式的规范化
        由E-R图转换得来的初始关系模式并不能完全符合要求,还会有数据冗余、更新异常存在,这就需要经过进一步的规范化处理,具体步骤如下:
        (1)根据语义确定各关系模式的数据依赖。在设计的前一阶段,只是从关系及其属性来描述关系模式,并没有考虑到关系模式中的数据依赖。关系模式包含着语义,要根据关系模式所描述的自然语义写出关系数据依赖。
        (2)根据数据依赖确定关系模式的范式。由关系的码及数据依赖,根据规范化理论,就可以确定关系模式所属的范式,判定关系模式是否符合要求,即是否达到了3NF或4NF。
        (3)如果关系模式不符合要求,要根据关系模式的分解算法对其进行分解,达到3NF、BCNF或4NF。
        (4)关系模式的评价及修正。根据规范化理论,对关系模式分解之后,就可以在理论上消除冗余和更新异常。但根据处理要求,可能还需要增加部分冗余以满足处理要求,这就需要做部分关系模式的处理,分解、合并或增加冗余属性,提高存储效率和处理效率。
 
       规范化
        关系数据库设计的方法之一就是设计满足适当范式的模式,通常可以通过判断分解后的模式达到几范式来评价模式规范化的程度。范式有:1NF、2NF、3NF、BCNF、4NF和5NF,其中1NF级别最低。这几种范式之间成立。
        通过分解,可以将一个低一级范式的关系模式转换成若干个高一级范式的关系模式,这种过程叫作规范化。下面将给出各个范式的定义。
               1NF(第一范式)
               【定义7.10】若关系模式R的每一个分量是不可再分的数据项,则关系模式R属于第一范式。记为R∈1NF。
               例如,供应者和它所提供的零件信息,关系模式FIRST和函数依赖集F如下:
               FIRST(Sno,Sname,Status,City,Pno,Qty)
               F={Sno→Sname,Sno→Status,Status→City,(Sno,Pno)→Qty}
               对具体的关系FIRST如下表所示。从下表中可以看出,每一个分量都是不可再分的数据项,所以是1NF的。但是,1NF存在4个问题:
               
               FIRST
               (1)冗余度大。例如每个供应者的Sno、Sname、Status、City要与其供应的零件的种类一样多。
               (2)引起修改操作的不一致性。例如供应者S1从“天津”搬到“上海”,若不注意,会使一些数据被修改,另一些数据未被修改,导致数据修改的不一致性。
               (3)插入异常。关系模式FRIST的主码为Sno、Pno,按照关系模式实体完整性规定主码不能取空值或部分取空值。这样,当某个供应者的某些信息未提供时(如Pno),则不能进行插入操作,这就是所谓的插入异常。
               (4)删除异常。若供应商S4的P2零件销售完了,并且以后不再销售P2零件,那么应删除该元组。这样,在基本关系FIRST找不到S4,可S4又是客观存在的。
               正因为上述4个原因,所以要对模式进行分解,并引入了2NF。
               2NF(第二范式)
               【定义7.11】若关系模式R∈1NF,且每一个非主属性完全依赖于码,则关系模式R∈2NF。
               换句话说,当1NF消除了非主属性对码的部分函数依赖,则称为2NF。
               例如,FIRST关系中的码是Sno、Pno,而Sno→Status,因此非主属性Status部分函数依赖于码,故非2NF的。
               若此时,将FIRST关系分解为:
               FIRST1(Sno,Sname,Status,City)∈ 2NF
               FIRST2(Sno,Pno,Qty)∈2NF
               因为分解后的关系模式FIRST1的码为Sno,非主属性Sname、Status、City完全依赖于码Sno,所以属于2NF;关系模式FIRST2的码为Sno、Pno,非主属性Qty完全依赖于码,所以也属于2NF。
               3NF(第三范式)
               【定义7.12】若关系模式R(U,F)中不存在这样的码X,属性组Y及非主属性使得X→Y,成立,则关系模式R∈3NF。
               即当2NF消除了非主属性对码的传递函数依赖,则称为3NF。
               例如,FIRST1?3NF,因为在分解后的关系模式FIRST1中有Sno→Status,Status→City,存在着非主属性City传递依赖于码Sno。若此时将FIRST1继续分解为:
               FIRST11(Sno,Sname,Status)∈ 3NF
               FIRST12(Status,City)∈3NF
               通过上述分解,数据库模式FIRST转换为FIRST11(Sno,Sname,Status)、FIRST12(Status,City)、FIRST2(Sno,Pno,Qty)三个子模式。由于这三个子模式都达到了3NF,因此称分解后的数据库模式达到了3NF。
               可以证明,3NF的模式必是2NF的模式。产生冗余和异常的两个重要原因是部分依赖和传递依赖。因为3NF模式中不存在非主属性对码的部分函数依赖和传递函数依赖,所以具有较好的性能。对于非3NF的1NF、2NF其性能弱,一般不宜作为数据库模式,通常要将它们变换成为3NF或更高级别的范式,这种变换过程称为“关系模式的规范化处理”。
               BCNF(Boyce Codd Normal Form,巴克斯范式)
               【定义7.13】关系模式R∈1NF,若X→Y且时,X必含有码,则关系模式R∈BCNF。
               也就是说,当3NF消除了主属性对码的部分函数依赖和传递函数依赖,则称为BCNF。
               结论:一个满足BCNF的关系模式,应有如下性质。
               (1)所有非主属性对每一个码都是完全函数依赖。
               (2)所有非主属性对每一个不包含它的码,也是完全函数依赖。
               (3)没有任何属性完全函数依赖于非码的任何一组属性。
               例如,设R(Pno,Pname,Mname)的属性分别表示零件号、零件名和厂商名,如果约定,每种零件号只有一个零件名,但不同的零件号可以有相同的零件名;每种零件可以有多个厂商生产,但每家厂商生产的零件应有不同的零件名。这样我们可以得到如下一组函数依赖:
               Pno→Pname,(Pname,Mname)→Pno
               由于该关系模式R中的候选码为(Pname,Mname)或(Pno,Mname),因而关系模式R的属性都是主属性,不存在非主属性对码的传递依赖,所以R是3NF的。但是,主属性Pname传递依赖于码(Pname,Mname),因此R不是BCNF的。当一种零件由多个生产厂家生产时,零件名与零件号间的联系将多次重复,带来冗余和操作异常现象。若将R分解成:
               R1(Pno,Pname)和R2(Pno,Mname)
               就可以解决上述问题,并且分解后的关系模式R1、R2都属于BCNF。
               4NF(第四范式)
               【定义7.14】关系模式R∈1NF,若对于R的每个非平凡多值依赖X→→Y且时,X必含有码,则关系模式R(U,F)∈4NF。
               4NF是限制关系模式的属性间不允许有非平凡且非函数依赖的多值依赖。
               注意:如果只考虑函数依赖,关系模式最高的规范化程度是BCNF;如果考虑多值依赖,关系模式最高的规范化程度是4NF。
               连接依赖5NF
               连接依赖:当关系模式无损分解为n个投影(n>2)会产生一些特殊的情况。下面考虑供应商数据库中SPJ关系的一个具体的值,如下图所示。
               
               关系SPJ是三个二元投影的连接
               第一次SP、PJ投影连接“”起来的结果比原始SPJ关系多了一个元组“S2,P1,J2”,即上图中带下画线的元组。第二次连接的结果去掉了多余的元组,从而恢复了原始的关系SPJ。在这种情况下,原始的SPJ关系是可3分解的。注意,无论我们选择哪两个投影作为第一次连接,结果都是一样的,尽管在每种情况下中间结果不同。
               SPJ的可3分解性是基本与时间无关的特性,是关系模式的所有合法值满足的特性,也就是说,这是关系模式满足一个特定的与时间无关的完整性约束。将这种约束简称为3D(3分解)约束。上述情况就是连接依赖要研究的问题。
               连接依赖:如果给定一个关系模式R,R1,R2,R3,…,Rn是R的分解,那么称R满足连接依赖JD*{R1,R2,R3,…,Rn},当且仅当R的任何可能出现的合法值都与它在R1,R2,R3,…,Rn上的投影等价。
               形式化地说,若R=R1∪R2∪…∪Rn,且,则称R满足连接依赖JD*{R1,R2,R3,…,Rn}。如果某个Ri,就是R本身,则连接依赖是平凡的。
               为了进一步理解连接依赖的概念,我们考虑银行数据库中的子模式:贷款(L-no,Bname,C-name,amount)。其中:
               .贷款号为L-no的贷款是由机构名为Bname贷出的。
               .贷款号为L-no的贷款是贷给客户名为C-name的客户。
               .贷款号为L-no的贷款的金额是amount。
               我们可以看到这是一个非常直观的逻辑蕴涵连接依赖:
               JD*((L-no,Bname),(L-no,C-name),(L-no,amount))
               这个例子说明了连接依赖很直观,符合数据库设计的原则。
               【定义7.15】一个关系模式R是第五范式(也称投影-连接范式PJNF),当且仅当R的每一个非平凡的连接依赖都被R的候选码所蕴涵,记作5NF。
               “被R的候选码所蕴涵”的含义可通过SPJ关系来理解。关系模式SPJ并不是5NF的,因为它满足一个特定连接依赖,即3D约束。这显然没有被其唯一的候选码(该候选码是所有属性的组合)所蕴涵。其区别是,关系模式SPJ并不是5NF,因为它是可被3分解的,可3分解并没有为其(Sno,Pno,Jno)候选码所蕴涵。但是将SPJ3分解后,由于3个投影SP、PJ、JS不包括任何(非平凡的)连接依赖,因此它们都是5NF的。
 
       数据操作
        (1)查询。
        在众多的SQL命令中,SELECT语句是使用最频繁的。SELECT语句主要是用来对数据库进行查询并返回符合用户查询标准的结果数据,一般的格式如下:
        
        SELECT语句中位于SELECT关键字之后的列名用来决定哪些列将作为查询结果返回。用户可以按照自己的需要选择任意列,还可以使用通配符“*”来设定返回表格中的所有列。SELECT语句中位于FROM关键字之后的表格名称用来决定将要进行查询操作的目标表格。SELECT语句中的WHERE子句用来规定哪些数据值或哪些行将被作为查询结果返回或显示。如果有GROUP子句则将结果按<列名1>的值进行分组,该属性值相等的元组作为一个组(通常会在每组中应用集函数),当GROUP子句带HAVING短语则只输出满足指定条件的组。如果有ORDER子句,则结果表还要按<列名2>的值升序或降序排列。
        ①单表查询。
        单表查询是只涉及一个表的查询。
        .选择表中的若干列
        例1:查询Student表中全体学生的姓名和年龄。
        
        .选择表中的若干元组
        例2:查询选修了课程的学生的学号。
        
        此时的查询结果有重复值,因为03131005和01132016两位学生都选了多门课,具有多条选课记录,所以若想取消重复的行,可以指定DISTINCT短语(没指定DISTINCT短语时,默认值为ALL):
        
        在WHERE条件从句中可以使用以下一些运算符来设定查询标准:比较(=,>,<,>=,<=,!=,<>,!>,!<;NOT+上述比较运算符=、确定范围(BETWEEN AND,NOT BETWEEN AND)、确定集合(IN,NOT IN)、字符匹配(LIKE,NOT LIKE)、空值(IS NULL,IS NOT NULL)、多重条件(AND,OR)。谓词IN可以用来查找属性属于指定集合的元组。
        LIKE运算符在WHERE条件从句中也非常重要,它的功能非常强大,通过使用LIKE运算符可以设定只选择与用户规定格式相同的记录。其一般的语法格式是:
        
        其含义是查找指定的属性列值与<匹配串>相匹配的元组。匹配串可以是一个完整的字符串,也可以含有通配符“%”(代表任何长度的字符串)和“_”(代表任意单个字符)。
        例3:查询所有姓张的学生的姓名和性别。
        
        此时满足条件的可以是三个字的名字或两个字的名字。若想限定在两个字的名字则使用‘张__’,限定在三个字的名字则使用‘张____’(注意:一个汉字要占两个字符的位置)。若要查询所有不姓张的学生的姓名和性别,则可以使用NOT LIKE谓词。此外,“%”和“_”可以同时使用,例如“_A%B”。若用户要查询的字符串本身含有“%”或“_”,则可以使用ESCAPE ‘<换码字符>’对通配符进行转义。
        .对查询结果进行排序
        若想对查询结果进行排序,则可以使用ORDER BY子句按照一个或多个属性列的升序(ASC)或降序(DESC)来对查询结果进行排序。注意,空值可以当作无穷大,在升序排列时最后显示,在降序排列时最先显示。
        例4:查询选修了6号课程的学生的学号和成绩,按分数高低排列结果。
        
        .使用集函数
        SQL提供的集函数有:
        
        其中,DISTINCT短语表示取消查询结果中的重复值,ALL (ALL为默认值)表示不取消重复值。
        例5:查询6号课程的平均成绩。
        
        .对查询结果分组
        GROUP BY子句表示将查询结果按某一列或多列的值进行分组,值相等的为一组。
        例6:查询选修了4门以上课程的学生的学号。
        
        本例中先用GROUP BY字句将元组按照Sno分组,相同学号的记录为一组(即一个学生的所有选课记录为一组),再用集函数COUNT对每组计数(即计算每个学生选课的门数)。HAVING短语指定选择组的条件,只有选课门数大于3的组才符合要求。
        注意,WHERE子句与HAVING短语的区别在于作用对象不同,WHERE子句作用于基本表或视图,从中选择符合条件的元组,而HAVING短语作用于组,从中选择符合条件的组。
        ②连接查询。
        前面所讲的查询都是针对一个表进行的,若一个查询同时涉及两个或两个以上的表,则称为连接查询。
        .等值与非等值连接查询
        连接查询中用来连接两个表的条件成为连接条件或连接谓词,一般形式为:
        
        比较运算符主要有:=、>、<、>=、<=、!=。
        此外,还可以使用如下的形式:
        
        连接运算符为“=”时,称为等值连接,其他情况称为非等值连接。连接谓词中的列名称为连接字段,连接条件中的连接字段类型必须是可比的(不必是相同的)。
        例7:查询每个学生的基本信息及其选课的情况。
        
        查询的结果为:
        
        可以看出,查询结果中有两列学号列,此时使用自然连接则可以将重复的属性列去掉。
        
        由于Sname, Ssex, Sage, Sdept, Cno和Grade属性列在Student表和SC表中是唯一的,所以引用时不用加上表名前缀,而Sno在两个表中都存在,所以需要加上表名前缀。
        .自身连接
        连接操作不仅是在两个表之间进行,也可以是一个表与自身进行连接。
        例8:查询每门课程的间接先修课。
        为Course表取两个表名ONE和TWO。
        
        结果为:
        
        .外连接
        先看一个例子。
        例9:查询每个学生的基本信息及其选课情况,对没有选课的同学只输出其基本信息。
        
        此时,为了实现对没有选课的同学只输出其基本信息,可以使用外连接,即在连接谓词的某一边加上“*”,符号“*”所在的表(本例中是SC表)就好像增加了一个“万能”的行(全部由空值组成),它可以与另一个表(本例中是Student表)中所有不满足连接条件的元组进行连接。
        .复合条件连接
        复合条件连接就是在WHERE子句里有多个连接条件。
        例10:查询每个学生学号、姓名、系名、选修的课程的名字、学分和成绩。
        
        ③集合查询。
        由于SELECT语句的查询结果是元组的集合,因此可以对多个SELECT语句的查询结果进行集合操作,包括并操作(UNION)、交操作(INTERSECT)和差操作(MINUS)。但标准SQL中没有直接提供集合交操作和集合差操作,这时可以用其他方法来实现。
        例11:查询选修了课程1或课程2的学生学号。
        
        (2)数据更新。
        SQL语句中的数据更新包括插入数据、修改数据和删除数据这三条语句。
        ①插入数据。
        .插入单个元组
        插入单个元组时,INSERT语句的格式为:
        
        实现将一个新的元组插入表名所指定的表中,新记录中属性列1的值为常量1,属性2的值为常量2,依此类推。在新记录中,INTO子句中没有出现的属性列取空值,但表的定义中指明NOT NULL的属性列不能取空值。若INTO子句中没有指定任何列名,则新记录在每个属性上都必须有值。
        例1:插入一条选课记录('02111008','6')。
        
        .插入子查询结果
        子查询不仅可以嵌套在SELECT语句中,还可以嵌套在INSERT语句中,将查询出来的批量数据插入到表中。
        插入子查询结果时,INSERT语句的格式为:
        
        例2:对每一个系,求学生的平均年龄,并把结果存入数据库。
        对于这道题,首先要在数据库中建立一个有两个属性列的新表,其中一列存放系名,另一列存放相应系的学生的平均年龄。
        
        然后对数据库的Student表按系分组求平均年龄,再把系名和平均年龄存入新表中。
        
        ②修改数据。
        修改操作语句的一般格式为:
        
        语句的功能是修改指定的表中满足WHERE子句条件的元组,SET子句给出<表达式>的值用于取代相应属性列原来的值,若省略了WHERE子句,则修改表中所有元组。
        例3:将所有学生的年龄加一岁。
        
        本例修改了表中多个元组的值。
        例4:将计算机系的学生所有成绩置零。
        
        本例中带有子查询。
        ③删除数据。
        删除语句的一般格式为:
        
        删除语句的功能是从指定的表中删除满足WHERE子句条件的所有元组,若省略WHERE子句,则删除表中的所有元组(但表的定义还在数据字典中),删除语句只删除表的数据,不删除表的定义。
        例5:删除所有计算机系学生的选课记录。
        
        本例是带子查询的删除语句。
        ④触发控制。
        触发器是一种特殊的存储过程,它通过事件触发而执行,可通过存储过程名来直接调用存储过程。触发器的主要特点是:①数据库程序员声明的事件(可以是插入、删除或修改)发生的时候,触发器被激活;②触发器被事件激活时,先测试触发条件,条件成立时,DBMS执行与该触发器相连的动作(该动作可以阻止事件发生,也可以撤销事件),条件不成立时,响应该事件的触发器什么都不做。
        数据库触发器有以下的作用:
        .可以基于数据库的值使用户具有操作数据库的某种权利。可以基于时间限制用户的操作,例如每学期开课以后不再允许学生选课。可以基于数据库中的数据限制用户的操作,例如某门课到达了选课人数上限后则不再允许学生选该门课程。
        .审计用户操作数据库的语句,把用户对数据库的更新写入审计表。
        .实现非标准的数据完整性检查和约束。触发器可产生比规则更为复杂的限制。与规则不同,触发器可以引用列或数据库对象。例如,触发器可回退任何企图吃进超过自己保证金的期货。提供可变的默认值。
        .实现复杂的非标准的数据库相关完整性规则。触发器可以对数据库中相关的表进行连环更新。例如,在修改或删除时,进行级联修改或删除其他表中的与之匹配的行。触发器还能够拒绝或回退那些破坏相关完整性的变化,取消试图进行数据更新的事务。
        .自动计算数据值,如果数据的值达到了一定的要求,则进行特定的处理。例如当公司的账号上的资金低于5万元则立即给财务人员发送警告数据。
   题号导航      2019年上半年 数据库系统工程师 上午试卷 综合知识   本试卷我的完整做题情况  
1 /
2 /
3 /
4 /
5 /
6 /
7 /
8 /
9 /
10 /
11 /
12 /
13 /
14 /
15 /
 
16 /
17 /
18 /
19 /
20 /
21 /
22 /
23 /
24 /
25 /
26 /
27 /
28 /
29 /
30 /
 
31 /
32 /
33 /
34 /
35 /
36 /
37 /
38 /
39 /
40 /
41 /
42 /
43 /
44 /
45 /
 
46 /
47 /
48 /
49 /
50 /
51 /
52 /
53 /
54 /
55 /
56 /
57 /
58 /
59 /
60 /
 
61 /
62 /
63 /
64 /
65 /
66 /
67 /
68 /
69 /
70 /
71 /
72 /
73 /
74 /
75 /
 
第61题    在手机中做本题