在分布式数据库中，关系的存储采用分片和复制技术，存储在不同的站点上。用户无需知道..

免费智能真题库 > 历年试卷 > 数据库系统工程师 > 2013年上半年数据库系统工程师上午试卷综合知识

第60题

知识点：分布式事务分布透明性事务消息分片恢复数据操作数据存储数据库

关键词：分布式数据库故障恢复消息协调器协议故障数据数据库章/节：数据库主流应用技术

在分布式数据库中，关系的存储采用分片和复制技术，存储在不同的站点上。用户无需知道所用的数据存储在哪个站点上，称为（60）。分布式事务的执行可能会涉及到多个站点上的数据操作，在2PC协议中，当事务Ti完成执行时，事务Ti的发起者协调器Ci向所有参与Ti的执行站点发送＜prepare Ti＞的消息，当收到所有执行站点返回＜ready Ti＞消息后，Ci再向所有执行站点发送＜commit Ti＞消息。若参与事务Ti执行的某个站点故障恢复后日志中有＜ready Ti＞记录，而没有＜commit Ti＞记录，则（61）。

A. 分片透明

B. 复制透明

C. 位置透明

D. 异构式分布

相关试题：分布式数据库的体系结构

更多>

第68题 2018年上半年

40%

（）不是分布式数据库管理系统应该遵循的准则。

第62题 2014年上半年

50%

分布式数据库系统除了包含集中式数据库系统的模式结构之外,还增加了几个模式级别，其中（）定义分布式数据库中数据的整体逻辑结构..

第62题 2016年上半年

67%

全局概念层是分布式数据库的整体抽象，包含了系统中全部数据的特性和逻辑结构，从其分布透明特性来说，包含的三种模式描述信息中..


知识点讲解
· 分布式事务 · 分布透明性 · 事务 · 消息 · 分片 · 恢复 · 数据操作 · 数据存储 · 数据库

分布式事务

一个事务是访问数据库的一个逻辑工作单位，它是一个操作序列，执行这个操作序列，使数据库从一种一致状态转换到另一种一致状态，以实现特定的业务功能。

分布式事务是传统事务的扩充，在分布式数据库系统中，任何一个应用的请求最终都将转化成对数据库的存取操作序列，所以分布式事务从外部特征来看，继承了传统事务的定义。但是，在分布式数据库系统中，数据是分布的，一个事务的执行可能涉及多个站点上的数据，这使得分布式事务的执行方式与传统事务的执行方式不同，传统集中式事务只在一台计算机上执行，而分布式事务将在多个站点上的多台计算机上执行，即分布式事务的执行也是分布的。

在分布式数据库系统中，用分布式事务表明一个要求访问多个站点上数据库中数据的事务，但不关心存放数据的具体地点。分布式数据库管理系统的事务优化器实现把一个分布式事务转变为若干个与相应站点有关的操作序列，这些操作序列也称为“子事务”。所以，在分布式数据库系统中，可以把一个分布式事务看成是由若干个不同站点上的子事务组成。

分布透明性

在分布式数据库中，数据独立性是十分重要的，其内容比集中式数据库更加复杂。除了数据的逻辑独立性与数据的物理独立性外，还有数据的分布独立性。所谓数据分布独立性是指用户或用户程序使用分布式数据库如同使用集中式数据库那样，不必关心全局数据的分布情况，即用户不必关心全局数据的逻辑分片情况、逻辑片段的场地位置分配情况以及各场地上数据库的数据模型等。也就是说，全局数据的逻辑分片、片段的物理位置分配、各场地数据库的数据模型等情况对用户和应用程序是透明的。所以，在分布式数据库中分布独立性也称为分布透明性。下面我们来看看分布透明性的各种级别：

分片透明性

分片透明性是分布透明性中的最高层，在四层分布式数据库模式结构中，分片透明性位于全局概念模式与分片模式之间。当分布式数据库具有分片透明性时，用户编写的应用程序只对全局关系进行操作，而不必考虑数据的逻辑分片，当分片模式改变时，只要改变全局概念模式到分片模式之间的映像，从而不会影响应用程序，实现了数据分片透明性。

分配透明性

分配透明性也称位置透明性，是分布透明性的中间层，在四层的分布式数据库模式结构中，位于分片模式与分配模式之间。实际上，分配透明性包含了两种情形：一种是各片段被复制的情况，即每一片段是否被复制、复制了几个副本；另一种是片段及其各副本的场地的位置分配情况。前者也称复制透明性或数据冗余透明性。当分布式数据库具有分配透明性时，用户编写的应用程序要了解全局数据的数据分片情况，但不必了解各逻辑片段的复制副本情况，也不必关心各片段及其副本的站点位置分配情况。当片段及其副本的存储站点改变时，只要改变从分片模式到分配模式之间的映像，从而不会影响用户程序，实现了数据片段的位置透明性。

局部数据模型透明性

局部数据模型透明性也称局部映像透明性，即与各场地上数据库的数据模型无关，是分布透明性的最低层，在四层分布式数据库模式结构图中，处于分配模式与局部概念模式之间。当分布式数据库只具有局部数据模型透明性时，用户编写应用程序不但要了解全局数据的逻辑分片情况，还要了解各逻辑片段的副本复制情况，以及各片段和它们副本的站点位置分配情况，但不必了解各站点上数据库的数据模型。全局数据模型与每个节点上的局部数据库的数据模型的转换是由分配模式与局部概念模式之间的映像实现的。当某个节点上数据库的数据模型改变时，只要改变分配模式到该站点局部概念模式之间的映像即可，应用程序不受影响，从而实现了局部数据模型透明性。显然，在同构分布式数据库系统中，其各站点上的数据模型相同，且有可能全局数据库的数据模型就采用局部数据库的数据模型，此时，就大大减少这种映像的复杂性。

如果一个分布式数据库系统提供分片透明性，它一定也提供了分配透明性和局部数据模型透明性，所以也称为完全分布透明性，是分布透明性的最高级别。此时，对用户和用户程序而言，他们所面对的分布式数据库系统，如同集中式数据库一样，不必考虑数据的分片细节，不必考虑各片段的副本情况，不必考虑片段及副本的分配细节，也无需考虑各站点上数据库是什么数据模型等。

如果一个分布式数据库系统提供分配透明性，而没有提供分片透明性，它一定也提供局部数据模型透明性，所以也称为中级分布透明性。此时，对用户和应用程序而言，他们必须知道分布式数据库全局数据的逻辑分片情况，在程序中必须指出所需要访问的逻辑片段名。但不必关心逻辑片段是否被复制以及它们被分配在哪些站点上，也不必考虑站点的数据模型。

如果一个分布式数据库系统只提供局部数据模型透明性而不提供分片透明性，也不提供分配透明性，则被称为低级分布透明性。此时，对用户和应用程序而言，他们不但必须知道分布式数据库全局数据的逻辑分片情况，还必须知道各片段是否有副本、有多少副本、各片段及其副本被分配在哪些站点上。即在程序中要指定要访问的数据逻辑片段名，因此，要指定它们所在的节点名。但不必考虑站点上的数据模型。

如果一个分布式数据库系统，连局部数据模型透明性也不提供，即将异构数据模型转换也交给用户和用户程序自己处理，这种分布式数据库系统称为无分布透明性。

由此可见，一个分布式数据库系统可能提供的分布透明性的层次越高，用户编写应用程序越容易。因此，一个分布式数据库系统可能提供的分布透明性的程度，也是衡量分布式数据库管理系统是否完善的标准之一。

事务

概述

事务（Transaction）是一系列的数据库操作，是数据库应用程序的基本逻辑单位，即应用程序对数据库的操作都应该以事务的方式进行。

事务是一个操作序列，这些操作“要么都做，要么都不做”，是数据库环境中不可分割的逻辑工作单位。事务和程序是两个不同的概念，一般一个程序可包含多个事务。

事务通常由数据库操纵语言或其他高级语言（如SQL、CoBOL、C、C++、Java等）书写的用户程序来实现。一个事务由应用程序的一组操作序列组成，它以BEGIN TRANSACTION语句开始，以END TRANSACTION结束语句。

事务定义的语句如下：

（1）BEGIN TRANSACTION：事务开始。

（2）END TRANSACTION：事务结束。

（3）COMMIT：事务提交。该操作表示事务成功地结束，它将通知事务管理器该事务的所有更新操作现在可以被提交或永久地保留。

（4）ROLLBACK：事务回滚。该操作表示事务非成功地结束，它将通知事务管理器出故障了，数据库可能处于不一致状态，该事务的所有更新操作必须回滚或撤销。

典型的例子是银行转账业务。对“从账户A转入账户B金额x元”业务，站在顾客角度来看，转账是一次单独操作；而站在数据库系统的角度它至少是由两个操作组成的，第一步从账户A减去x元，第二步给账户B加上x元。下面是银行转账事务的伪代码：

SQL中事务的开始与结束

SQL标准规定当一条SQL语句被执行，就隐式地开始了一个事务，SQL中的Commit work和Rollback work语句之一会结束一个事务。

（1）Commit work：提交当前事务。这意味着将该事务所做的更新在数据库中永久保存。一旦事务被提交后，一个新的事务自动开始。

（2）Rollback work：回滚当前事务。这意味着将撤销该事务对数据库的更新。这样，数据库恢复到该事务执行第一条语句之前的状态。

需要注意的是，若事务已执行了Commit work，就不能用Rollback work来撤销。数据库系统能保证在发生诸如某条SQL语句错误、断电、系统崩溃的情况下，若事务还没有执行Commit work，则所造成的影响将被回滚。对断电、系统崩溃的情况，回滚是在系统重新启动时进行。

消息

对象之间进行通信的一种构造叫作消息。当一个消息发送给某个对象时，包含要求接收对象去执行某些活动的信息。接收到信息的对象经过解释，然后予以响应。这种通信机制叫作消息传递。发送消息的对象不需要知道接收消息的对象如何对请求予以响应。

分片

IP协议采用的是遇到MTU更小的网络时再分片。

恢复

数据恢复有3个步骤。

（1）反向扫描文件日志，查找该事务的更新操作。

（2）对事务的更新操作执行逆操作。

（3）继续反向扫描日志文件，查找该事务的其他更新操作，并做同样的处理，直到事务的开始标志。

数据操作

（1）查询。

在众多的SQL命令中，SELECT语句是使用最频繁的。SELECT语句主要是用来对数据库进行查询并返回符合用户查询标准的结果数据，一般的格式如下：

SELECT语句中位于SELECT关键字之后的列名用来决定哪些列将作为查询结果返回。用户可以按照自己的需要选择任意列，还可以使用通配符“*”来设定返回表格中的所有列。SELECT语句中位于FROM关键字之后的表格名称用来决定将要进行查询操作的目标表格。SELECT语句中的WHERE子句用来规定哪些数据值或哪些行将被作为查询结果返回或显示。如果有GROUP子句则将结果按<列名1>的值进行分组，该属性值相等的元组作为一个组（通常会在每组中应用集函数），当GROUP子句带HAVING短语则只输出满足指定条件的组。如果有ORDER子句，则结果表还要按<列名2>的值升序或降序排列。

①单表查询。

单表查询是只涉及一个表的查询。

.选择表中的若干列

例1：查询Student表中全体学生的姓名和年龄。

.选择表中的若干元组

例2：查询选修了课程的学生的学号。

此时的查询结果有重复值，因为03131005和01132016两位学生都选了多门课，具有多条选课记录，所以若想取消重复的行，可以指定DISTINCT短语（没指定DISTINCT短语时，默认值为ALL）：

在WHERE条件从句中可以使用以下一些运算符来设定查询标准：比较（=，>，<，>=，<=，!=，<>，！>，！<；NOT+上述比较运算符=、确定范围（BETWEEN AND，NOT BETWEEN AND）、确定集合（IN，NOT IN）、字符匹配（LIKE，NOT LIKE）、空值（IS NULL，IS NOT NULL）、多重条件（AND，OR）。谓词IN可以用来查找属性属于指定集合的元组。

LIKE运算符在WHERE条件从句中也非常重要，它的功能非常强大，通过使用LIKE运算符可以设定只选择与用户规定格式相同的记录。其一般的语法格式是：

其含义是查找指定的属性列值与<匹配串>相匹配的元组。匹配串可以是一个完整的字符串，也可以含有通配符“%”（代表任何长度的字符串）和“_”（代表任意单个字符）。

例3：查询所有姓张的学生的姓名和性别。

此时满足条件的可以是三个字的名字或两个字的名字。若想限定在两个字的名字则使用‘张__’，限定在三个字的名字则使用‘张____’（注意：一个汉字要占两个字符的位置）。若要查询所有不姓张的学生的姓名和性别，则可以使用NOT LIKE谓词。此外，“%”和“_”可以同时使用，例如“_A%B”。若用户要查询的字符串本身含有“%”或“_”，则可以使用ESCAPE ‘<换码字符>’对通配符进行转义。

.对查询结果进行排序

若想对查询结果进行排序，则可以使用ORDER BY子句按照一个或多个属性列的升序（ASC）或降序（DESC）来对查询结果进行排序。注意，空值可以当作无穷大，在升序排列时最后显示，在降序排列时最先显示。

例4：查询选修了6号课程的学生的学号和成绩，按分数高低排列结果。

.使用集函数

SQL提供的集函数有：

其中，DISTINCT短语表示取消查询结果中的重复值，ALL （ALL为默认值）表示不取消重复值。

例5：查询6号课程的平均成绩。

.对查询结果分组

GROUP BY子句表示将查询结果按某一列或多列的值进行分组，值相等的为一组。

例6：查询选修了4门以上课程的学生的学号。

本例中先用GROUP BY字句将元组按照Sno分组，相同学号的记录为一组（即一个学生的所有选课记录为一组），再用集函数COUNT对每组计数（即计算每个学生选课的门数）。HAVING短语指定选择组的条件，只有选课门数大于3的组才符合要求。

注意，WHERE子句与HAVING短语的区别在于作用对象不同，WHERE子句作用于基本表或视图，从中选择符合条件的元组，而HAVING短语作用于组，从中选择符合条件的组。

②连接查询。

前面所讲的查询都是针对一个表进行的，若一个查询同时涉及两个或两个以上的表，则称为连接查询。

.等值与非等值连接查询

连接查询中用来连接两个表的条件成为连接条件或连接谓词，一般形式为：

比较运算符主要有：=、>、<、>=、<=、！=。

此外，还可以使用如下的形式：

连接运算符为“=”时，称为等值连接，其他情况称为非等值连接。连接谓词中的列名称为连接字段，连接条件中的连接字段类型必须是可比的（不必是相同的）。

例7：查询每个学生的基本信息及其选课的情况。

查询的结果为：

可以看出，查询结果中有两列学号列，此时使用自然连接则可以将重复的属性列去掉。

由于Sname, Ssex, Sage, Sdept, Cno和Grade属性列在Student表和SC表中是唯一的，所以引用时不用加上表名前缀，而Sno在两个表中都存在，所以需要加上表名前缀。

.自身连接

连接操作不仅是在两个表之间进行，也可以是一个表与自身进行连接。

例8：查询每门课程的间接先修课。

为Course表取两个表名ONE和TWO。

结果为：

.外连接

先看一个例子。

例9：查询每个学生的基本信息及其选课情况，对没有选课的同学只输出其基本信息。

此时，为了实现对没有选课的同学只输出其基本信息，可以使用外连接，即在连接谓词的某一边加上“*”，符号“*”所在的表（本例中是SC表）就好像增加了一个“万能”的行（全部由空值组成），它可以与另一个表（本例中是Student表）中所有不满足连接条件的元组进行连接。

.复合条件连接

复合条件连接就是在WHERE子句里有多个连接条件。

例10：查询每个学生学号、姓名、系名、选修的课程的名字、学分和成绩。

③集合查询。

由于SELECT语句的查询结果是元组的集合，因此可以对多个SELECT语句的查询结果进行集合操作，包括并操作（UNION）、交操作（INTERSECT）和差操作（MINUS）。但标准SQL中没有直接提供集合交操作和集合差操作，这时可以用其他方法来实现。

例11：查询选修了课程1或课程2的学生学号。

（2）数据更新。

SQL语句中的数据更新包括插入数据、修改数据和删除数据这三条语句。

①插入数据。

.插入单个元组

插入单个元组时，INSERT语句的格式为：

实现将一个新的元组插入表名所指定的表中，新记录中属性列1的值为常量1，属性2的值为常量2,依此类推。在新记录中，INTO子句中没有出现的属性列取空值，但表的定义中指明NOT NULL的属性列不能取空值。若INTO子句中没有指定任何列名，则新记录在每个属性上都必须有值。

例1：插入一条选课记录（'02111008'，'6'）。

.插入子查询结果

子查询不仅可以嵌套在SELECT语句中，还可以嵌套在INSERT语句中，将查询出来的批量数据插入到表中。

插入子查询结果时，INSERT语句的格式为：

例2：对每一个系，求学生的平均年龄，并把结果存入数据库。

对于这道题，首先要在数据库中建立一个有两个属性列的新表，其中一列存放系名，另一列存放相应系的学生的平均年龄。

然后对数据库的Student表按系分组求平均年龄，再把系名和平均年龄存入新表中。

②修改数据。

修改操作语句的一般格式为：

语句的功能是修改指定的表中满足WHERE子句条件的元组，SET子句给出<表达式>的值用于取代相应属性列原来的值，若省略了WHERE子句，则修改表中所有元组。

例3：将所有学生的年龄加一岁。

本例修改了表中多个元组的值。

例4：将计算机系的学生所有成绩置零。

本例中带有子查询。

③删除数据。

删除语句的一般格式为：

删除语句的功能是从指定的表中删除满足WHERE子句条件的所有元组，若省略WHERE子句，则删除表中的所有元组（但表的定义还在数据字典中），删除语句只删除表的数据，不删除表的定义。

例5：删除所有计算机系学生的选课记录。

本例是带子查询的删除语句。

④触发控制。

触发器是一种特殊的存储过程，它通过事件触发而执行，可通过存储过程名来直接调用存储过程。触发器的主要特点是：①数据库程序员声明的事件（可以是插入、删除或修改）发生的时候，触发器被激活；②触发器被事件激活时，先测试触发条件，条件成立时，DBMS执行与该触发器相连的动作（该动作可以阻止事件发生，也可以撤销事件），条件不成立时，响应该事件的触发器什么都不做。

数据库触发器有以下的作用：

.可以基于数据库的值使用户具有操作数据库的某种权利。可以基于时间限制用户的操作，例如每学期开课以后不再允许学生选课。可以基于数据库中的数据限制用户的操作，例如某门课到达了选课人数上限后则不再允许学生选该门课程。

.审计用户操作数据库的语句，把用户对数据库的更新写入审计表。

.实现非标准的数据完整性检查和约束。触发器可产生比规则更为复杂的限制。与规则不同，触发器可以引用列或数据库对象。例如，触发器可回退任何企图吃进超过自己保证金的期货。提供可变的默认值。

.实现复杂的非标准的数据库相关完整性规则。触发器可以对数据库中相关的表进行连环更新。例如，在修改或删除时，进行级联修改或删除其他表中的与之匹配的行。触发器还能够拒绝或回退那些破坏相关完整性的变化，取消试图进行数据更新的事务。

.自动计算数据值，如果数据的值达到了一定的要求，则进行特定的处理。例如当公司的账号上的资金低于5万元则立即给财务人员发送警告数据。

数据存储

数据存储用来表示存储数据。通常，一个流入加工的数据流经过加工处理后就消失了，而它的某些数据（或全部数据）可能被加工成输出数据流，流向其他加工或外部实体。除此之外，在软件系统中还常常要把某些信息保存下来以供以后使用，这时可以使用数据存储。每个数据存储都有一个定义明确的名字标识。可以有数据流流入数据存储，表示数据的写入操作；也可以有数据流从数据存储流出，表示数据的读操作；还可以用双向箭头的数据流指向数据存储，表示对数据的修改。

数据库

数据库（DataBase，DB）是指长期存储在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储，具有较小的冗余度、较高的数据独立性和易扩展性，并可为各种用户共享。

系统使用的所有数据存储在一个或几个数据库中。

题号导航 2013年上半年数据库系统工程师上午试卷综合知识

本试卷我的完整做题情况



	第60题在手机中做本题