免费智能真题库 > 历年试卷 > 系统集成项目管理工程师 > 2019年下半年 系统集成项目管理工程师 上午试卷 综合知识
第14题      
知识点   数据库   数据库管理系统   数据库管理   库管理
关键词   关系型数据库   数据库管理系统   管理系统   数据   数据库      分类   典型应用集成技术       

 
常见的数据库管理系统中,( )是非关系型数据库
 
 
  A.  Oracle
 
  B.  MySQL
 
  C.  SQL Server
 
  D.  MongoDB
 
 
 

 
  第29题    2009年下半年  
   63%
以下(29)是SOA概念的一种实现。
  第69题    2009年上半年  
   61%
Web Service 的各种核心技术包括 XML、Namespace、XML Schema、SOAP、WSDL、UDDI、WS-Inspection、WS-Security、WS-Routing 等,..
  第22题    2018年上半年  
   43%
在大数据关键技术中,Hadoop的分布式文件系统HDFS属于大数据( )。
 


   知识点讲解    
   · 数据库    · 数据库管理系统    · 数据库管理    · 库管理
 
       数据库
        数据库(DataBase,DB)是指长期存储在计算机内的、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述和存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
        系统使用的所有数据存储在一个或几个数据库中。
 
       数据库管理系统
               数据库管理系统概述
                      DBMS的目标
                      从计算机软件系统的构成来看,DBMS是介于用户和操作系统之间的一组软件,它实现对共享数据的有效组织、管理和存取。由于DBMS实现的硬件资源和软件环境不同,所以DBMS的功能和性能就会有差异。但所有的DBMS都应该尽量满足以下系统目标:用户界面友好、功能完备、效率高、结构清晰和开放性。
                      DBMS的基本功能和特征
                      围绕数据,DBMS应有如下几方面的基本功能:
                      (1)数据库定义:数据库定义包括对数据库的结构进行描述(包括外模式、模式、内模式的定义)、数据库完整性的定义、安全保密定义(例如用户密码、级别、存取权限)、存取路径(如索引)的定义,这些定义存储在数据字典中,是DBMS运行的基本依据。
                      (2)数据存取:提供用户对数据的操作功能,如对数据库数据的检索、插入、修改和删除,这部分内容已经在前面讲述过。
                      (3)数据库运行管理:数据库运行管理是指DBMS运行控制和管理功能。包括了多用户环境下的事务管理和自动恢复、并发控制和死锁检测(或死锁防止)、安全性检查和存取控制、完整性检查和执行、运行日志的组织管理等。这些功能可以保证数据库系统的正常运行,将在后面的小节里讲述。
                      (4)数据组织、存储和管理:DBMS要分类组织、存储和管理各种数据,包括数据字典、用户数据、存取路径等。要确定以何种文件结构和存取方式在存储级上组织这些数据,如何实现数据之间的联系,其基本目标是提高存储空间利用率和方便存取,提供多种存取方法(如索引查找、HASH查找、顺序查找等)提高存取效率。
                      (5)数据库的建立和维护:包括数据库的初始建立、数据的转换、数据库的转储和恢复、数据库的重组织和重构造以及性能监测分析等功能。
                      (6)其他功能:包括DBMS与网络中其他软件系统的通信功能。
                      几种常用Web数据库
                      在Web服务器中,信息以文本或图像文件的形式进行存储,单纯的www查询速度慢,检索机制弱,而专用的数据库系统能够对大批量数据进行有序的、有规则的组织与管理,给出查询条件后很快就能得到查询结果,所以要将Web技术与数据库技术有机结合。Web数据库利用浏览器作为用户输入接口来输入所需要的数据,浏览器将这些数据传送给网站,网站再对数据进行处理(例如,将数据写入后台数据库,或者查询后台数据库),然后网站将操作结果传回给浏览器。网站的后台数据库就是Web数据库。通过Web访问数据库的优点是:借用现成的浏览器软件,无需开发数据库前端;标准统一,开发过程简单;交叉平台支持。
                      Web数据库的环境由硬件元素和软件元素组成。硬件元素包括:Web服务器、客户机、数据库服务器、通信网络(Internet)。软件元素包括:①客户端必须有能够解释执行HTML代码的浏览器(例如IE,Netscape等);②Web服务器中必须具有能自动生成HTML代码的程序(例如ASP,CGI等);③具有能自动完成数据操作指令的数据库系统(例如Access,SQL Server等)。
                      常见的Web数据库产品有:Microsoft SQL Server、 Oracle Universal Server、 Informix Universal Server和IBM DB2通用数据库。下面介绍其中的几种:
                      SQL Server开发不同类型的应用程序,其中包括:分布式数据库应用程序、数据仓库、Internet和Intranet应用、管理工具、SQL Server数据库系统。SQL Server的优点是:管理方便、并发控制能力强、编程接口丰富、伸缩性强、充分利用BackOffice资源、多线程体系结构。
                      Oracle Universal Server的优点是:①支持任何的数据类型;②支持广泛的平台;③支持广泛的网络协议;④稳固及可靠的资料存储与管理;⑤支持大量的数据存取;⑥内建Web服务器。
                      使用IBM的DB2的Universal Database所建立的基于www的数据库具有以下特性:①支持多种平台;②支持多CPU以及并行处理;③支持多媒体类型的数据;④使用DB2的连接,DB2UniversalDatabase可以作为Web和网站后台服务器的网关,然后在www网上传送数据;⑤支持JAVA以及JDBC,因此可以在Web与数据库之间,提供安全的资料传输,而不怕被别人利用网络监控程序窃取资料。
               数据库系统的控制功能
               数据库恢复技术和并发控制都是事务处理技术,所以在这里首先介绍一下事务的概念。事务是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位,是数据库应用程序的基本逻辑单元。例如,在关系数据库中,一个事务可以是一条SQL语句、一组SQL语句或整个程序,但事务和程序是两个概念,一般来说,一个程序中可以包括多个事务。事务的开始和结束可以由用户显式控制或由DBMS按默认规定自动划分事务。
               在SQL语言中,事务通常以BEGIN TRANSACTION开始,以COMMIT或ROLLBACK结束。COMMIT表示提交,即提交事务的所有操作,将事务中所有对数据库的更新写回到磁盘上的物理数据库中,事务正常结束。ROLLBACK表示回滚,即在事务运行的过程中发生了某种故障,事务不能继续执行下去,系统将事务中对数据库的所有已完成的操作全部撤销,滚回到事务开始时的状态。
               事务具有四个特性:原子性(atomicity)、一致性(consistency)、隔离性(isolation)、持续性(durability),这四个特性简称ACID特性。原子性是指事务是数据库的逻辑工作单位,事务中的所有操作要么都做要么都不做。事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态,当数据库只包含成功事务提交的结果时,就说数据库处于一致性状态。如果数据库系统运行中发生了故障,有些尚未完成的事务被迫中断,若这些未完成事务对数据库所做的修改有一部分已经写入物理数据库,则这时数据库就处于一种不一致的状态。隔离性是指一个事务的执行不能被其他事务干扰,即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。持续性也称永久性,指一个事务一旦提交,它对数据库中的改变就应该是永久性的,接下来的其他操作或者故障不应该对其执行结果产生任何影响。
                      数据库恢复技术
                      尽管数据库系统采取了各种保护措施来防止数据库的安全性和完整性被破坏,保证并发事务正确执行,但计算机系统的硬件故障、软件错误、操作员失误和恶意破坏等仍然不可避免,所以数据库管理系统还必须具有把数据库从错误状态恢复到某一已知的正确状态的功能,这就是数据库的恢复。
                      数据库系统中可能发生的故障可以大致分为如下几类:事物内部的故障、系统故障、介质故障和计算机病毒。
                      (1)恢复的实现技术。
                      恢复机制涉及两个关键问题:如何建立冗余数据;如何利用冗余数据实施数据库的恢复。建立冗余数据最常用的技术是数据转储和登录日志文件。
                      转储即DBA定期将整个数据库复制到磁带或另一个磁盘上保存起来的过程,这些备用的数据文本称为后备副本或后援副本。当数据库遭到破坏时,将后备副本装入,将系统恢复到转储时的状态,若要恢复到故障发生时的状态则需要重新运行转储后的所有更新事务。
                      日志文件是用来记录事务对数据库的更新操作的文件,有两种格式供数据库系统采用:以记录为单位的日志文件和以数据块为单位的日志文件。以记录为单位的日志文件包括各个事务的开始标记、结束标记和所有更新操作,每个日志记录的内容主要包括事务标识、操作的类型、操作对象、更新前数据的旧值和更新后数据的新值。以数据块为单位的日志文件记录的内容包括事务标识和被更新的数据块,由于已将更新前的整个块和更新后的整个块都放入日志文件中,所以操作的类型和操作对象等信息就不用放入日志记录中了。登记日志文件时必须严格按照并发事务执行的时间次序来登记,且要先写日志文件后写数据库。
                      在一个数据库系统中,数据转储和登录日志文件这两种方法是一起使用的。
                      (2)恢复策略。
                      当系统运行过程中发生故障,利用数据库后备副本和日志文件可以将数据库恢复到故障前的某个一致性状态。不同故障的恢复方法也不同。
                      ①事务故障的恢复。
                      事务故障是指事务在运行至正常终点前被终止,此时数据库可能出于不正确的状态,恢复程序要在不影响其他事务运行的情况下强行回滚(ROLLBACK)改事务,即撤销该事务已经做出的任何对数据库的修改,使得事务好像完全没有启动一样。事务故障的恢复由系统自动完成。恢复的步骤是:
                      .反向(从后向前)扫描日志文件,查找该事务的更新操作。
                      .对该事务的更新操作执行逆操作,也就是将日志记录更新前的值写入数据库。如果记录中是插入操作,则相当于作删除操作,如果记录中是删除操作则做插入操作,若是修改操作则相当于用修改前的值代替修改后的值。
                      .继续反向扫描日志文件,查找该事务的其他更新操作,并作同样处理。
                      .如此处理下去,直到读到了此事务的开始标记,事务故障恢复就完成了。
                      ②系统故障的恢复。
                      系统故障是指造成系统停止运转的任何事件,使得系统要重新启动。例如,特定类型的硬件错误、操作系统故障、DBMS代码错误、突然停电等。这类故障影响正在运行的所有事务,但不破坏数据库。此时主存内容(尤其是缓冲区中的内容)都被丢失,所有运行事务都非正常终止,有些已完成的事务可能有部分甚至全部留在缓冲区中尚未写入磁盘,为了保证一致性,应将这些事务已提交的结果重新写入数据库;此外,一些尚未完成的事务结果可能已经送入物理数据库,为了保证一致性,需要清除这些事务对数据库的所有修改。系统故障的恢复是由系统在重新启动时自动完成的,此时恢复子系统撤销所有未完成的事务并重做(redo)所有已提交的事务。具体的步骤是:
                      .正向(从头到尾)扫描日志文件,找出故障发生前已经提交的事务(这些事务既有BEGIN TRANSACTION记录,也有COMMIT记录),将其事务标识记入重做(REDO)队列。同时找出故障发生时尚未完成的事务(这些事务只有BEGIN TRANSACTION记录,无相应的COMMIT记录),将其事务标识记入撤销(UNDO)队列。
                      .反向扫描日志文件,对每个UNDO事务的更新操作执行逆操作,也就是将日志记录中更新前的值写入数据库。
                      .正向扫描日志文件,对每个REDO事务重新执行日志文件登记的操作,也就是将日志记录中更新后的值写入数据库。
                      ③介质故障的恢复。
                      系统故障常称为软故障,介质故障称为硬故障。硬故障是指外存故障,例如磁盘损坏、磁头碰撞,瞬时强磁场干扰等。这类故障将破坏数据库或部分数据库,并影响正在存取这部分数据的所有事务,日志文件也被破坏。这类故障比前两类故障发生的可能性要小,但是破坏性最大。恢复方法是重装数据库,然后重做已完成的事务,具体的步骤是:
                      .装入最新的数据库后备副本,使数据库恢复到最近一次转储时的一致性状态。
                      .装入相应的日志文件副本,重做已完成的事务。
                      介质故障的恢复需要DBA的介入,DBA只需重装最近转储的数据库副本和有关的各日志文件副本,然后执行系统提供的恢复命令,具体的恢复操作仍由DBMS完成。
                      并发控制
                      数据库是一个共享资源,可供多个用户使用,允许多个用户同时使用的数据库系统称为多用户数据库系统。在单处理机系统中,事务的并行执行实际上是这些并行事务的并行操作轮流交叉运行;在多处理机系统中,每个处理机可以运行一个事务,多个处理机可以同时运行多个事务,实现多个事务真正的并行运行。本节讨论的是以单处理机系统为基础的,这些理论可以推广到多处理机的情况。
                      当多个用户并发地存取数据库时就会产生多个事务同时存取同一数据的情况,若并发操作不加控制,就可能会存取和存储不正确的数据,破坏数据库的一致性。并发操作带来的数据不一致性包括三类:丢失修改、不可重复读和读“脏”数据。丢失修改是指两个事务T1和T2读入同一数据并修改,T2提交的结果破坏了T1提交的结果,导致T1的修改被丢失。不可重复读是指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果,具体来讲还包括三种情况:①事务T1读取某一数据后,事务T2对其做了修改,当事务T1再次读该数据时得到与前一次不同的值;②事务T1按一定条件从数据库中读取了某些数据记录后,事务T2删除了其中部分记录,当T1再次按相同的条件读取数据时发现某些记录已经消失了;③事务T1按一定条件从数据库中读取某些数据记录后,事务T2插入了一些记录,当T1再次按照相同条件读取数据时发现多了一些记录。读“脏”数据是指事务T1修改某一数据并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,即T2读到了“脏”数据。
                      (1)封锁。
                      并发控制的主要技术是封锁,所谓封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求对其加锁,加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其他事务不能更新此数据对象。
                      基本的封锁类型有两种:排它锁(简称X锁)和共享锁(简称S锁)。排它锁又称写锁,若事务T对数据对象A加上X锁,则只允许T读取和修改A,其他任何事务都不能再对A加任何类型的锁,直到T释放A上的锁,这就保证了其他事务在T释放A上的锁之前就不能再读取和修改A。共享锁又称读锁,若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其他事务只能在对A加S锁,而不能加X锁,直到T释放A上的S锁,这就保证了其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改。
                      (2)封锁协议。
                      运用X锁和S锁这两种基本封锁时,还需要约定一些规则(例如何时申请X锁或者S锁、持锁时间、何时释放等),这些规则称为封锁协议。下面介绍的封锁协议对封锁方式规定不同的封锁规则,在不同程度上解决了对并发操作的不正确调度所带来的问题。
                      一级封锁协议是:事务T在修改数据R之前必须先对其加上X锁,直到事务结束(包括正常结束和非正常结束)时才释放。一级封锁协议可防止丢失修改,并保证事务T是可恢复的。在这一级的封锁协议中,如果仅仅是读数据而不对其修改的话,是不需要加锁的,所以他不能保证可重复读和不读“脏”数据。
                      二级封锁协议是:一级封锁协议加上事务T在读取数据R之前必须先对其加上S锁,读完后即可释放S锁。这就防止了丢失修改,还可以进一步防止读“脏”数据,但它不能保证可重复读。
                      三级封锁协议是:一级封锁协议加上事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。这就防止了丢失修改和不读“脏数据”,还进一步防止了不可重复读。
                      两段锁协议是:对任何数据进行读写之前必须对该数据加锁,在释放了一个封锁之后,事务不再申请和获得任何其他封锁。这就缩短了持锁时间,提高了并发性,同时解决了数据的不一致性。
                      (3)活锁和死锁。
                      举个例子来说明活锁的概念,如果事务T1封锁了数据R,事务T2又请求封锁R,于是T2等待。若T3也请求封锁R,当T1释放了R上的锁之后系统首先批准了T3的请求,而T2仍等待。之后T4又请求封锁R,当T3释放了R上的封锁后系统批准了T4的请求,如此继续下去,T2有可能永远等待,这就形成了活锁。避免活锁的简单方法是采用先来先服务的策略。
                      举例来说明死锁的概念,如果事务T1封锁了数据R1,T2封锁了数据R2,然后T1又请求封锁R2,因为T2已经封锁了R2,所以T1等待T2释放R2。接着T2又申请封锁R1,而T1已经封锁了R1, T2则只能等待T1释放R1上的锁。这样就出现了这样的情况,即T1在等待T2,而T2又在等待T1,T1和T2两个事务永远不能结束,这就形成了死锁。目前在数据库中解决死锁问题主要有两种方法,一个是采取一定的措施来预防死锁的发生,另一个是允许发生死锁,并采用一定手段定期诊断系统中是否有死锁,如果发现了死锁则立即解除掉。
                      ①死锁的预防。
                      死锁的预防通常有两种方法:一次封锁法和顺序封锁法。
                      一次封锁法要求每个事务必须一次把所有要使用的数据全部加锁,否则就不能继续执行。这个方法虽然能够有效地防止死锁的发生,但是将全部要用到的数据加锁扩大了封锁的范围,降低了系统的并发度。此外,数据库中的数据不断变化,难以精确地确定每个事务要封锁的数据对象,为此只能扩大封锁范围并将所有可能要封锁的数据对象加锁,这就进一步降低了并发度。
                      顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。例如在B树结构的索引中,可规定封锁的顺序必须是从根结点开始,然后是下一级的子女结点,逐级封锁。顺序封锁法可以有效地防止死锁,但也同样存在问题。第一,数据库系统中封锁的数据对象极多,并且随着数据的插入、删除等操作不断变化,维护这样的资源的封锁顺序非常困难;第二,事务很事先确定每个事务要封锁的全部对象,因此也就很难按规定的顺序施加封锁。
                      因此在数据库中广为采用的预防死锁的策略并不很适合数据库的特点,而DBMS在解决死锁问题上普遍采用的是诊断并解除死锁的方法。
                      ②死锁的诊断与解除。
                      数据库系统中死锁的诊断与解除的方法与操作系统类似,一般使用超时法或事务等待图法。
                      超时法是指如果一个事务的等待时间超过了规定的时限,就认为发生了死锁。超时法实现起来很简单,但它的不足之处是:①可能会误判死锁,事务可能是因为其他原因而使等待时间超过时限,系统会误认为发生了死锁;②如果时限设得太长,死锁发生后就不能及时发现。
                      事务等待图是一个有向图G=(T,U)。T为结点的集合,每个结点表示正在运行的事务,U为边的集合,每条边表示事务等待的情况。若T1等待T2,则T1和T2之间划一条从T1指向T2的有向边。事务等待图动态地反映了所有事务的等待情况。并发控制子系统周期地检测事务等待图,若发现图中存在回路,则表示系统中出现了死锁。
                      DBMS的并发子系统一旦检测到系统中存在着死锁,就要设法解除。通常的办法是选择一个代价最小的事务将其撤销(恢复该事务所执行的数据修改操作),释放此事务持有的所有的锁,这样其他的事务就可以运行下去。
                      数据库安全性
                      数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。所有的计算机系统都有安全性问题,而在数据库系统中数据集中存放并且被许多最终用户直接共享,从而使安全性问题更为突出。
                      在一般的计算机系统中,安全措施是一级一级地设置的。用户要求进入计算机系统时,系统首先根据输入用户标识进行用户身份鉴定,对已进入系统的用户,DBMS还要进行存取控制,只允许用户执行合法操作。操作系统一级也有自己的保护措施。数据最后还可以以密码形式存储到数据库中。
                      在这里主要讲述DBMS的存取控制机制。数据库安全最重要的一点就是确保只授权给有资格的用户访问数据库的权限,同时令所有未被授权的人员无法接近数据。存取控制机制主要包括两部分:①定义用户权限并将用户权限登记到数据字典中,称为安全规则或授权规则;②合法权限检查:每当用户发出存取数据库的操作请求(一般应包括操作类型、操作对象和操作用户信息等信息)后,DBMS查找数据字典,根据安全性规则进行合法权限检查。
                      进行存取权限控制时可以为不同的用户定义不同的视图,把数据对象限制在一定的范围内,即通过视图把要保密的数据对无权存取的用户隐藏起来,从而自动地对数据提供一定程度的安全保护。
                      由于任何系统的安全保护措施都不完美,蓄意盗窃、破坏数据的人总是想方设法打破控制。审计功能把用户对数据库的所有操作自动记录下来放入审计日志中,DBA可以利用审计跟踪的信息,重现导致数据库现有状况的一系列事件,找出非法存取数据的人、时间和内容等。对于高敏感性数据还以采用数据加密技术,即根据一定的算法将原始数据变换为不可直接识别的格式,不知道解密算法的人就无法获知数据的内容。
                      数据库完整性
                      数据库的完整性是指数据的正确性和相容性。例如学生的性别只能是男或女,百分制的成绩必须取值在0到100之间。为了维护数据库的完整性,DBMS必须提供一种机制来检查数据库中的数据,看其是否满足语义规定的条件。
                      完整性约束条件的作用对象可以是行、列和关系。行约束主要是记录字段值之间联系的约束条件,例如银行账户的余额应该等于存入金额减去支出金额的值。列约束主要是对列的类型、取值范围、精度、排序、非空值以及不可重复等约束条件。关系约束是表的主码约束、表间的参照完整性约束以及表中记录间的联系约束,例如学生所选的课程必须是课程列表中已经存在的课程。
                      列级约束、主码约束和参照完整性约束是在数据库定义过程中定义的,对数据库进行修改时,DBMS提供的完整性约束机制要对数据库定义的约束进行检查,拒绝不符合约束条件的修改动作。
 
       数据库管理
        数据库的日常管理、性能分析、数据库表空间碎块的清除等工作都非常重要,需要对异构的数据库环境提供较完整的系统管理解决方案,使数据库管理自动化、最优化。
 
       库管理
        Cadence公司的PCB系统设计的库管理提供3个工具,分别是PCB库专家、PCB库、库浏览。


 题号导航      2019年下半年 系统集成项目管理工程师 上午试卷 综合知识   本试卷我的完整做题情况 
1 /
2 /
3 /
4 /
5 /
6 /
7 /
8 /
9 /
10 /
11 /
12 /
13 /
14 /
15 /
 
16 /
17 /
18 /
19 /
20 /
21 /
22 /
23 /
24 /
25 /
26 /
27 /
28 /
29 /
30 /
 
31 /
32 /
33 /
34 /
35 /
36 /
37 /
38 /
39 /
40 /
41 /
42 /
43 /
44 /
45 /
 
46 /
47 /
48 /
49 /
50 /
51 /
52 /
53 /
54 /
55 /
56 /
57 /
58 /
59 /
60 /
 
61 /
62 /
63 /
64 /
65 /
66 /
67 /
68 /
69 /
70 /
71 /
72 /
73 /
74 /
75 /
 
↓第14题