【说明】<br /> 某公司机电管理系列产品被广泛应用于飞行器后，外场事故频繁发生，轻..

免费智能真题库 > 历年试卷 > 系统分析师 > 2019年上半年系统分析师下午试卷案例

第3题

知识点：工作流工作原理故障分析监控消息校验码异常中断中断方式总线

【说明】
某公司机电管理系列产品被广泛应用于飞行器后，外场事故频繁发生，轻则飞机座舱显示机电设备工作异常，重则系统预警，切入备份运行。这些事故给航空公司带来重大经济损失。
公司领导非常重视航空公司的问题反馈，责令公司王总带队到现场进行故障排查。经过一个多月的排查，故障现象始终未复现，同时，公司实验室内也在反复复现故障，结果未取得显著成效，但发现产品存在偶然丢失协议包的现象。随后，公司领导组织行业专家召开故障分析会。王总在会上对前期故障排查情况进行了说明，指出从外场现象看CCDL协议包丢失是引起系统报警、切换的主要原因。图3-1给出了机电管理产品的工作原理，机电管理系统主要承担了对飞行器的刹车、燃袖和环控等子系统进行监视与控制，它对飞行器而言是安全攸关系统，因此，从系统结构上采用了双余度计算机系统。具体工作流程简要说明如下：

１．机电管理系统由1号计算机和2号计算机组成，双机互为余度备份；
２．双机中分别驻留了一个100ms周期的CCDL任务，完成双机间的交叉对比和实时监控等工作。10ms定时器作为任务的工作频率；
３．交叉对比协议包包含一组“AA55”报头、消息长度、数据和校验码；
４．2号机将协议包通过422总线发送给1号机（422总线接口芯片有8级缓冲）；
５．1号机通过中断方式将422总线数据接收到大环形缓冲区中（大小为4096B）；
６．100ms的CCDL定时任务将大环形缓冲冲区的数据以512B为单位拷贝到小环形缓冲区中（大小512B）；
７．CCDL任务按照协议包格式解析小环形缓冲的数据，如果校验错误，丢弃当前协议包；
８．在协议包格式正确的情况下，进行数据交叉比对，比对正确则输出；比对不正确，并连续不正确超过门限，则报警。

问题：3.1 （12分）
王总汇报时指出，在设计安全攸关系统软件时，往往不重视安全攸关软件设计方法, 不遵守C语言安全编码规范，导致程序质量较差，代码中存在支全隐患。请简要说明表3-1给出的C语言代码是C语言安全编码标准中（如：MISARC标准）不允许采用的代码结构的原因。
表3-1 C语言代码实例

问题：3.2 （10分）
请根据自己对图3-1所示机电管理系统工作原理的分析，用300字以内的文字说明本实例中可能存在哪三方面数据传输时丢失协议包现象，并简要说明原因。

问题：3.3 （3分）
针对以上分析出的三种丢包原因，请举例给出两种以上的修改丢包bug的可能的方法。


知识点讲解
· 工作流 · 工作原理 · 故障分析 · 监控 · 消息 · 校验码 · 异常 · 中断 · 中断方式 · 总线

工作流

工作流的定义

工作流（Workflow）是针对业务流程中具有固定程序的常规活动而提出的一个概念，通过将业务流程分解定义良好的任务、角色、规则和过程来进行执行和监控，达到提高生产组织水平和工作效率的目的，工作流技术为企业更好地实现经营目标提供了先进的手段。工作流要解决的主要问题是：为实现某个业务目标，在多个参与者之间，利用计算机，按某种预定规则自动传递文档、信息或者任务。

一个工作流包括一组活动及它们的相互顺序关系，还包括过程及活动的启动和终止条件，以及对每个活动的描述。

工作流管理系统

工作流管理系统指运行在一个或多个工作流引擎上用于定义、实现和管理工作流运行的一套软件系统，它与工作流执行者（人、应用）交互，推进工作流实例的执行，并监控工作流的运行状态。

工作流管理系统将业务流程中工作如何组织协调在一起的规则抽象出来，从而分离了具体工作的逻辑和流程组织的逻辑。我们在工作流管理系统的协助下：开发人员遵从一定的编程接口及约定，就可以开发出更具灵活性的事务处理系统；最终用户无需重新开发事务处理系统，就可以自己更改工作流程，以适应业务变化的需要。

工作流管理系统可以描述不同覆盖范围和不同时间跨度的经营过程，根据经营过程以及组成活动的复杂程度，工作流管理系统可以采取多种实施方式，在不同实施方式中，所应用的信息技术、通信技术和支撑系统结构会有很大的差别，工作流管理系统的实际运行环境也可以在一个工作组内部，也可以在全企业所有业务部门。

工作流管理系统在实际系统中的应用一般分为三个阶段：即模型建立阶段、模型实例化阶段和模型执行阶段。在模型建立阶段，通过利用工作流建模工具，完成企业经营过程模型的建立，将企业的实际经营过程转化为计算机可处理的工作流模型。模型实例化阶段完成为每个过程设定运行所需的参数，并分配每个活动执行所需要的资源，模型执行阶段完成经营过程的执行，在这一过程中，重要的任务是完成人机交互和应用的执行。

工作流的功能

工作流最大的优点是实现了应用逻辑与过程逻辑的分离，因此可以在不修改具体功能的实现情况下，通过修改过程模型来改变系统功能，完成对生产经营部分过程或全部过程的集成管理，有效地把人、信息和应用工具合理地组织在一起，发挥系统的最大效能。工作流技术可以支持企业实现对经营管理和生产组织的过程控制以及决策支持，实现现代企业对“在适当的时间把适当的信息传给适当的人”的要求。

对于引入工作流的组织，能够在软件开发和业务两个层次受益。

.方便开发，工作流管理系统能够简化企业级软件开发甚至维护。

.降低开发风险——通过使用状态和动作这样的术语，业务分析师和开发人员使用同一种语言交谈。这样开发人员就不必将用户需求转化成软件设计了。

.实现统一集中——业务流程经常变化，使用工作流系统的最大好处是：业务流程的实现代码，不再散落在各种各样的系统中。

.加快应用开发——软件不用再关注流程的参与者，开发起来更快，代码更容易维护。

.业务流程管理（BPM）——提高效率，在自动化过程中会去除一些不必要的过程。

.提高对迭代开发的支持。

如果软件中业务流程部分不容易更改，组织就需要花很大的精力在开发前的业务流程分析中，希望一次成功。但可悲的是，在任何软件项目开发中，这都很少能实现。工作流系统使得新业务流程很容易部署，业务流程相关的软件可以一种迭代的方式开发，因此使用工作流系统使开发更有效、风险更低。

工作原理

链路状态路由算法的基本工作过程如下：

（1）路由器之间形成邻居关系。当某个路由器启动之后，要做的第一件事是知道它的邻居是谁，这可以通过向其邻居发送问候（Hello）报文来做到。

（2）测量线路开销。链路状态路由算法要求每个路由器都知道它到邻居路由器的延迟。获得到邻居路由器延迟的最直接方式就是发送一个要求对方立即响应的特殊的Echo报文，通过计算来回延迟再除以2，就可以得到延迟估计值。如果想要得到更精确的结果，可以重复这一过程，再取平均值。

（3）构造链路状态报文。一旦路由器获得所有邻居路由器的延迟，下一步就是构造链路状态报文。链路状态报文包含构造该报文的路由器标识，以及到每个邻居路由器的延迟。下图（a）给出了某网络的拓扑结构，对应的6个链路状态报文如下图（b）所示。

构造链路状态报文

构造链路状态报文并不是一件困难的事情，难在何时构造这些报文。一种方法是定期进行；另一种方法是当网络出现大的变化时（如线路断开或重新连通、邻居路由器故障或恢复等情况）就构造新的链路状态报文。

（4）广播链路状态报文。链路状态路由算法的最重要也是最具有技巧性的部分就是如何将链路状态报文可靠地广播到网络中的每一个路由器。

完成链路状态报文广播的基本思想是利用扩散。由于扩散将导致网络中存在大量的重复报文，为了控制重复报文的数量，在每个链路状态报文中加上一个序号，该序号在每次广播新的链路状态报文时加1。每个路由器记录它所接收过的链路状态报文中的信息对（源路由器，序号），当路由器接收到一个链路状态报文时，先查看一下该报文是否已收到过。将新接收到的报文序号与路由器记录的最大序号进行比较，如果前者小于或等于后者，则说明该报文是重复报文，将其丢弃；否则该报文就是新的，应将它扩散到所有的输出线路上（除了接收该报文的线路外）。

仅仅使用序号来控制重复报文会有问题，但这些问题是可以控制的。首先是序号的循环使用可能会导致序号冲突，解决的办法是使用32位的序号，这样即使是每秒钟广播一次链路状态报文（实际上链路状态报文的广播间隔不止1秒钟），得花137年才能使计数循环回来，避免了发生冲突的可能性。其次，如果某路由器由于故障而崩溃了，当此路由器重新启动后，如果它的序号再从0开始，那么后面的链路状态报文可能会被其他路由器当作重复报文而丢弃。第三，如果链路状态报文在广播过程中序号出现错误，如将序号5变为1027（一位出错），那么序号为5到1027的报文将会被当成重复报文而丢弃，因为路由器认为当前的序号是1027，所有序号小于或等于1027的报文都认为是重复报文。

为了解决重复报文这个难题，还可以在每个链路状态报文中加上生存期（Age）字段，且每隔1秒钟减1。当生存期变为0时，报文被丢弃。

还可以对链路状态报文的广播过程作一些细微修改，使算法更强壮一些。如路由器接收到链路状态报文后，并不立即将它放入输出队列进行排队等待转发，而是首先将它送到一个缓冲区等待一会儿。如果已有来自同一路由器的其他链路状态报文先行到达，则比较一下它们的序号。如果序号相等，丢弃任何一个重复报文；否则丢弃老的报文。为了防止因为路由器之间的线路故障而导致链路状态报文的丢失，所有的链路状态报文都要进行应答。一旦通信线路空闲，路由器就会循环扫描缓冲区以选择发送一个链路状态报文或者应答报文。

对于上图（a）中的网络，路由器B的报文缓冲区如下图所示。这里的每一行对应于一个新到的但未完全处理完毕的链路状态报文。这张表记录了报文来自何处、报文的序号、生存期及链路状态报文。另外，对应于B到每个邻居（到A、C和F）各有一个发送标志和应答标志。发送标志位用于标识必须将链路状态报文发送到该邻居，应答标志位用于标识必须给该邻居发送应答报文。

对应于上图（a）中B的报文缓冲区

在上图中，A产生的链路状态报文可直接到达B，而B必须将此报文再扩散到C和F，同时B必须向A发送应答报文。类似的，F产生的链路状态报文到达B后，B必须向A和C进行转发，同时B必须向F发送应答报文。

但是，对于上图中来自E的报文就有所不同。假设B两次收到来自E的报文，一次经过EAB，另一次经过EFB。因此，B只需将E产生的链路状态报文发往C即可，但要向A和F发送应答报文。

如果重复报文在前一个报文未出缓冲区时到达，表中的标志位就得进行修改。例如，在上图中，当B还未处理完由C产生的链路状态报文，又接收到一个从F传来的C的链路状态报文时，此时应将C行的标志位由101010改为100011，表示要向F发送应答报文，而不必将C的链路状态报文再发向F。

（5）计算最短路径。由于网络上的每个路由器都可以获得所有其他路由器的链路状态报文，每个路由器都可以构造出网络的拓扑结构图。此时路由器可以根据Dijkstra算法计算出到所有目的节点的最短路径，并把计算结果填到路由器的路由表中。

故障分析

这里主要讨论故障分析内容以及优化调整设置内容，同时还与读者分享故障分析的经验与实例。

故障分析重点内容

故障分析的重点内容包括以下几个方面：

①CPU问题。

②内存和高速缓存。

③磁盘（I/O）资源问题。

④配置参数。

⑤应用系统网络设置。

⑥数据库服务器故障定位。

经验探讨

. 经验举例1。

交易的响应时间如果很长，远远超过系统性能的需求，表示耗费CPU的数据库操作。例如排序，执行aggregate functions（例如sum、min、max、count）等较多，可考虑是否有索引以及索引建立得是否合理。尽量使用简单的表链接、水平分割大表格等方法来降低该值。

. 经验举例2。

测试工具可以模拟不同的虚拟用户来单独访问Web服务器、应用服务器和数据库服务器，这样，就可以在Web端测出的响应时间减去以上各个分段测出的时间，就可以知道瓶颈在哪里并着手调优。

. 经验举例3。

UNIX资源监控（NT操作系统同理）中指标内存页交换速率（Paging rate），如果该值偶尔走高，表明当时有线程竞争内存。如果持续很高，则内存可能是瓶颈，也可能是内存访问命中率低。“Swap in rate”和“Swap out rate”也有类似的解释。

. 经验举例4。

UNIX资源监控（NT操作系统同理）中指标CPU占用率（CPU utilization），如果该值持续超过95%，表明瓶颈是CPU。可以考虑增加一个处理器或换一个更快的处理器。合理使用的范围在60%～70%。

. 经验举例5。

Tuxedo资源监控中指标队列中的字节数（Bytes on queue），队列长度应不超过磁盘数的1.5～2倍。要提高性能，可增加磁盘。注意：一个Raid Disk实际有多个磁盘。

. 经验举例6。

SQL Server资源监控中指标缓存点击率（Cache Hit Ratio），该值越高越好。如果持续低于80%，应考虑增加内存。注意该参数值是从SQL Server启动后，就一直累加记数，所以运行经过一段时间后，该值将不能反映系统当前值。

优化调整设置

针对上述故障分析的重点内容，需要做相应的优化调整，建议如下。

. CPU问题。

①考虑使用更高级的CPU代替目前的CPU；

②对于多CPU，考虑CPU之间的负载分配；

③考虑在其他体系上设计系统，例如增加前置机、设置并行服务器等。

. 内存和高速缓存。

①内存的优化包括操作系统、数据库、应用程序的内存优化；

②过多的分页与交换可能降低系统的性能；

③内存分配也是影响系统性能的主要原因；

④保证保留列表具有较大的邻接内存块；

⑤调整数据块缓冲区大小（用数据块的个数表示）是一个重要内容；

⑥将最频繁使用的数据保存在存储区中。

. 磁盘（I/O）资源问题。

①磁盘读写进度对数据库系统是至关重要的，数据库对象在物理设备上的合理分布能改善性能。

②磁盘镜像会减慢磁盘写的速度。

③通过把日志和数据库对象分布在独立的设备上，可以提高系统的性能。

④把不同的数据库放在不同的硬盘上，可以提高读写速度。建议把数据库、回滚段、日志放在不同的设备上。

⑤把表放在一块硬盘上，把非簇的索引放在另一块硬盘上，保证物理读写更快。

. 调整配置参数。

①包括操作系统和数据库的参数配置。

②并行操作资源限制的参数（并发用户的数目、会话数）。

③影响资源开销的参数。

④与I/O有关的参数。

. 优化应用系统网络设置。

①可以通过数组接口来减少网络呼叫。不是一次提取一行，而是在单个往来往返中提取10行，这样做效率较高。

②调整会话数据单元的缓冲区大小。

③共享服务进程比专用服务进程提供更好的性能。

负载压力典型问题分析

负载压力测试需要识别的故障问题主要包括：

. 非正确执行的处理。

. 速度瓶颈与延迟。

. 不能达到满意服务水平。

. 接口页面不能正确地装载或者根本不能装载。

当在合理的加载下出现这些类型的问题时，则表示可能有基础性的设计问题，比如说：算法问题，低效的数据库应用程序交互作用等，这些都不是通过简单升级硬件以及调整系统配置就可以解决的问题，此时软件的故障定位和调优将占有更重要的地位。

Web网站故障分析举例

目前Web开发者开始提供可定制的Web网站，例如，像搜索数据之类的任务，现在可以由服务器执行，而无需客户干预。然而，这些变革也导致了一个结果，这就是许多网站都在使用大量的未经优化的数据库调用，从而使得应用性能大打折扣。

我们可以使用以下几种方法来解决这些问题：

. 优化ASP代码。

. 优化数据库调用。

. 使用存储过程。

. 调整服务器性能。

优秀的网站设计都会关注这些问题。然而，与静态页面的速度相比，任何数据库调用都会显著地影响Web网站的响应速度，这主要是因为在发送页面之前必须单独地为每个访问网站的用户进行数据库调用。

这里提出的性能优化方案正是基于以下事实：访问静态HTML页面要比访问那些内容依赖于数据库调用的页面要快。它的基本思想是：在用户访问页面之前，预先从数据库提取信息，写入存储在服务器上的静态HTML页面。为了保证这些静态页面能够及时地反映不断变化的数据库数据，必须有一个调度程序管理静态页面的生成。

当然，这种方案并不能够适应所有的情形。例如，如果是从持续变化的大容量数据库提取少量信息，这种方案是不合适的。

每当该页面被调用时，脚本就会提取最后的更新时间并将它与当前时间比较。如果两个时间之间的差值大于预定的数值，更新脚本就会运行，否则，该ASP页面把余下的HTML代码发送给浏览器。

如果每次访问ASP页面的时候都要提供最新的信息，或者输出与用户输入密切相关，这种方法并不实用，但这种方法可以适应以固定的时间间隔更新信息的场合。

如果数据库内容由客户通过适当的ASP页面更新，要确保静态页面也能够自动反映数据的变化，我们可以在ASP页面中调用Update脚本。这样，每当数据库内容改变时，服务器上也有了最新的静态HTML页面。

另一种处理频繁变动数据的办法是借助Microsoft SQL Server 7.0或以上版本的Web助手向导（Web Assistant Wizard），这个向导能够利用Transact-SQL、存储过程等从SQL Server数据生成标准的HTML文件。

Web助手向导能够用来定期地生成HTML页面。正如前面概要介绍的方案，Web助手可以通过触发子更新HTML页面，比如在指定的时间执行更新或者在数据库数据变化时执行更新。

SQL Server使用名为sp_makewebtask的存储过程创建HTML页面，它的参数是目标HTML文件的名字和待执行存储过程的名字，查询的输出发送到HTML页面。另外，也可以选择使用可供结果数据插入的模板文件。

万一用户访问页面的时候正好在执行更新，我们可以利用锁或者其他类似的机制把页面延迟几秒钟。

我们对纯HTML加调度ASP代码和普通的ASP文件进行了性能测试。普通的ASP文件要查找5个不同的表为页面提取数据。为了和这两个文件相比较，对一个只访问单个表的ASP页面和一个纯HTML文件也进行了测试。测试结果如下表所示。

加调度ASP代码和普通ASP代码测试对比

其中TTFB是指“Total Time to First Byte”, TTLB是指“Total Time to Last Byte”。

测试结果显示，访问单个表的ASP页面的处理时间是720.5ms，而纯HTML文件则为427ms。普通的ASP文件和纯HTML加调度ASP代码的输出时间相同，但它们的处理时间分别为3633.67ms和1590ms。也就是说，在这个测试环境下我们可以把处理速度提高43%。

如果我们要让页面每隔一定的访问次数进行更新，比如100次，那么这第100个用户就必须等待新的HTML页面生成。不过，这个代价或许不算太高，其他99个用户获得了好处。

静态页面方法并不能够适合所有类型的页面。例如，某些页面在进行任何处理之前必须要有用户输入。但是，这种方法可以成功地应用到那些不依赖用户输入却进行大量数据库调用的页面，而且这种情况下它将发挥出更大的效率。

在大多数情况下，动态页面的生成将在相当大的程度上提高网站的性能，而且无须在功能上有所折衷。虽然有许多大的网站采用了这个策略来改善性能，但也有许多网站完全由于进行大量没有必要的数据库调用，而表现出很差的性能。

监控

主要包括故障监控和性能、流量、负载等状态监控，这些监控关系到集群的健康运行及潜在问题的及时发现与干预。

（1）服务故障、状态监控：主要是对服务器自身、上层应用、关联服务数据交互监控；例如针对前端Web Server，就可以有很多种类型的监控，包括应用端口状态监控，便于及时发现服务器或应用本身是否崩溃、通过ICMP包探测服务器健康状态，更上层可能还包括应用各频道业务的监控，这些只是一部分，还有多种监控方式，依应用特点而定。还有一些问题需解决，如集群过大，如何高性能地进行监控也是一个现实问题。

（2）集群状态类的监控或统计，为合理管理调优集群提供数据参考，包括服务瓶颈、性能问题、异常流量、攻击等问题。

消息

消息是对象间通信的手段、一个对象通过向另一个对象发送消息来请求其服务。一个消息通常包括接收对象名、调用的操作名和适当的参数（如有必要）。消息只告诉接收对象需要完成什么操作，并不能指示接收者怎样完成操作。消息完全由接收者解释，接收者独立决定采用什么方法来完成所需的操作。

校验码

计算机系统运行时，在各个部件之间经常需要进行数据交换，为保证数据传送过程的正确无误，必须引入差错检查机制对数据进行校验，以检测是否有数据传送错误。其基本原理是：在编码中引入一定的冗余位，当被传送的编码中出现错误时就使之成为非法代码而被检测出。

奇偶校验码

奇偶校验码用于并行码的检错。其原理是：在k位数据码之外增加1位校验位，使k+1位码字中取值为1的位数总保持为偶数（偶校验）或奇数（奇校验）。

（1）水平校验：设最高位为校验位。

原有数字位生产新的码字：偶校验奇校验

（2）垂直校验：设4个字节的数据为一组进行垂直奇校验。

第一字节数据：10110011

第二字节数据：11011001

第三字节数据：01010101

第四字节数据：10001100

垂直校验位：01001100

（3）垂直水平校验：设4个字节的数据为一组进行垂直水平奇校验。

水平校验位

第一字节数据：10110011 0

第二字节数据：11011001 0

第三字节数据：01010101 1

第四字节数据：10001100 0

垂直校验位：01001100

海明码

海明码用于多位并行数据检错纠错处理。

实现：为k个数据位设r个校验位，使k+r位的码字（即海明码）能发现k位中任何一位出错且可以纠正。

其数据位k和校验位r必须满足如下关系式：

2^r≥k+r+I

1）海明码的编码规则

设r个校验位P_rP_r_-1…P₁,k个数据位D_k_-1D_k_-2…D₀，产生的海明码为H_r₊_k,H_r₊_k_-1…H₁，则有如下规则。

规则1：Pi在海明码的2ⁱ-1位置，即H_j=P_i,j=2ⁱ-l；数据位则依序从低至高占据海明码中其他的位置。

规则2：海明码中的任意位都是由若干校验位来校验的。其对应关系是：被校验的海明位的下标等于所有参与校验该位的校验位的下标之和，而校验位则是由其自身来校验的。

2）海明码校验

下面以k=8对纠1位错的海明码的编码及校验原理给予说明。

（1）确定r的位数。

当r=4时，有2⁴≥8+4+1，可以满足2^r≥k+r+1。

（2）确定海明码的位置。

由规则1，P_i对应H_j的位置。

如：确定P₄的位置，因j=2^i-1=2^4-1=8，则有P₄在H₈的位置。同理得到以下位置的对应关系：

H₁₂H₁₁H₁₀H₉H₈H₇H₆H₅H₄H₃H₂H₁

D₇D₆D₅D₄P₄D₃D₂D₁P₃D₀P₂P₁

（3）确定编码方案。

由规则2，编码方案如下：

形成H_i与P₁相关的数据位有：S₁=D₀十D₁十D₃十D₄十D₆。

形成H_i与P₂相关的数据位有：S₂=D₀十D₂十D₃十D₅十D₆。

形成H_i与P₃相关的数据位有：S₃=D₁十D₂十D₃十D₇。

形成H_i与P₄相关的数据位有：D₇十D₆十D₅十D₄。

得校验关系：S₄=D₄十D₅十D₆十D₇。

（4）确定纠错译码方案。

设G₁=S₁十P₁；G₂=S₂十P₂；G₃=S₃十P₃；G₄=S₄十P₄。若采用偶校验则G₄~G₁的值全为0时数据正确，反之有错。用对出错位取反的方法即可实现纠错。

例如，G₄~G₁=0111，其值为7，对应于H₇（D₃的位置）。将D₃的值取反就实现了纠错。

循环冗余校验码（CRC）

利用生成多项式为k个数据位产生r个校验位来进行编码，其编码长度为k+r。CRC的代码格式为：

由此可知循环冗余校验码由两部分组成，左边为信息码，右边为校验码，若信息码占k位，则校验码就占n-k位，所以又称为（n,k）码。

异常

异常是一种形式的异常控制流，它一部分是由硬件实现的，一部分是由操作系统实现的。因为它们有一部分是由硬件实现的，所以具体细节将随系统的不同而有所不同。然而，对于每个系统而言，基本的思想都是相同的。

异常（exception）就是控制流中的突变，用来响应处理器状态中的某些变化。异常可以分为四类：中断（interrupt）、陷阱（trap）、故障（fault）和中止（abort）。下表对这些类别的属性做了小结。

异常的类别

（1）陷阱。陷阱是有意的异常，是执行一条指令的结果。就像中断处理程序一样，陷阱处理程序将控制返回到下一条指令。陷阱最重要的用途是在用户程序和内核之间提供一个像过程一样的接口，叫做系统调用。

用户程序经常需要向内核请求服务，例如读一个文件、创建一个新的进程、加载一个新的程序或者中止当前进程。为了允许对这些内核服务的受控的访问，处理器提供了一条特殊的syscall指令，当用户程序想要请求服务n时，可以执行这条指令。执行syscall指令会导致一个到异常处理程序的陷阱，这个处理程序对参数解码，并调用适当的内核程序。

（2）故障。故障由错误情况引起，它可能被故障处理程序修正。当一个故障发生时，处理器将控制转移给故障处理程序。如果处理程序能够修正这个错误情况，它就将控制返回到故障指令，从而重新执行它。否则，处理程序返回到内核中的abort例程，abort例程会中止引起故障的应用程序。

（3）中止。中止是不可恢复的致命错误造成的结果，典型的是一些硬件错误，例如DRAM或者SRAM位被损坏时发生的奇偶错误。中止处理程序从不将控制返回给应用程序。处理程序将控制返回给一个abort例程，该例程会中止这个应用程序。

中断

中断是异步发生的，是来自处理器外部的I/O设备的信号的结果。硬件中断不是由任何一条专门的指令造成的，从这个意义上来说它是异步的。硬件中断的异常处理程序常常被称为中断处理程序（interrupt handler）。

硬中断与软中断

硬中断是由硬件产生的，例如磁盘、网卡、键盘、时钟等。每个设备或设备集都有它自己的IRQ（中断请求）。基于IRQ，CPU可以将相应的请求分发到对应的硬件驱动上。

软中断是一组静态定义的下半部分接口，可以在所有的处理器上同时执行，即使两个类型相同也可以。但是一个软中断不会抢占另外的一个软中断，唯一可以抢占软中断的是硬中断。

可屏蔽中断与不可屏蔽中断

可屏蔽中断和不可屏蔽中断都属于外部中断，是由外部中断源引起的。不可屏蔽中断源一旦提出请求，CPU必须无条件响应，而对可屏蔽中断源的请求，CPU可以响应，也可以不响应。

CPU一般设置两根中断请求输入线：可屏蔽中断请求INTR（Interrupt Require）和不可屏蔽中断请求NMI（Non Maskable Interrupt）。对于可屏蔽中断，除了受本身的屏蔽位控制外，还都要受一个总的控制，即CPU标志寄存器中的中断允许标志位IF（Interrupt Flag）的控制，IF位为1，可以得到CPU的响应，否则，得不到响应。IF位可以由用户控制，指令STI或Turbo C的Enable（）函数，将IF位置1（开中断），指令CLI或Turbo_c的Disable（）函数，将IF位清0（关中断）。

中断优先级

当多个中断源同时请求中断时，而CPU一次只能响应其中的一个中断，同时为了能响应所有中断，就引入中断优先级来处理。系统会根据引起中断事件的重要性和紧迫程度，将中断源分为若干个级别，称作中断优先级。中断优先级有两种：查询优先级和执行优先级。

查询优先级是不可以更改和设置的，在该方式下当多个中断源同时产生中断信号时，中断仲裁器会选择中断源优先处理的顺序，此过程与是否发生中断服务程序的嵌套毫不相干。当CPU查询各个中断标志位的时候，会依照优先级顺序依次查询，当数个中断同时请求的时候，会优先查询到高查询优先级的中断标志位，但并不代表高查询优先级的中断可以打断已经并且正在执行的低查询优先级的中断服务。

由于可屏蔽的中断源很多，故需要对其进行管理，如区分是哪个中断源发出的中断信号？哪个中断源最优先及怎样处理多级中断嵌套等。为此，可使用中断控制器对多个可屏蔽中断源进行管理。

中断控制器能够对中断进行排队管理，避免中断信号的丢失，同时支持对不同中断进行优先级的配置，使高优先级中断能够中断低优先级中断，满足系统中具有更高时间约束特性功能的需要。

中断嵌套

当处理器正在处理一个中断时，有比该中断优先级高的中断源发出中断请求时，如果处理器正在执行中断处理程序，那么处理器会对高优先级的中断进行立即处理，处理完之后再返回到低优先级的中断服务程序继续执行。这样就形成了中断服务程序中套用中断服务程序的情况，即中断嵌套。可嵌套中断的处理流程和中断服务框图如下图所示。

可嵌套中断处理流程

中断方式

在中断方式下，I/O设备工作时CPU不再等待，而是进行其他的操作，当I/O设备完成后，通过一个硬件中断信号通知CPU，CPU再来处理接下来的工作。

利用中断方式完成数据的输入／输出过程为：当系统与外设交换数据时，CPU无须等待也不必去查询I/O设备的状态，而是处理其他任务。当I/O设备准备好以后，就发出中断请求信号通知CPU，CPU接到中断请求信号后，保存正在执行程序的现场，转入I/O中断服务程序的执行，完成与I/O系统的数据交换，然后再返回被打断的程序继续执行。与程序控制方式相比，中断方式因为CPU无须等待而提高了效率。

在系统中具有多个中断源的情况下，常用的处理方法有多中断信号线法（multiple interrupt lines）、中断软件查询法（software poll）、菊花链法（daisy chain）、总线仲裁法和中断向量表法。

（1）多中断信号线法。每个中断源都有属于自己的一根中断请求信号线向CPU提出中断请求。

（2）中断软件查询法。当CPU检测到一个中断请求信号以后，即转入到中断服务程序去轮询每个中断源以确定是谁发出了中断请求信号。对各个设备的响应优先级由软件设定。

（3）菊花链法。软件查询的缺陷在于花费的时间太多。菊花链法实际上是一种硬件查询法。所有的I/O模块共享一根共同的中断请求线，而中断确认信号则以链式在各模块间相连。当CPU检测到中断请求信号时，则发出中断确认信号。中断确认信号依次在I/O模块间传递，直到发出请求的模块，该模块则把它的ID送往数据线由CPU读取。

（4）总线仲裁法。一个I/O设备在发出中断请求之前，必须先获得总线控制权，所以可由总线仲裁机制来裁定谁可以发出中断请求信号。当CPU发出中断响应信号后，该设备即把自己的ID发往数据线。

（5）中断向量表法。中断向量表用来保存各个中断源的中断服务程序的入口地址。当外设发出中断请求信号（INTR）以后，由中断控制器（INTC）确定其中断号，并根据中断号查找中断向量表来取得其中断服务程序的入口地址，同时INTC把中断请求信号提交给CPU，如下图所示。中断源的优先级由INTC来控制。

中断向量表法

在具有多个中断源的计算机系统中，各中断源对服务的要求紧迫程度可能不同。在这样的计算机系统中，就需要按中断源的轻重缓急来安排对它们的服务。

在中断优先级控制系统中，给最紧迫的中断源分配高的优先级，而给那些要求相对不紧迫（例如几百微秒到几毫秒）的中断源分配低一些的优先级。在进行优先级控制时解决以下两种情况。

（1）当不同优先级的多个中断源同时提出中断请求时，CPU应优先响应优先级最高的中断源。

（2）当CPU正在对某一个中断源服务时，又有比它优先级更高的中断源提出中断请求，CPU应能暂时中断正在执行的中断服务程序而转去对优先级更高的中断源服务，服务结束后再回到原先被中断的优先级较低的中断服务程序继续执行，这种情况称为中断嵌套，即一个中断服务程序中嵌套着另一个中断服务程序。

总线

所谓总线（Bus），是指计算机设备和设备之间传输信息的公共数据通道。总线是连接计算机硬件系统内多种设备的通信线路，它的一个重要特征是由总线上的所有设备共享，因此可以将计算机系统内的多种设备连接到总线上。

总线的分类

微机中的总线分为数据总线、地址总线和控制总线3类。不同型号的CPU芯片，其数据总线、地址总线和控制总线的条数可能不同。

数据总线（Data Bus，DB）用来传送数据信息，是双向的。CPU既可通过DB从内存或输入设备读入数据，也可通过DB将内部数据送至内存或输出设备。DB的宽度决定了CPU和计算机其他设备之间每次交换数据的位数。

地址总线（Address Bus，AB）用于传送CPU发出的地址信息，是单向的。传送地址信息的目的是指明与CPU交换信息的内存单元或I/O设备。存储器是按地址访问的，所以每个存储单元都有一个固定地址，要访问1MB存储器中的任一单元，需要给出2²⁰个地址，即需要20位地址（2²⁰=1M）。因此，地址总线的宽度决定了CPU的最大寻址能力。

控制总线（Control Bus，CB）用来传送控制信号、时序信号和状态信息等。其中有的信号是CPU向内存或外部设备发出的信息，有的是内存或外部设备向CPU发出的信息。显然，CB中的每一条线的信息传送方向是单方向且确定的，但CB作为一个整体则是双向的。所以，在各种结构框图中，凡涉及控制总线CB，均是以双向线表示。

总线的性能直接影响整机系统的性能，而且任何系统的研制和外围模块的开发都必须依从所采用的总线规范。总线技术随着微机结构的改进而不断发展与完善。

在计算机的概念模型中，CPU通过系统总线和存储器之间直接进行通信。实际上在现代的计算机中，存在一个控制芯片的模块。CPU需要和存储器、I/O设备等进行交互，会有多种不同功能的控制芯片，称之为控制芯片组。对于目前的计算机结构来说，控制芯片集成在主板上，典型的有南北桥结构和单芯片结构。与芯片相连接的总线可以分为前端总线（FSB）、存储总线、I/O总线、扩展总线等。

南北桥芯片结构

北桥芯片直接与CPU、内存、显卡、南桥相连，控制着CPU的类型、主板的总线频率、内存控制器、显示核心等。前端总线（FSB）是将CPU连接到北桥芯片的总线。内存总线是将内存连接到北桥芯片的总线，用于和北桥之间的通信。显卡则通过I/O总线连接到北桥芯片。

南桥芯片主要负责外部设备接口与内部CPU的联系。其中，通过I/O总线将外部I/O设备连接到南桥，比如USB设备、ATA和SATA设备以及一些扩展接口。扩展总线则是指主板上提供的一些PCI、ISA等插槽。

单芯片结构

单芯片组方式取消了北桥。由于CPU中内置了内存控制器，不再需要通过北桥来控制，这样就能提高内存控制器的频率，减少延迟。还有一些CPU集成了显示单元，使得显示芯片的频率更高，延迟更低。

常见总线

常见总线包括：

（1）ISA总线。ISA是工业标准总线，只能支持16位的I/O设备，数据传输率大约是16MB/s，也称为AT标准。

（2）EISA总线。EISA是在ISA总线的基础上发展起来的32位总线。该总线定义32位地址线、32位数据线以及其他控制信号线、电源线、地线等共196个接点。总线传输速率达33MB/s。

（3）PCI总线。PCI总线是目前微型机上广泛采用的内总线，采用并行传输方式。PCI总线有适于32位机的124个信号的标准和适于64位机的188个信号的标准。PCI总线的传输速率至少为133MB/s，64位PCI总线的传输速率为266MB/s。PCI总线的工作与CPU的工作是相互独立的，也就是说，PCI总线时钟与处理器时钟是独立的、非同步的。PCI总线上的设备是即插即用的。接在PCI总线上的设备均可以提出总线请求，通过PCI管理器中的仲裁机构允许该设备成为主控设备，主控设备与从属设备间可以进行点对点的数据传输。PCI总线能够对所传输的地址和数据信号进行奇偶校验检测。

（4）PCI Express总线。PCI Express简称为PCI-E，采用点对点串行连接，每个设备都有自己的专用连接，不需要向整个总线请求带宽，而且可以把数据传输率提高到一个很高的频率。相对于传统PCI总线在单一时间周期内只能实现单向传输，PCI Express的双单工连接能提供更高的传输速率和质量。

PCI Express的接口根据总线位宽不同而有所差异，包括X1、X4、X8以及X16（X2模式将用于内部接口而非插槽模式），其中X1的传输速度为250MB/s，而X16就是等于16倍于X1的速度，即是4GB/s。较短的PCI Express卡可以插入较长的PCI Express插槽中使用。PCI Express接口能够支持热拔插。同时，PCI Express总线支持双向传输模式，还可以运行全双工模式，它的双单工连接能提供更高的传输速率和质量，它们之间的差异与半双工和全双工类似。因此连接的每个装置都可以使用最大带宽。

（5）前端总线。微机系统中，前端总线（Front Side Bus，FSB）是将CPU连接到北桥芯片的总线。选购主板和CPU时，要注意两者的搭配问题，一般来说，如果CPU不超频，那么前端总线是由CPU决定的，如果主板不支持CPU所需要的前端总线，系统就无法工作。也就是说，需要主板和CPU都支持某个前端总线，系统才能工作。通常情况下，一个CPU默认的前端总线是唯一的。北桥芯片负责联系内存、显卡等数据吞吐量最大的部件，并与南桥芯片连接。CPU通过前端总线（FSB）连接到北桥芯片，进而通过北桥芯片与内存、显卡交换数据。FSB是CPU和外界交换数据的最主要通道，因此FSB的数据传输能力对计算机整体性能作用很大，如果没足够快的FSB，再强的CPU也不能明显提高计算机整体速度。

（6）RS-232C。RS-232C是一条串行外总线，其主要特点是所需传输线比较少，最少只需三条线（一条发、一条收、一条地线）即可实现全双工通信。传送距离远，用电平传送为15m，电流环传送可达千米。有多种可供选择的传送速率。采用非归零码负逻辑工作，电平≤-3V为逻辑1，而电平≥+3V为逻辑0，具有较好的抗干扰性。

（7）SCSI总线。小型计算机系统接口（SCSI）是一条并行外总线，广泛用于连接软硬磁盘、光盘、扫描仪等。其中，SCSI-1是第一个SCSI标准，传输速率为5MB/s；Ultra2 SCSI的传输速率为80MB/s；Ultra160 SCSI也称Ultra3 SCSI LVD，传输速率为160MB/s；Ultra320 SCSI也称Ultra4 SCSI LVD，传输速率可高达320MB/s。

（8）SATA。SATA是Serial ATA的缩写，即串行ATA。它主要用作主板和大量存储设备（如硬盘及光盘驱动器）之间的数据传输。SATA总线使用嵌入式时钟信号，具备了更强的纠错能力，与以往相比其最大的区别在于能对传输指令（不仅仅是数据）进行检查，如果发现错误会自动矫正，这在很大程度上提高了数据传输的可靠性。串行接口还具有结构简单、支持热插拔的优点。

（9）USB。通用串行总线（USB）当前风头正劲，目前得到十分广泛的应用。USB由4条信号线组成，其中两条用于传送数据，另外两条传送+5V容量为500mA的电源。可以经过集线器（Hub）进行树状连接，最多可达5层。该总线上可接127个设备。USB 1.0有两种传送速率：低速为1.5Mb/s，高速为12Mb/s。USB 2.0的传送速率为480Mb/s。USB 3.0的传送速率为5Gb/s。USB总线最大的优点还在于它支持即插即用，并支持热插拔。

（10）IEEE-1394。IEEE-1394是高速串行外总线，近几年得到广泛应用。IEEE-1394也支持外设热插拔，可为外设提供电源，省去了外设自带的电源，能连接多个不同设备，支持同步和异步数据传输。IEEE-1394由6条信号线组成，其中两条用于传送数据，两条传送控制信号，另外两条传送8~40V容量为1500mA的电源，IEEE-1394总线理论上可接63个设备。IEEE-1394的传送速率从400Mb/s、800Mb/s、1600Mb/s直到3.2Gb/s。

（11）IEEE-488总线。IEEE-488是并行总线接口标准。微计算机、数字电压表、数码显示器等设备及其他仪器仪表均可用IEEE-488总线连接装配，它按照位并行、字节串行双向异步方式传输信号，连接方式为总线方式，仪器设备不需中介单元直接并联于总线上。总线上最多可连接15台设备。最大传输距离为20m，信号传输速率一般为500KB/s，最大传输速率为1MB/s。

题号导航 2019年上半年系统分析师下午试卷案例

本试卷我的完整做题情况



	第3题在手机中做本题