在某嵌入式系统设计中，需要使用嵌入式主处理器对外围模拟视频信号进行采集、编码、存..

免费智能真题库 > 历年试卷 > 嵌入式系统设计师 > 2013年下半年嵌入式系统设计师下午试卷案例

第2题

知识点： I²C 编码串口存储器嵌入式系统系统调试信号总线 Flash MAX 电源调试对比度模拟视频视频数据采集写操作

在某嵌入式系统设计中，需要使用嵌入式主处理器对外围模拟视频信号进行采集、编码、存储和网络传输。图2-1为李工设计的该嵌入式系统的原理框图：釆用两片TVP5146芯片进行两路模拟视频数据采集，在该处理器外围采用MAX3232芯片进行串口扩展，以方便系统调试，同时在该原理图中还设计了相应的Flash 存储器接口，DDR存储器，网络及电源等电路。
在该电路设计中，视频采集芯片TVP5146需要主处理器通过I²C接口进行采集模式、亮度、对比度、增益等参数的调节，但是主处理器只有一个I²C接口，因此需要将两个TVP5146挂载的同一个I²C 总线上，如图2-2所示。TVP5146的I²C芯片地址选择如表2.1所示，当进行I²C读时，I²C地址的最低位是1，当进行写操作时，I²C地址最低位是0，A0由外围电路的高低电平决定，高电平为1，低电平为0。

问题：2.1 （1）0xB9（2）0xB8（3）OxBB（4）OxBA

根据图2-2及表2.1所示，对图2-2中的TVP5146（1）和TVP5146（2）俩个芯片分别进行I²C读写操作时，其对应的地址依次是：
TVP5146（1）读操作时的I²C地址：（1）
TVP5146（1）写操作时的I²C地址：（2）
TVP5146（2）读操作时的I²C地址：（3）
TVP5146（2）写操作时的I²C地址：（4）

问题：2.2 在图2-2原理图设计中，主处理器的串口控制器的时钟为27M，在进行串口调试时，李工需要将串口配置为9600bps的波特率，需要对串口控制器的DLL（Divisor Latches Low寄存器）和DLH（Divisor Latches High寄存器）进行配置，DLL和DLH的寄存器分别如图2-3和图2-4所示。

根据以上信息，DLL和DLH寄存器应该分别被配置为：
DLL：（1）
DLH：（2）

问题：2.3 在李工对TVP5146进行配置时，需要编写I²C的读写函数，在进行I²C的读写操作时，需要对I²C的控制寄存器、数据寄存器以及状态寄存器进行配置和查询。具体的写操作流程为：先配置控制寄存器为写模式，再检查状态寄存器，如果准备就绪，则向数据寄存器写数据，写完之后进行状态寄存器查询状态，根据状态退出写操作。具体的读操作流程为：先配置控制寄存器为读模式，再检查状态寄存器，如果准备就绪，则从数据寄存器中读出，然后退出。李工所选用的处理器对应的I²c控制寄存器、数据寄存器、状态寄存器各自的定义如表2.2、表2.3和表2.4所示。

李工所编写的I²C读写函数如下所示:

请将空（1）〜（4）处空缺的代码补充完整。


知识点讲解
· I²C · 编码 · 串口 · 存储器 · 嵌入式系统 · 系统调试 · 信号 · 总线 · Flash · MAX · 电源 · 调试 · 对比度 · 模拟视频 · 视频 · 数据采集 · 写操作

I²C

I²C（Inter-Integrated Circuit）总线是由飞利浦公司开发的两线式串行总线接口，用于连接微控制器及其外围设备。是微电子通信控制领域广泛采用的一种总线标准，如下图所示。它是同步通信的一种特殊形式，具有接口线少，控制方式简单，器件封装形式小，通信速率较高等优点。

I²C总线连接图

I²C接口特点：

（1）I²C串行总线有两根信号线：一根是双向的数据线SDA；另一根是时钟线SCL。所有接到I²C总线上的设备的串行数据都接到总线的SDA线，各设备的时钟线SCL接到总线的SCL。

（2）I²C总线上所有的外围器件都需要唯一的地址，地址由器件地址和引脚地址两部分构成，共7位。器件地址是I²C器件固有的地址编码，器件出厂时就已经给定，不可更改。引脚地址由I²C总线外围器件的地址引脚（A2，A1，A0）决定，根据其在电路中接电源正极，接地或悬空的不同，形成不同的地址代码。引脚地址数决定了同一种器件可接入总线的最大数目。R/W（—）是方向位，R/W（—）=0表示主器件向从器件发送数据，R/W（—）=1表示主器件读取从器件数据。

（3）I²C规程运用主／从双向通信。I²C总线的运行（数据传输）由主机控制。所谓主机即启动数据的传送时（发出启动信号）发出时钟信号，传送结束时发出停止信号的设备，通常主机是微处理器。被主机寻访的设备都称为从机。主机和从机的数据传送，可以由主机发送数据到从机，凡是发送数据到总线的设备称为发送器，也可以是从机发到主机。从总线上接收数据的设备被称为接收器。

总线上可能挂接有多个器件，有时会发生两个或多个主器件同时想占用总线的情况，这种情况叫做总线竞争。I²C总线具有多主控能力，可以对发生在SDA线上的总线竞争进行仲裁，其仲裁原则是这样的：当多个主器件同时想占用总线时，如果某个主器件发送高电平，而另一个主器件发送低电平，则发送电平与此时SDA总线电平不符的那个器件将自动关闭其输出级。总线竞争的仲裁是在两个层次上进行的。首先是地址位的比较，如果主器件寻址同一个从器件，则进入数据位的比较，从而确保了竞争仲裁的可靠性。由于是利用I²C总线上的信息进行仲裁，因此不会造成信息的丢失。

编码

编码过程

在给定了软件设计规格说明书后，下一步的工作就是编写代码。一般来说，编码工作可以分为四个步骤：

（1）确定源程序的标准格式，制订编程规范。

（2）准备编程环境，包括软硬件平台的选择，包括操作系统、编程语言、集成开发环境等。

（3）编写代码。

（4）进行代码审查，以提高编码质量。为提高审查的效率，在代码审查前需要准备一份检查清单，并设定此次审查须找到的bug数量。在审查时，要检查软件规格说明书与编码内容是否一致；代码对硬件和操作系统资源的访问是否正确；中断控制模块是否正确等。

编码准则

在嵌入式系统中，由于资源有限，且实时性和可靠性要求较高，因此，在开发嵌入式软件时，要注意对执行时间、存储空间和开发／维护时间这三种资源的使用进行优化。也就是说，代码的执行速度要越快越好，系统占用的存储空间要越小越好，软件开发和维护的时间要越少越好。

具体来说，在编写代码时，需要做到以下几点：

.保持函数短小精悍。一个函数应该只实现一个功能，如果函数的代码过于复杂，将多个功能混杂在一起，就很难具备可靠性和可维护性。另外，要限制函数的长度，一般来说，一个函数的长度最好不要超过100行。

.封装代码。将数据以及对其进行操作的代码封装在一个实体中，其他代码不能直接访问这些数据。例如，全局变量必须在使用该变量的函数或模块内定义。对代码进行封装的结果就是消除了代码之间的依赖性，提高了对象的内聚性，使封装后的代码对其他行为的依赖性较小。

.消除冗余代码。例如，将一个变量赋给它自己，初始化或设置一个变量后却从不使用它，等等。研究表明，即使是无害的冗余也往往和程序的缺陷高度关联。

.减少实时代码。实时代码不但容易出错、编写成本较高，而且调试成本可能更高。如果可能，最好将对执行时间要求严格的代码转移到一个单独的任务或者程序段中。

.编写优雅流畅的代码。

.遵守代码编写标准并借助检查工具。用自动检验工具寻找缺陷比人工调试便宜，而且能捕捉到通过传统测试检查不到的各种问题。

编码技术

编程规范

在嵌入式软件开发过程中，遵守编程规范，养成良好的编程习惯，这是非常重要的，将直接影响到所编写代码的质量。

编程规范主要涉及的三方面内容：

.命名规则。从编译器的角度，一个合法的变量名由字母、数字和下画线三种字符组成，且第一个字符必须为字母或下画线。但是从程序员的角度，一个好的名字不仅要合法，还要载有足够的信息，做到“见名知意”，并且在语意清晰、不含歧义的前提下，尽可能地简短。

.编码格式。在程序布局时，要使用缩进规则，例如变量的定义和可执行语句要缩进一级，当函数的参数过长时，也要缩进。另外，括弧的使用要整齐配对，要善于使用空格和空行来美化代码。例如，在二元运算符与其运算对象之间，要留有空格；在变量定义和代码之间要留有空行；在不同功能的代码段之间也要用空行隔开。

.注释的书写。注释的典型内容包括：函数的功能描述；设计过程中的决策，如数据结构和算法的选择；错误的处理方式；复杂代码的设计思想等。在书写注释时要注意，注释的内容应该与相应的代码保持一致，同时要避免不必要的注释，过犹不及。

性能优化

由于嵌入式系统对实时性的要求较高，因此一般要求对代码的性能进行优化，使代码的执行速度越快越好。以算术运算为例，在编写代码时，需要仔细地选择和使用算术运算符。一般来说，整数的算术运算最快，其次是带有硬件支持的浮点运算，而用软件来实现的浮点运算是非常慢的。因此，在编码时要遵守以下准则：

.尽量使用整数（char、short、int和long）的加法和减法。

.如果没有硬件支持，尽量避免使用乘法。

.尽量避免使用除法。

.如果没有硬件支持，尽量避免使用浮点数。

下图是一个例子，其中两段代码的功能完全一样，都是对一个结构体数组的各个元素进行初始化，但采用两种不同的方法来实现。下图（a）采用数组下标的方法，在定位第i个数组元素时，需要将i乘以结构体元素的大小，再加上数组的起始地址。下图（b）采用的是指针访问的方法，先把指针fp初始化为数组的起始地址，然后每访问完一个数组元素，就把fp加1，指向下一个元素。在一个奔腾4的PC上，将这两段代码分别重复10 700次，右边这段代码需要1ms，而左边这段代码需要2.13ms。

算术运算性能优化的例子

串口

所谓串行通信就是使数据一位一位地进行传输而实现的通信。当然，在实际传输中，如外部设备与CPU或计算机与计算机之间交换信息，是通过一对导线传送信息的。在传输中每一位数据都占据一个固定的时间长度。与并行通信相比，串行通信具有传输线少、成本低等优点，特别适合远距离传送，其缺点是速度慢，若并行传送n位数据需时间T，则串行传送的时间最少为nT。

RS-232C串口

RS-232C是美国电子工业协会（Electronic Industry Association，EIA）制定的一种串行物理接口标准。RS是英文“推荐标准”的缩写，232为标识号，C表示修改次数。

RS-232C总线标准设有25条信号线，包括一个主通道和一个辅助通道，在多数情况下主要使用主通道，对于一般双工通信，仅需几条信号线就可实现，如一条发送线、一条接收线及一条地线。

RS-232C标准规定的数据传输速率为每秒50、75、100、150、300、600、1200、2400、4800、9600、19200比特。RS-232C标准规定，驱动器允许有2500pF的电容负载，通信距离将受此电容限制。例如，采用150pF/m的通信电缆时，最大通信距离为15m；若每米电缆的电容量减小，通信距离可以增加。传输距离短的另一原因是RS-232属单端信号传送，存在共地噪声和不能抑制共模干扰等问题，因此一般用于20m以内的通信。

嵌入式板卡上一般都配置有串口，并遵循RS-232总线标准。

RS-485串口

在要求通信距离为几十米到上千米时，广泛采用RS-485串行总线标准。RS-485采用平衡发送和差分接收，因此具有抑制共模干扰的能力。加上总线收发器具有高灵敏度，能检测低至200mV的电压，故传输信号能在千米以外得到恢复。

RS-485采用半双工工作方式，任何时候只能有一点处于发送状态，因此，发送电路须由使能信号加以控制。RS-485用于多点互连时非常方便，可以省掉许多信号线。应用RS-485可以联网构成分布式系统，其允许最多并联32台驱动器和32台接收器。

存储器

计算机系统中包括各种存储器，如CPU内部的通用寄存器组和Cache（高速缓存）、CPU外部的Cache、主板上的主存储器、主板外的联机（在线）磁盘存储器以及脱机（离线）的磁带存储器和光盘存储器等。不同特点的存储器通过适当的硬件、软件有机地组合在一起形成计算机的存储体系层次结构，位于更高层的存储设备比较低层次的存储设备速度更快、单位比特造价也更高。其中，Cache和主存之间的交互功能全部由硬件实现，而主存与辅存之间的交互功能可由硬件和软件结合起来实现。

存储器的分类

按存储器所处的位置分类

按存储器所处的位置可分为内存和外存。

（1）内存。也称为主存（Main Memory），设在主机内或主机板上，用来存放机器当前运行所需要的程序和数据，以便向CPU提供信息。相对于外存，其特点是容量小、速度快。

（2）外存。也称为辅存，如磁盘、磁带和光盘等，用来存放当前不参加运行的大量信息，而在需要时调入内存。

按存储器的构成材料分类

按构成存储器的材料可分为磁存储器、半导体存储器和光存储器。

（1）磁存储器。磁存储器是用磁性介质做成的，如磁芯、磁泡、磁膜、磁鼓、磁带及磁盘等。

（2）半导体存储器。根据所用元器件又可分为双极型和MOS型；根据数据是否需要刷新又可分为静态（Static memory）和动态（Dynamic memory）两类。

（3）光存储器。利用光学方法读／写数据的存储器，如光盘（Optical Disk）。

按存储器的工作方式分类

按存储器的工作方式可分为读／写存储器和只读存储器。

（1）读／写存储器（Random Access Memory，RAM）。它指既能读取数据也能存入数据的存储器。按照存储单元的工作原理，随机存储器又分为静态随机存储器（Static RAM，SRAM）和动态随机存储器（Dynamic RAM，DRAM）。SRAM比DRAM更快，也贵得多。

（2）只读存储器。工作过程中仅能读取的存储器，根据数据的写入方式，这种存储器又可细分为ROM、PROM、EPROM和EEPROM等类型。

①固定只读存储器（Read Only Memory，ROM）。这种存储器是在厂家生产时就写好数据的，其内容只能读出，不能改变。一般用于存放系统程序BIOS和用于微程序控制。

②可编程的只读存储器（Programmable Read Only Memory，PROM）。其中的内容可以由用户一次性地写入，写入后不能再修改。

③可擦除可编程的只读存储器（Erasable Programmable Read Only Memory，EPROM）。其中的内容既可以读出，也可以由用户写入，写入后还可以修改。改写的方法是写入之前先用紫外线照射15～20分钟以擦去所有信息，然后再用特殊的电子设备写入信息。

④电擦除可编程的只读存储器（Electrically Erasable Programmable Read Only Memory，EEPROM）。与EPROM相似，EEPROM中的内容既可以读出，也可以进行改写。只不过这种存储器是用电擦除的方法进行数据的改写。

⑤闪存（Flash Memory）。闪存是一种非易失性存储器，基于EEPROM，已成为重要的存储技术，为大量电子设备包括数码相机、手机、PDA、笔记本、台式机和服务器等计算机系统提供快速且持久的存储能力。

存储在ROM设备中的程序通常称为固件（Firmware）。例如，当计算机加电后，它会运行存储在ROM中的固件。

按访问方式分类

按访问方式可分为按地址访问的存储器和按内容访问的存储器。

按寻址方式分类

按寻址方式可分为随机存储器、顺序存储器和直接存储器。

（1）随机存储器（Random Access Memory，RAM）。这种存储器可对任何存储单元存入或读取数据，访问任何一个存储单元所需的时间是相同的。

（2）顺序存储器（Sequentially Addressed Memory，SAM）。访问数据所需要的时间与数据所在的存储位置相关，磁带是典型的顺序存储器。

（3）直接存储器（Direct Addressed Memory，DAM）。介于随机存取和顺序存取之间的一种寻址方式。磁盘是一种直接存取存储器，它对磁道的寻址是随机的，而在一个磁道内则是顺序寻址。

相联存储器

相联存储器是一种按内容访问的存储器。其工作原理就是把数据或数据的某一部分作为关键字，按顺序写入信息，读出时并行地将该关键字与存储器中的每一单元进行比较，找出存储器中所有与关键字相同的数据字，特别适合于信息的检索和更新。

相联存储器的结构如下图所示。

相联存储器的结构框图

相联存储器中，输入检索寄存器用来存放要检索的内容（关键字），屏蔽寄存器用来屏蔽那些不参与检索的字段，比较器将检索的关键字与存储体的每一单元进行比较。为了提高速度，比较器的数量应很大。对于位比较器，应每位对应一个，应有2^m×N个，对于字比较器应有2^m个。匹配寄存器用来记录比较的结果，它应有2^m个二进制位，用来记录2^m个比较器的结果，1为相等（匹配），0为不相等（不匹配）。

相联存储器可用在高速缓冲存储器中，在虚拟存储器中用来作为段表、页表或快表存储器，用在数据库和知识库中。

高速缓存

高速缓存（Cache）由快速半导体存储器构成，用来存放当前最活跃的程序和数据，其内容是主存局部域的副本，对程序员来说是透明的。

高速缓存的组成

Cache存储器中控制部分的功能是判断CPU要访问的信息是否在Cache存储器中，若在即为命中，若不在则没有命中。命中时直接对Cache存储器寻址；未命中时，要按照替换原则决定主存的一块信息放到Cache存储器的哪一块里。

现代CPU中Cache分为了多个层级，如下图所示。

三级Cache示意图

在多级Cache的计算机中，Cache分为一级（L1 Cache）、二级（L2Cache）、三级（L3 Cache）等，CPU访存时首先查找L1 Cache，如果不命中，则访问L2Cache，直到所有级别的Cache都不命中，才访问主存。通常要求L1 Cache的速度足够快，以赶上CPU的主频。如果Cache为两级，则L1 Cache的容量一般都比较小，为几千字节到几十千字节；L2 Cache则具有较高的容量，一般为几百字节到几兆字节，以使高速缓存具有足够高的命中率。

高速缓存中的地址映像方法

在CPU工作时，送出的是主存单元的地址，而应从Cache存储器中读／写信息。这就需要将主存地址转换成Cache存储器的地址，这种地址的转换称为地址映像。Cache的地址映像有如下3种方法。

（1）直接映像。直接映像是指主存的块与Cache块的对应关系是固定的，如下图所示。

直接映像示意图

在这种映像方式下，由于主存中的块只能存放在Cache存储器的相同块号中，因此，只要主存地址中的主存区号与Cache中记录的主存区号相同，则表明访问Cache命中。一旦命中，由主存地址中的区内块号立即可得到要访问的Cache存储器中的块，而块内地址就是主存地址中给出的低位地址。

直接映像方式的优点是地址变换很简单，缺点是灵活性差。例如，不同区号中块号相同的块无法同时调入Cache存储器，即使Cache存储器中有空闲的块也不能利用。

（2）全相联映像。全相联映像如下图所示。同样，主存与Cache存储器均分成大小相同的块。这种映像方式允许主存的任一块可以调入Cache存储器的任何一个块的空间中。

全相联映像示意图

例如，主存为64MB，Cache为32KB，块的大小为4KB（块内地址需要12位），因此主存分为16384块，块号从0～16383，表示块号需要14位，Cache分为8块，块号为0～7，表示块号需3位。存放主存块号的相联存储器需要有Cache块个数相同数目的单元（该例中为8），相联存储器中每个单元记录所存储的主存块的块号，该例中相联存储器每个单元应为14位，共8个单元。

在地址变换时，利用主存地址高位表示的主存块号与Cache中相联存储器所有单元中记录的主存块号进行比较，若相同即为命中。这时相联存储器单元的编号就对应要访问Cache的块号，从而在相应的Cache块中根据块内地址（上例中块内地址是12位，Cache与主存的块内地址是相同的）访问到相应的存储单元。

全相联映像的主要优点是主存的块调入Cache的位置不受限制，十分灵活。其主要缺点是无法从主存块号中直接获得Cache的块号，变换比较复杂，速度比较慢。

（3）组相联映像。这种方式是前面两种方式的折中。具体方法是将Cache中的块再分成组。例如，假定Cache有16块，再将每两块分为1组，则Cache就分为8组。主存同样分区，每区16块，再将每两块分为1组，则每区就分为8组。

组相联映像就是规定组采用直接映像方式而块采用全相联映像方式。也就是说，主存任何区的0组只能存到Cache的0组中，1组只能存到Cache的1组中，以此类推。组内的块则采用全相联映像方式，即一组内的块可以任意存放。也就是说，主存一组中的任一块可以存入Cache相应组的任一块中。

在这种方式下，通过直接映像方式来决定组号，在一组内再用全相联映像方式来决定Cache中的块号。由主存地址高位决定的主存区号与Cache中区号比较可决定是否命中。主存后面的地址即为组号。

替换算法

替换算法的目标就是使Cache获得尽可能高的命中率。常用算法有如下几种。

（1）随机替换算法。就是用随机数发生器产生一个要替换的块号，将该块替换出去。

（2）先进先出算法。就是将最先进入Cache的信息块替换出去。

（3）近期最少使用算法。这种方法是将近期最少使用的Cache中的信息块替换出去。

（4）优化替换算法。这种方法必须先执行一次程序，统计Cache的替换情况。有了这样的先验信息，在第二次执行该程序时便可以用最有效的方式来替换。

Cache性能分析

Cache的性能是计算机系统性能的重要方面。命中率是Cache的一个重要指标，但不是最主要的指标。Cache设计的目标是在成本允许的条件下达到较高的命中率，使存储系统具有最短的平均访问时间。设H_c为Cache的命中率，t_c为Cache的存取时间，t_m为主存的访问时间，则Cache存储器的等效加权平均访问时间t_a为：

t_a=H_ct_c+（1-H_c）t_m=t_c+（1-H_c）（t_m-t_c）

这里假设Cache访问和主存访问是同时启动的，其中，t_c为Cache命中时的访问时间，（t_m-t_c）为失效访问时间。如果在Cache不命中时才启动主存，则

t_a=t_c+（1-H_c）t_m

Cache的命中率与Cache容量的关系如下图所示。Cache容量越大，则命中率越高，随着Cache容量的增加，其失效率接近0%（命中率逐渐接近100%）。但是，增加Cache容量意味着增加Cache的成本和增加Cache的命中时间。

Cache容量与命中率的关系

在指令流水线中，Cache访问作为流水线中的一个操作阶段，Cache失效将影响指令的流水。因此，降低Cache的失效率是提高Cache性能的一项重要措施。当Cache容量比较小时，容量因素在Cache失效中占有比较大的比例。降低Cache失效率的方法主要有选择恰当的块容量、提高Cache的容量和提高Cache的相联度等。

虚拟存储器

在概念上，可以将主存存储器看作一个由若干个字节构成的存储空间，每个字节（称为一个存储单元）有一个地址编号，主存单元的该地址称为物理地址（physical address）。当需要访问主存中的数据时，由CPU给出要访问数据所在的存储单元地址，然后由主存的读写控制部件定位对应的存储单元，对其进行读（或写）操作来完成访问操作。

现代系统提供了一种对主存的抽象，称为虚拟存储（virtual memory），使用虚拟地址（virtual address，由CPU生成）的概念来访问主存，使用专门的MMU（Memory Management Unit）将虚拟地址转换为物理地址后访问主存。设主存容量为4GB，则其简化后的访问操作和内存模型如下图所示。

内存模型及使用虚拟地址访存示意图

虚拟存储器实际上是一种逻辑存储器，实质是对物理存储设备进行逻辑化的处理，并将统一的逻辑视图呈现给用户。因此，用户在使用时，操作的是虚拟设备，无需关心底层的物理环境，从而可以充分利用基于异构平台的存储空间，达到最优化的使用效率。

外存储器

外存储器用来存放暂时不用的程序和数据，并且以文件的形式存储。CPU不能直接访问外存中的程序和数据，只有将其以文件为单位调入主存才可访问。外存储器主要由磁表面存储器（如磁盘、磁带）、光盘存储器及固态硬盘（采用Flash芯片或DRAM作为存储介质的存储器）构成。

磁盘存储器

硬盘是最常见的外存储器。一个硬盘驱动器内可装有多个盘片，组成盘片组，每个盘片都配有一个独立的读／写头。

为了正确地存储信息，将盘片划成许多同心圆，称为磁道（track）。将一个磁道沿圆周划分为若干段，每段称为一个扇区（sector），每个扇区内可存放一个固定长度的数据块，如512字节。一组盘片的所有记录面上相同序号的磁道构成一个柱面（cylinder）。

硬盘的寻址信息由硬盘驱动号、柱面号、磁头号（记录面号）、数据块号（或扇区号）以及交换量组成。

磁盘以扇区大小的块来读写数据。对扇区的访问时间（access time）主要包括以下三个部分：寻道时间（seek time）、旋转时间（rotational latency）和传送时间（transfer time）。

（1）寻道时间。为了读取某个目标扇区的内容，需要将读／写头移动到包含目标扇区的磁道上，这称为寻道时间T_seek。显然，寻道时间与读／写头的移动速度以及其之前的位置有关。通过数千次对随机扇区的寻道操作求平均值来测得平均寻道时间，一般为3～9ms。

（2）旋转时间。一旦读／写头定位至期望的磁道，就等待目标扇区旋转到读／写头的下方，该时间依赖于读／写头到达目标扇区前盘面的位置和旋转速度。在最坏情况下，读／写头刚好错过目标扇区，就必须等待磁盘旋转一周。因此，最大旋转延迟时间T_{max rotaion}为磁盘旋转速度的倒数，平均旋转时间T_{avg rotai}_on为最大旋转延迟时间的一半。

（3）传送时间。当目标扇区的第一个位位于读／写头下方时，就可以开始读或写该扇区的内容了。一个扇区数据的传送时间依赖与旋转速度和每磁道的扇区数目，因此可以粗略估算一个扇区的平均传送时间T_a_{vg transfer}为磁盘旋转速度的倒数乘以每磁道扇区数的倒数。

现代磁盘构造复杂，大容量磁盘采用多区记录技术，将柱面的集合分割成不相交的子集，每个子集称为一个记录区。每个记录区包含一组连续的柱面，一个及记录区中每个柱面的每条磁道有相同数量的扇区，扇区数由最靠近盘片中心的磁道所能包含的扇区数决定。

一个磁盘上可以记录的最大位数称为其最大容量。最大容量由记录密度、磁道密度和面密度决定。

记录密度是指每英寸磁道的段中可以存储的位数。磁道密度是盘片半径方向上每英寸的磁道数。面密度则是记录密度与磁道密度的乘积。

磁盘最大容量等于每扇区字节数×每磁道平均扇区数×每盘面磁道数×每盘片记录面数×盘片数。

磁盘通常以千兆字节（GB）或兆兆字节（TB）为单位来表示磁盘容量，且1GB=10⁹B，1TB=10¹²B。

磁盘控制器必须对磁盘进行格式化后才能存储数据。格式化后的容量通常小于最大容量。

光盘存储器

根据性能和用途，光盘存储器可分为只读型光盘（CD-ROM）、只写一次型光盘（WORM）和可擦除型光盘。只读型光盘是由生产厂家预先用激光在盘片上蚀刻不能再改写的各种信息，目前这类光盘的使用很普遍。只写一次型光盘是指由用户一次写入、可多次读出但不能擦除的光盘，写入方法是利用聚焦激光束的热能，使光盘表面发生永久性变化而实现的。可擦除型光盘是读／写型光盘，它是利用激光照射引起介质的可逆性物理变化来记录信息。

光盘存储器由光学、电学和机械部件等组成。其特点是记录密度高、存储容量大、采用非接触式读／写信息（光头距离光盘通常为2mm）、信息可长期保存（其寿命达10年以上）、采用多通道记录时数据传送率可超过200Mb/s、制造成本低、对机械结构的精度要求不高、存取时间较长。

固态硬盘

固态硬盘（Solid State Disk，SSD）的存储介质分为两种，一种是采用闪存（FLASH芯片）作为存储介质；另一种是采用DRAM作为存储介质。

基于闪存的固态硬盘是固态硬盘的主要类别，其主体是一块PCB板，板上最基本的配件就是控制芯片、缓存芯片和用于存储数据的闪存芯片。主控芯片是固态硬盘的大脑，其作用有两个：一是合理调配数据在各个闪存芯片上的负荷；二是承担数据中转的作用，连接闪存芯片和外部SATA或USB接口。不同主控芯片差异很大，在数据处理能力、算法，对闪存芯片的读写控制方面会有非常大的不同，直接会导致固态硬盘产品在性能上差距很大。

一个闪存由多个块、每块由多页组成，通常页的大小为512B～4KB，块的大小为32～128页。在闪存中，数据是以页为单位读写的。只有在一个页所在的块被整体擦除后，才能写入该页。写一个块重复写入限定次数（例如100000）后，该块就会磨损坏而不能再使用。如果一个固态硬盘的主控芯片中磨损逻辑处理得好，就可以用很多年。

SSD的读操作比写操作要快，顺序读写操作比随机读写操作要快。进行随机写操作时，要擦除整块，因此需要较长的时间。另外，如果写操作试图修改一个包含其他有用数据的块，则需要将有用数据复制到一个新擦除的块中，然后才能进行写入操作。

固态硬盘的接口规范和定义、功能及使用方法上与普通硬盘基本相同，外形和尺寸也基本与普通的2.5英寸硬盘一致。

固态硬盘虽然价格仍较为昂贵，容量较低，但是由于具有传统机械硬盘不具备的快速读写、质量轻、能耗低以及体积小等特点，因此常作为传统机械式硬盘的替代品使用。

磁盘阵列技术

磁盘阵列是由多台磁盘存储器组成的一个快速、大容量、高可靠的外存子系统。现在常见的磁盘阵列称为廉价冗余磁盘阵列（Redundant Array of Independent Disk，RAID）。

虽然RAID包含多块硬盘，但从用户视角看则是一个独立的大型存储设备。RAID可以充分发挥出多块硬盘的优势，实现远超出任何一块单独硬盘的速度和吞吐量。除了性能上的提高之外，RAID还可以提供良好的容错能力。RAID技术分为几种不同的等级，分别可以提供不同的速度、安全性和性价比。

目前，常见的RAID如下表所示。

廉价冗余磁盘阵列

除此之外，上述各种类型的RAID还可以组合起来，构成复合型的RAID，此处不再赘述。

存储域网络

存储域网络是连接服务器与存储设备的网络，它能够将多个分布在不同地点的RAID组织成一个逻辑存储设备，供多个服务器共享访问，如下图所示。通过网络将一个或多个服务器与多个存储设备连接起来，每个存储设备可以是RAID、磁带备份系统、磁带库和CD-ROM库等，构成了存储域网络（Storage Area Network，SAN）。这样的网络不仅解决服务器对存储容量的要求，还可以使多个服务器之间可以共享文件系统和辅助存储空间，避免数据和程序代码的重复存储，提高存储器的利用率。另外，SAN还实现了分布式存储系统的集中管理，降低了大容量存储系统的管理成本，提高了管理效率。

SAN的结构

嵌入式系统

嵌入式计算机系统是与特定功能的设备集成在一起、且隐藏在这个功能系统内部为预定任务而设计的计算机系统。该计算机可对设备的状态进行采集，包括操作者的命令和受控对象的状态，按照设备所要求的、预先设定的特定规律进行计算，计算结果作为命令输出到设备的某些部件，控制某些操作，同时将人所关心的信息显示给操作者。一个典型的嵌入式系统如下图所示。

嵌入式系统组成

上述嵌入式系统的输入、处理、输出的各个部分，一般情况下都是通过软件运行完成的。因此嵌入式软件是嵌入式系统的重要组成部分，而且体现了系统的思想、方法和规律。

在当今社会中，嵌入式系统已经和我们的生活息息相关，人们每时每刻都离不了嵌入式系统，如下图所示。

嵌入式系统基本分类

嵌入式系统一般是实时系统，《牛津计算机字典》对实时系统解释是：“系统的输入对应于一个外部物理世界的运动，而系统输出对应着另外一个物理世界的运动，而这两个运动的时间差必须在可接受的足够小的范围内，实时性就体现在从输入到形成输出所需的时间。”实时系统又进一步定义为硬实时系统和软实时系统两种，如下表所示。

实时系统分类及其特性

一般认为，嵌入式计算机相对于个人计算机或超级计算机，在软件或硬件上的资源是有限的，硬件资源体现在处理速度、功耗、存储空间等方面，软件资源指有限的应用、有限的操作系统支持、应用代码量少等方面。

第一款大批量生产的嵌入式系统是美国1961年发布的民兵Ⅰ型导弹内嵌的D-17自动制导计算机。

随着20世纪60年代早期应用开始，嵌入式系统的价格迅速降低，同时处理功能和能力获得快速提高。以第一款单片机Intel 4004为例，在存储器和外围芯片的配套使用下，实现了计算器和其他小型系统。1978年，美国国家工程制造商协会发布了可编程单片机的“标准”，涵盖了几乎所有以计算机为基础的控制器，如单板计算机、数控设备以及基于事件的控制器，使得微处理器得到了快速发展。

无一例外，不断发展中的嵌入式计算功能的实现都通过用户需求驱动、顶层定义、硬件定义开始，但核心是软件的算法处理，实际上类似硬件功能通过不同软件的控制就可以实现不同用户所需要的嵌入式功能，如下图所示。

嵌入式计算机的层次化架构

当基础硬件接口、计算和存储资源、总线与网络乃至各种传感器、作动器、液压等以模块化、通用化、组合化等变得越来越成熟，他们就可以方便地组合成硬件平台。而软件却恰恰相反，基本是为满足人类某种新的设想或应用要求开始进行新的设计。这些设计从诸如领域、实现功能、性能、可靠性、安全性等方面，可以是全新理念设备、或是适应性修改升级等途径，都会导致软件有不同程度的差异。

嵌入式系统具有以下特征：

（1）嵌入式系统的时间敏感性。嵌入式实时系统对时间响应都是有要求的。例如对于一个设备的运动控制系统，从操作指令发出，嵌入式计算机根据指令和外部条件计算并输出到动作器的动作，要保证在所有的条件下、在确定的时间内产生所需的输出。这对于设计者来说，一般的实时系统都会围绕这个关键需求进行系统设计。另外为了满足时间敏感性要求，确保在最复杂行为和最大延时情况下，系统操作不发生延迟，要求处理器的利用率要有40%左右的余量。有时为满足某些强实时嵌入式系统的应答时间限定在毫秒级或更低，需要在高级语言中嵌入低级语言编程实现。

（2）嵌入式系统的可靠性和安全性。嵌入式计算机系统的失效带来的可能是个人娱乐系统故障的微小损失，可能是铁路信号失效的巨额经济损失，也可能是战略武器控制等经济损失以及重大的社会政治影响等。所以在某种设计缺陷被诱发后，对于不同的系统需要采取不同的策略，例如对具有重大影响的系统，要求计算机或计算机软件对设计缺陷、制造缺陷等失效采取“永不放弃”的安全性设计技术，将损失控制在可接受的范围内。在有人为输入情况下，嵌入式系统还需考虑最大可能地减少人为失误所引起的系统失效。这些算法或机制可以是输入有效性合理性检查、硬件容错、软件容错、错误后的系统缓慢降级、系统进入安全模式等。

（3）嵌入式软件的复杂性。软件复杂度取决于问题规模和复杂度。简单问题的软件可由个人完成，甚至可以进行软件正确性证明；即使过程中更换人员，花费少许时间就可掌握和维护。但如汽车控制、飞机控制等大型复杂软件，其需要根据复杂的外部输入、按照多变量物理规律和人们的预期，实现预定的功能。软件需要根据系统的外部事件及其组合，考虑各种处理、逻辑、时序、边界、超出边界的鲁棒性等进行详细算法和策略研究。还需要考虑如安全性、可靠性、维护性等质量要求。更困难的是大规模软件需要团队联合定义、并行开发、持续维护，同时考虑处理平台限制条件。

系统调试

调试的任务就是根据测试时所发现的错误，找出原因和具体的位置，进行改正。调试工作主要由程序开发人员来进行，谁开发的程序就由谁来进行调试。

目前常用的调试方法有如下几种。

（1）试探法。调试人员分析错误的症状，猜测问题的所在位置，利用在程序中设置输出语句，分析寄存器、存储器的内容等手段来获得错误的线索，一步步地试探和分析出错误所在。这种方法效率很低，适合于结构比较简单的程序。

（2）回溯法。调试人员从发现错误症状的位置开始，人工沿着程序的控制流程往回跟踪代码，直到找出错误根源为止。这种方法适合于小型程序，对于大规模程序，由于其需要回溯的路径太多而变得不可操作。

（3）对分查找法。这种方法主要用来缩小错误的范围，如果已经知道程序中的变量在若干位置的正确取值，可以在这些位置上给这些变量以正确值，观察程序运行输出结果，如果没有发现问题，则说明从赋予变量一个正确值到输出结果之间的程序没有错误，问题可能在除此之外的程序中。否则，错误就在所考察的这部分程序中，对含有错误的程序段再使用这种方法，直到把故障范围缩小到比较容易诊断为止。

（4）归纳法。归纳法就是从测试所暴露的问题出发，收集所有正确或不正确的数据，分析它们之间的关系，提出假想的错误原因，用这些数据来证明或反驳，从而查出错误所在。

（5）演绎法。根据测试结果，列出所有可能的错误原因。分析已有的数据，排除不可能和彼此矛盾的原因。对其余的原因，选择可能性最大的，利用已有的数据完善该假设，使假设更具体。用假设来解释所有的原始测试结果，如果能解释这一切，则假设得以证实，也就找出错误；否则，要么是假设不完备或不成立，要么有多个错误同时存在，需要重新分析，提出新的假设，直到发现错误为止。

信号

任务间同步的另一种方式是异步信号。在两个任务之间，可以通过相互发送信号的方式，来协调它们之间的运行步调。

所谓的信号，指的是系统给任务的一个指示，表明某个异步事件已经发生了。该事件可能来自于外部（如其他的任务、硬件或定时器），也可能来自于内部（如执行指令出错）。异步信号管理允许任务定义一个异步信号服务例程ASR（Asynchronous Signal Routine），与中断服务程序不同的是，ASR是与特定的任务相对应的。当一个任务正在运行的时候，如果它收到了一个信号，将暂停执行当前的指令，转而切换到相应的信号服务例程去运行。不过这种切换不是任务之间的切换，因为信号服务例程通常还是在当前任务的上下文环境中运行的。

信号机制与中断处理机制非常相似，但又各有不同。它们的相同点是：

.都具有中断性：在处理中断和异步信号时，都要暂时地中断当前任务的运行；

.都有相应的服务程序；

.都可以屏蔽响应：外部硬件中断可以通过相应的寄存器操作来屏蔽，任务也能够选择不对异步信号进行响应。

信号机制与中断机制的不同点是：

.中断是由硬件或特定的指令产生，而信号是由系统调用产生；

.中断触发后，硬件会根据中断向量找到相应的处理程序去执行；而信号则通过发送信号的系统调用来触发，但系统不一定马上对它进行处理；

.中断处理程序是在系统内核的上下文中运行，是全局的；而信号处理程序是在相关任务的上下文中运行，是任务的一个组成部分。

实时系统中不同的任务经常需要互斥地访问共享资源。当任务试图访问资源时被正使用该资源的其他任务阻塞，可能出现优先级反转的现象，即当高优先级任务企图访问已被某低优先级任务占有的共享资源时，高优先级任务必须等待直到低优先级任务释放它占有的资源。如果该低优先级任务又被一个或多个中等优先级任务阻塞，问题就更加严重。由于低优先级任务得不到执行就不能访问资源、释放资源。于是低优先级任务就以一个不确定的时间阻塞高优先级的任务，导致系统的实时性没有保障。下图为是一个优先级反转的示例。

一个优先级反转的示例

如上图所示，系统存在任务1、任务2、任务3（优先级从高到低排列）和资源R。某时，任务1和任务2都被阻塞，任务3运行且占用资源R。一段时间后，任务1和任务2相继就绪，任务1抢占任务3运行，由于申请资源R失败任务1被挂起。由于任务2的优先级高于任务3，任务2运行。由于任务3不能运行和释放资源R，因此任务1一直被阻塞。极端情况下，任务1永远无法运行，处于饿死状态。

解决优先级反转问题的常用算法有优先级继承和优先级天花板。

优先级继承协议

L. Sha、R. Rajkumar和J. P. Lehoczky针对资源访问控制提出了优先级继承协议（Priority Inheritance Protocol，PIP）。

PIP协议能与任何优先级驱动的抢占式调度算法配合使用，而且不需要有关任务访问资源情况的先验知识。优先级继承协议的执行方式是：当低优先级任务正在使用资源，高优先级任务抢占执行后也要访问该资源时，低优先级任务将提升自身的优先级到高优先级任务的级别，保证低优先级任务继续使用当前资源，以尽快完成访问，尽快释放占用的资源。这样就使高优先级任务得以执行，从而减少高优先级任务被多个低优先级任务阻塞的时间。低优先级任务在运行中，继承了高优先级任务的优先级，所以该协议被称作优先级继承协议。

由于只有高优先级任务访问正被低优先级任务使用的资源时，优先级继承才会发生，在此之前，高优先级任务能够抢占低优先级任务并执行，所以优先级继承协议不能防止死锁，而且阻塞是可以传递的，会形成链式阻塞。另外，优先级继承协议不能将任务所经历的阻塞时间减少到尽可能小的某个范围内。最坏情况下，一个需要μ个资源，并且与v个低优先级任务冲突的任务可能被阻塞min（μ，v）次。

优先级冲顶协议

J. B. Goodenough和L. Sha针对资源访问控制提出了优先级冲顶协议（Priority Ceiling Protocol，PCP）。

PCP协议扩展了PIP协议，能防止死锁和减少高优先级任务经历的阻塞时间。该协议假设所有任务分配的优先级都是固定的，每个任务需要的资源在执行前就已确定。每个资源都具有优先级冲顶值，等于所有访问该资源的任务中具有的最高优先级。任一时刻，当前系统冲顶值（current priority ceiling）等于所有正被使用资源具有的最高冲顶值。如果当前没有资源被访问，则当前系统冲顶值等于一个不存在的最小优先级。当任务试图访问一个资源时，只有其优先级高于当前系统冲顶值，或其未释放资源的冲顶值等于当前系统冲顶值才能获得资源，否则会被阻塞。而造成阻塞的低优先级任务将继承该高优先级任务的优先级。

已经证明，PCP协议的执行规则能防止死锁，但其代价是高优先级任务可能会经历优先级冲顶阻塞（Priority ceiling blocking）。即高优先级任务可能被一个正使用某资源的低优先级任务阻塞，而该资源并不是高优先级任务请求的。这种阻塞又被称作回避阻塞（avoidance blocking），意思是因为回避死锁而引起的阻塞。即使如此，在PCP协议下，每个高优先级任务至多被低优先级任务阻塞一次。使用PCP协议后，能静态分析和确定任务之间的资源竞争，计算出任务可能经历的最大阻塞时间，从而能分析任务集合的可调度性。在PCP协议下，高优先级任务被阻塞时会放弃处理器，因此，访问共享资源的任务可能会产生4次现场切换。

总线

计算机系统中的总线（Bus）是指计算机设备和设备之间传输信息的公共数据通道，是连接计算机硬件系统内多种设备的通信线路，它的一个重要特征是由总线上的所有设备共享，因此可以将计算机系统内的多种设备以总线方式进行连接。

总线的分类

按照所传输的信号类型可将总线分为数据总线、地址总线和控制总线3类。不同型号的CPU芯片，其数据总线、地址总线和控制总线的条数可能不同。

.数据总线（Data Bus，DB）用来传送数据信息，是双向的。CPU既可通过DB从内存或输入设备读入数据，也可通过DB将内部数据送至内存或输出设备。DB的宽度决定了CPU和计算机其他设备之间每次交换数据的位数。

.地址总线（Address Bus，AB）用于传送CPU发出的地址信息，是单向的。传送地址信息的目的是指明与CPU交换信息的内存单元或I/O设备。存储器是按地址访问的，所以每个存储单元都有一个固定地址，要访问1MB存储器中的任一单元，需要给出2²⁰个地址，即需要20位地址（2²⁰=1M）。因此，地址总线的宽度决定了CPU的最大寻址能力。

.控制总线（Control Bus，CB）用来传送控制信号、时序信号和状态信息等。其中有的信号是CPU向内存或外部设备发出的信息，有的是内存或外部设备向CPU发出的信息。显然，CB中的每一条线的信息传送方向是单方向且确定的，但CB作为一个整体则是双向的。所以，在各种结构框图中，凡涉及到控制总线CB，均是以双向线表示。

总线的性能直接影响到整机系统的性能，而且任何系统的研制和外围模块的开发都必须依从所采用的总线规范。总线技术随着微机结构的改进而不断发展与完善。

在计算机的概念模型中，CPU通过系统总线和存储器之间直接进行通信。实际上在现代的计算机中，存在一个控制芯片的模块。CPU需要和存储器，I/O设备等进行交互，会有多种不同功能的控制芯片，称之为控制芯片组。对于目前的计算机结构来说，控制芯片集成在主板上，典型的有南北桥结构和单芯片结构。与芯片相连接的总线可以分为前端总线（FSB）、存储总线、I/O总线、扩展总线等。

南北桥芯片结构

北桥芯片直接与CPU、内存、显卡、南桥相连，控制着CPU的类型、主板的总线频率、内存控制器、显示核心等。前端总线（FSB）是将CPU连接到北桥芯片的总线。内存总线是将内存连接到北桥芯片的总线。用于和北桥之间的通信，显卡则通过I/O总线连接到北桥芯片。

南桥芯片主要负责外部设备接口与内部CPU的联系，其中，通过I/O总线连接外部I/O设备连接到南桥，例如USB设备、ATA和SATA设备以及一些扩展接口，扩展总线则指是主板上提供的一些PCI、ISA等插槽。

单芯片结构

单芯片组方式取消了北桥。由于CPU中内置了内存控制器，不再需要通过北桥来控制，这样就能提高内存控制器的频率，减少延迟。还有一些CPU还集成了显示单元，使得显示芯片的频率更高，延迟更低。

常见总线

（1）ISA总线。ISA是工业标准总线，只支持16位I/O设备，数据传输率大约是16Mb/s，也称为AT标准。

（2）EISA总线。EISA是在ISA总线的基础上发展起来的32位总线。该总线定义32位地址线、32位数据线以及其他控制信号线、电源线、地线等共196个接点。总线传输速率达33MB/s。

（3）PCI总线。PCI总线是目前微型机上广泛采用的内总线，采用并行传输方式。PCI总线有适于32位机的124个信号的标准和适于64位机的188个信号的标准。PCI总线的传输速率至少为133MB/s，64位PCI总线的传输速率为266MB/s。PCI总线的工作与CPU的工作是相互独立的，也就是说，PCI总线时钟与处理器时钟是独立的、非同步的。PCI总线上的设备是即插即用的。接在PCI总线上的设备均可以提出总线请求，通过PCI管理器中的仲裁机构允许该设备成为主控设备，主控设备与从属设备间可以进行点对点的数据传输。PCI总线能够对所传输的地址和数据信号进行奇偶校验检测。

（4）PCI Express总线。PCI Express简称为PCI-E，采用点对点串行连接，每个设备都有自己的专用连接，不需要向整个总线请求带宽，而且可以把数据传输率提高到一个很高的频率。相对于传统PCI总线在单一时间周期内只能实现单向传输，PCI Express的双单工连接能提供更高的传输速率和质量。

PCI Express的接口根据总线位宽不同而有所差异，包括X1、X4、X8以及X16（X2模式将用于内部接口而非插槽模式），其中X1的传输速度为250MB/s，而X16就是等于16倍于X1的速度，即是4GB/s。较短的PCI Express卡可以插入较长的PCI Express插槽中使用。PCI Express接口能够支持热拔插。同时，PCI Express总线支持双向传输模式，还可以运行全双工模式，它的双单工连接能提供更高的传输速率和质量，它们之间的差异与半双工和全双工类似。因此连接的每个装置都可以使用最大带宽。

（5）前端总线。微机系统中，前端总线（Front Side Bus，FSB）是将CPU连接到北桥芯片的总线。需要注意主板和CPU的搭配问题。一般来说，如果CPU不超频，那么前端总线是由CPU决定的，如果主板不支持CPU所需要的前端总线，系统就无法工作。

通常情况下，一个CPU默认的前端总线是唯一的。北桥芯片负责联系内存、显卡等数据吞吐量最大的部件，并与南桥芯片连接。CPU通过前端总线（FSB）连接到北桥芯片，进而通过北桥芯片与内存、显卡交换数据。FSB是CPU和外界交换数据的最主要通道，因此FSB的数据传输能力对计算机整体性能作用很大，如果没足够快的FSB，再强的CPU也不能明显提高计算机整体速度。

（6）RS-232C。RS-232C是一条串行外总线，其主要特点是所需传输线比较少，只需三条线（一条发、一条收、一条地线）即可实现全双工通信。传送距离远，用电平传送为15m，电流环传送可达千米。有多种可供选择的传送速率。采用非归零码负逻辑工作，电平≤-3V为逻辑1，而电平≥+3V为逻辑0，具有较好的抗干扰性。

（7）SCSI总线。小型计算机系统接口（SCSI）是一条并行外总线，广泛用于连接软硬磁盘、光盘、扫描仪等。该接口总线早期是8位的，后来发展到16位。传输速率由SCSI-1的5MB/s到16位的Ultra2 SCSI的80MB/s。今天的传输速率已高达320MB/s。该总线上最多可接63种外设，传输距离可达20m（差分传送）。

（8）SATA。SATA是Serial ATA的缩写，即串行ATA。它主要用作主板和大量存储设备（如硬盘及光盘驱动器）之间的数据传输之用。SATA总线使用嵌入式时钟信号，具备了更强的纠错能力，与以往相比其最大的区别在于能对传输指令（不仅仅是数据）进行检查，如果发现错误会自动矫正，这在很大程度上提高了数据传输的可靠性。串行接口还具有结构简单、支持热插拔的优点。

（9）USB。通用串行总线（USB）当前风头正劲，近几年得到十分广泛的应用。USB由4条信号线组成，其中两条用于传送数据，另外两条传送+5V容量为500mA的电源。可以经过集线器（Hub）进行树状连接，最多可达5层。该总线上可接127个设备。USB 1.0有两种传送速率：低速为1.5MB/s，高速为12MB/s。USB 2.0的传送速率为480MB/s。USB总线最大的优点还在于它支持即插即用，并支持热插拔。

（10）IEEE-1394。IEEE-1394是高速串行外总线，近几年得到广泛应用。IEEE-1394也支持外设热插拔，可为外设提供电源，省去了外设自带的电源，能连接多个不同设备，支持同步和异步数据传输。IEEE-1394由6条信号线组成，其中两条用于传送数据，两条传送控制信号，另外两条传送8～40V容量为1500mA的电源，IEEE-1394总线理论上可接63个设备。IEEE-1394的传送速率从400MB/s、800MB/s、1600MB/s直到3.2GB/s。

（11）IEEE-488总线。IEEE-488是并行总线接口标准。微计算机、数字电压表、数码显示器等设备及其他仪器仪表均可用IEEE-488总线连接装配，它按照位并行、字节串行双向异步方式传输信号，连接方式为总线方式，仪器设备不需中介单元直接并联于总线上。总线上最多可连接15台设备。最大传输距离为20m，信号传输速度一般为500Kb/s，最大传输速度为1MB/s。

Flash

Flash是Macromedia公司推出的一款设计与制作动画的专业软件。Flash的前身是FutureSplash，1996年11月被正式卖给Macromedia，更名为Flash 1.0。经过Macromedia近十年的经营，推出了十个版本，Flash已经发展为一款风靡Internet的二维动画设计与制作软件，取代了GIF等动画的地位，成为这一领域的霸主。2005年，Adobe公司耗资34亿美元并购了Macromedia，从此Flash冠上了Adobe的头衔，陆续推出了Adobe Flash CS3、Adobe Flash CS4版本，开始了新的征程。

Flash具有友好的操作界面，易学易用。Flash支持SWF、AVI、EXE等多种动画格式输出，适用于在线、离线观看动画，或将动画嵌入其他程序中播放。Flash生成的文件体积小，易于网络传输。Flash采用矢量图形和流式播放技术生成动画，生成的动画文件体积小，图像不易失真，可自由缩放，可自动调整图像尺寸，文件大小不会改变，适应于网络流式传输。Flash功能强大，使得设计者可以随心所欲地设计出高品质的动画，通过ActionScript脚本语言可以实现交互，使Flash具有更高的设计自由度。

MAX

用途：返回数据集中的最大数值。语法：MAX(number1，number2，…)。参数：Number1，number2，…是需要找出最大数值的参数。例如，B1=66、B2=30、B3=68、B4=86、B5=78、B6=84、B7=88，则公式“=MAX(B1:B7)”返回88。

电源

（1）设备间内安放计算机主机时，应按照计算机主机电源要求进行工程设计。

（2）设备间内安放程控用户交换机时应按照《工业企业程控用户交换机工程设计规范》CECS09：1989进行工程设计。

（3）设备间、交接间应用可靠的交流220V、50Hz电源供电。

设备间应由可靠交流电源供电，不要用邻近的照明开关来控制这些电源插座，减少偶然断电事故发生。

调试

调试的任务就是根据测试时所发现的错误，找出原因和具体的位置，进行改正。调试主要由程序开发人员来进行，谁开发的程序就由谁来进行调试。常用的调试方法有试探法、回溯法、对分查找法、归纳法和演绎法。

对比度

对比度主要体现在大小对比、明暗对比、粗细对比、几何形状对比、质感对比、位置对比、多重对比等方面。利用对比度的适当搭配，可以突出重点、吸引人的视线。例如，明暗对比是色感中最基本的要素，明亮的物体往往在暗色背景中显得非常突出。

模拟视频

模拟视频（Analog Video）是一种传输图像和声音的连续的变动电信号。电视传播的信号是模拟信号。电视信号记录的是连续的图像或视像以及伴音（声音）信号。电视信号通过光栅扫描的方法显示在荧光屏（屏幕）上，扫描从荧光屏的顶部开始，一行一行地向下扫描，直至荧光屏的最底部，然后返回到顶部，重新开始扫描。这个过程产生的一个有序的图像信号的集合，组成了电视图像中的一幅图像，称为一帧，连续不断的图像序列就形成了动态视频图像。水平扫描线所能分辨出的点数称为水平分辨率，一帧中垂直扫描的行数称为垂直分辨率。一般来说，点越小，线越细，分辨率越高。每秒钟所扫描的帧数称作帧频，一般在每秒25帧时人眼就不会感觉到闪烁。彩色电视系统采用相加混色，使用RGB作为三基色进行配色，产生R、G、B三个输出信号。RGB信号可以分别传输，也可以组合起来传输。根据亮色度原理，任何彩色信号都可以分解为亮度和色度。

世界上现行的彩色电视制式主要有NTSC制、PAL制和SECAM制3种。美国、加拿大、日本、韩国、菲律宾、中国台湾等国家和地区采用NTSC制式；中国（含香港地区）、德国、英国、新西兰等国家采用PAL制式；法国、东欧、中东一带采用SECAM制式。

视频

视频是动态的画面序列，这些画面以超过每秒24帧的速度播放，便可以使观察者产生平滑、连续的视觉效果。视频类似于我们熟知的电影和电视，有声有色。电影采用了每秒24幅画面的播放速度，电视采用了每秒25幅或30幅画面的播放速度。视频图像可来自于录像带、影碟、电视、摄像机等，这些模拟视频信号可通过视频采集卡转换成数字视频信号，以便计算机进行处理和存储。

数据采集

数据采集阶段的主要任务就是获取各个不同数据源的各类数据，按照统一的标准进行数据的转换、清洗等工作，以形成后续数据处理的符合标准要求的数据集。

原始数据往往形式多样，包括：结构化数据，例如业务系统中的交易明细、操作日志等；非结构化数据，例如企业中的各种文档数据，视频、音频等数据；半结构化数据，例如Web页面的HTML文档等。而且其来源和种类也存在很大差距。

当前的大数据处理中，数据的种类一般包括：

.传感数据：传感数据是由感知设备或传感设备感受、测量及传输的数据。这些感知设备或传感设备实时和动态地收集大量的时序传感数据资源。传感数据种类有很多，如人身体的传感数据，网络信号的传感数据和气象的传感数据等。近年来随着物联网、工业互联网的日益发展，传感数据越来越丰富，人们也逐渐发现了其数据价值。

.业务数据：企业业务系统在执行日常业务活动时产生的大量数据，包括设备工况、操作记录、交易流水，以及用户在使用系统时遗留下来的大量行为数据。这些数据反映了人或者物的属性、偏好，在推荐或预测系统中有很大的利用价值。

.人工输入数据：用户通过软件人机交互等主动输入的数据，典型代表是微博、微信、抖音等系统的用户输入数据。随着互联网的不断深入，手机APP应用的不断发展，这种用户产生的数据也越来越多，越来越丰富。

.科学数据：通过科学研究和科学实验不断搜集和汇聚的数据，一般是以电子记录或文本的形式存在。

从大数据的来源进行划分，其种类包括：

.企业数据：企业自建的各种业务系统，如ERP、在线交易系统、招聘系统等，也会产生各种数据集。

.政府数据：政府信息化已发展多年，构建了很多业务数据。近年来政府也在不断地建设大数据中心，发布各种数据，包括人社、医疗、税务、工商、财务等。

.互联网数据：互联网数据是当前大数据应用的一个重要的数据来源。互联网上存在各种应用沉淀下来的大量数据，包括门户网站、社交信息、电商网站等等。

其中，企业数据一般属于内部数据，而政府数据、互联网数据往往属于外部数据。

从上面大数据的分类可以看出，数据来源渠道众多，差异非常大。因此，数据采集的主要任务就是进行数据的汇聚，为后续的数据处理做好准备。这个阶段工作中主要涉及的技术包括针对内部数据的数据集成和ETL技术，针对外部数据，尤其是互联网数据的爬虫技术。

数据集成是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中，从而为企业提供全面的数据共享。在企业数据集成领域，已经有很多成熟的框架可以利用。目前通常采用联邦式、基于中间件模型和数据仓库等方法来构造集成的系统，这些技术在不同的着重点和应用上解决数据共享和为企业提供决策支持。

ETL（Extract Transform Load）用来描述将数据从来源端经过抽取（extract）、转换（transform）、加载（load）至目的端的过程。目的是将企业中的分散、零乱、标准不统一的数据整合到一起，为企业的决策提供分析依据。

基本的ETL体系结构示意图如下图所示。

ETL体系结构示意图

ETL过程中的主要环节是数据抽取、数据转换和加工、数据加载。一般ETL工具中，围绕上述三个核心环节进行了功能上的扩充，例如工作流、调度引擎、规则引擎、脚本支持和统计信息等，尽量降低ETL阶段的工作强度，减少工作量。

数据转换和加工是三个环节的重点，因为抽取的数据中往往存在各种问题，例如数据格式不一致、数据输入错误、字段不匹配、字段类型不符、数据不完整等。ETL一般以组件化的方式实现数据转换和加工。常用的数据转换组件有字段映射、数据过滤、数据清洗、数据替换、数据计算、数据验证、数据加解密、数据合并、数据拆分等，并以工作流的形式进行各种方式的组合，以满足数据转换的需求。有的ETL工具也提供脚本支持，满足用户定制化的数据转换需求。

常用的ETL工具有三种：DataStage、Informatica PowerCenter和Kettle。

.DataStage：IBM公司的DataStage是一种数据集成软件平台，专门针对多种数据源的ETL过程进行了简化和自动化，同时提供图形框架，用户可以使用该框架来设计和运行用于变换和清理、加载数据的作业。它能够处理的数据源有主机系统的大型数据库、开发系统上的关系数据库和普通的文件系统。

.Informatica PowerCenter：Informatica公司开发的为满足企业级需求而设计的企业数据集成平台。可以支持各类数据源，包括结构化、半结构化和非结构化数据。提供丰富的数据转换组件和工作流支持。

.Kettle：Kettle是一款国外开源的ETL工具，纯Java编写，可以在Windows、Linux、UNIX上运行，数据抽取高效稳定。管理来自不同数据库的数据，提供图形化的操作界面，提供工作流支持。Kettle中有两种脚本文件，transformation和job，transformation完成针对数据的基础转换，job则完成整个工作流的控制。Kettle包括4个产品：Spoon、Pan、Chef、Kitchen。Spoon通过图形界面来设计ETL转换过程（Transformation）。Pan批量运行由Spoon设计的ETL转换（例如使用一个时间调度器），是一个后台执行的程序，没有图形界面。Chef创建任务（Job），任务通过允许每个转换、任务、脚本等等，更有利于自动化更新数据仓库的复杂工作。Kitchen批量使用由Chef设计的任务（例如使用一个时间调度器）。

由于很多大数据应用都需要来自互联网的外部数据，因此，爬虫技术也称为数据采集阶段的一个主要基础性的技术。

网络爬虫（又称为网页蜘蛛，网络机器人），是一种按照一定的规则，自动地抓取互联网信息的程序或者脚本。网络爬虫基本的体系结构如下图所示。

爬虫框架示意图

爬虫调度器主要负责统筹其他四个模块的协调工作。URL管理器负责管理URL链接，维护已经爬取的URL集合和未爬取的URL集合，提供获取新URL链接的接口。HTML下载器用于从URL管理器中获取未爬取的URL链接并下载HTML网页。HTML解析器用于从HTML下载器中获取已经下载的HTML网页，并从中解析出新的URL链接交给URL管理器，解析出有效数据交给数据存储器。

网络爬虫大致可以分为以下几种类型：通用网络爬虫、聚焦网络爬虫、深层网络（Deep Web）爬虫。实际的大数据应用由于往往聚焦于某个特定的应用目标，其采用的网络爬虫系统通常是聚焦网络爬虫、深层网络爬虫技术相结合实现的。

通用网络爬虫，爬行对象从一些种子URL扩充到整个Web，主要为门户站点搜索引擎和大型Web服务提供商采集数据。通用网络爬虫的结构大致可以分为页面爬行模块、页面分析模块、链接过滤模块、页面数据库、URL队列、初始URL集合几个部分。为提高工作效率，通用网络爬虫会采取一定的爬行策略。常用的爬行策略有：深度优先策略、广度优先策略。

聚焦网络爬虫，是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。和通用网络爬虫相比，聚焦爬虫只需要爬行与主题相关的页面，可以很好地满足一些特定人群对特定领域信息的需求。聚焦网络爬虫和通用网络爬虫相比，增加了链接评价模块以及内容评价模块。聚焦爬虫爬行策略实现的关键是评价页面内容和链接的重要性，常见的爬行策略有基于内容评价的爬行策略、基于链接结构评价的爬行策略、基于增强学习的爬行策略、基于语境图的爬行策略等。

深层网络爬虫用于专门爬取那些大部分内容不能通过静态链接获取的、隐藏在搜索表单后的，只有用户提交一些关键词才能获得的Web页面。Deep Web爬虫爬行过程中最重要的部分就是表单填写，包含两种类型：基于领域知识的表单填写，此方法一般会维持一个本体库，通过语义分析来选取合适的关键词填写表单；基于网页结构分析的表单填写，此方法一般无领域知识或仅有有限的领域知识，将网页表单表示成DOM树，从中提取表单各字段值。常见的爬虫工具有如下三种：

.Nutch：一个开源Java实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。Nutch有Hadoop支持，可以进行分布式抓取、存储和索引。Nutch采用插件结构设计，高度模块化，容易扩展。

.Scrapy：是Python开发的一个快速、高层次的屏幕抓取和Web抓取框架，用于抓取Web站点并从页面中提取结构化的数据。Scrapy吸引人的地方在于它是一个框架，任何人都可以根据需求方便地修改。它提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫、Web2.0爬虫等。

.Larbin：Larbin是一种开源的网络爬虫／网络蜘蛛，用C++语言实现。Larbin目的是能够跟踪页面的URL进行扩展的抓取，最后为搜索引擎提供广泛的数据来源。

当数据采集到以后，需要对采集并清洗后的数据进行存储。具体的存储技术在13.1.3云关键技术中的分布式数据存储中介绍，此处不再详述。

写操作

因为需要保证缓存在Cache中的数据与内存中的内容一致，相对读操作而言，Cache的写操作比较复杂，常用的有以下几种方法。

（1）写直达（write through）。当要写Cache时，数据同时写回内存，有时也称为写通。

（2）写回（write back）。CPU修改Cache的某一行后，相应的数据并不立即写入内存单元，而是当该行从Cache中被淘汰时，才把数据写回到内存中。

（3）标记法。对Cache中的每一个数据设置一个有效位。当数据进入Cache后，有效位置1；而当CPU要对该数据进行修改时，数据只需写入内存并同时将该有效位清0。当要从Cache中读取数据时需要测试其有效位：若为1则直接从Cache中取数，否则从内存中取数。

题号导航 2013年下半年嵌入式系统设计师下午试卷案例

本试卷我的完整做题情况



	第2题在手机中做本题