|
知识路径: > 信息系统开发和运行管理知识 > 系统运行管理知识 > 系统的成本管理、用户管理、安全管理、性能管理 > 性能及能力管理 > 系统性能评价 >
|
被考次数:3次
被考频率:中频率
总体答错率:56%  
知识难度系数:
|
由 软考在线 用户真实做题大数据统计生成
|
考试要求:了解
相关知识点:15个
|
|
|
|
系统性能的评价方法大致可分为两类:模型法和测量法。
|
|
|
|
用模型法对系统进行评价,首先应对要评价的计算机系统建立一个适当的模型,然后求出模型的性能指标,以便对系统进行评价。此法既可用于已建成并在运转中的系统,也可用于尚在规划中而并未存在的计算机系统,可以比较方便地应用于设计和改进。模型法与测量法是相互联系的,在模型中使用的一些参数往往来源于对实际系统的测量结果。
|
|
|
|
分析模型法是在一定假设条件下,计算机系统参数与性能指标参数之间存在着某种函数关系,按其工作负载的驱动条件列出方程,用数学方法求解。分析模型法中使用得最多的是排队模型。排队模型包括三个部分。
|
|
|
.输入流。指各种类型的“顾客”按什么样的规则到来。
|
|
|
.排队规则。对于来的顾客按怎样的规则次序接受服务,例如实现顺序服务还是按顾客的急迫程度服务。
|
|
|
.服务机构。指同一时刻有多少服务设备可接纳顾客,为每一顾客需要服务多少时间。一般,服务机构过小,不能满足顾客的需要,将使服务质量降低;服务机构过大,人力物力的开支增加,因此产生了顾客需要和服务机构之间的协调问题。怎样才能做到既满足顾客的需要,又使服务机构的费用最低,是“排队论”要研究解决的问题。在计算机系统中,把需要处理的各种作业、命令等当作“顾客”,把计算机的各种软、硬部件如中央被处理机、存储器、输入输出设备、编译模块等当作“服务员”,当某作业在中央处理机中被处理时,就意味着作业(顾客)在接受这个“服务员”的服务。至于排队规则,也可以是先到先服务或有某些优先级的服务。这样就可以把“排队论”的许多成果应用于计算机系统性能评价。
|
|
|
为了使模型的使用对系统的评价有价值,必须解决以下三个问题。
|
|
|
.设计模型。根据对系统和工作负载的分析、测量来设计恰当的模型。一般设计出的模型只是部分地反映出系统的特性,而且是所要关心的那部分特性。
|
|
|
.解模型。如果有现成的“排队论”结论,就可以直接使用。不然,则需要提出新的解决办法。
|
|
|
.校准和证实模型。为了使模型化研究的结果可靠,其精度必须经过校准和证实,以达到可接受的程度。
|
|
|
模拟分析法和分析模型法不同,它不是用一些数学方程去刻画系统的模型,而是用模拟程序的运行去动态表达计算机系统的状态,并进行统计分析,得出性能指标。这种模型可以更加详细地刻画出原来的计算机系统,并且也可以比较灵活地加以控制,但构造模拟模型的费用较大,每次使用时还必须运行模拟程序。
|
|
|
这种模型法需要有一个建立模型并编制模拟程序的过程,然后校准和证实模型,才能计算出所要的性能指标。
|
|
|
|
通过一定的测量设备或测量程序,测得实际运行的计算机系统的各种性能指标或与之有关的量,然后对它们进行某些计算处理得出相应的性能指标,这是最直接最基本的方法。要使用测量方法,要解决以下问题。
|
|
|
(1)根据系统评价目的和需求,确定测量的系统参数。
|
|
|
(2)选择测量的方法和工具。测量的方式有两种,一种为采样方式。即每隔一定的时间间隔,对计算机系统的一些参数进行一次测量,另一种为时间跟踪方式,先规定一些要测量的事件,如一个作业开始执行、某个寄存器具有某种模式等,以后每当计算机系统中出现这种事件时就进行一次测量。
|
|
|
常用的测量工具可分为硬件测量工具、软件测量工具、固件测量工具以及混合型测量工具。目前许多测量工具已成为定型产品,可以直接购买和使用,有不少软件测量工具也已被结合到系统软件之中。
|
|
|
(3)在测量时工作负载的选择。为了使测量所得的结果有代表性,在测量时,计算机系统应处于测量者要求的工作负载情况。为此,有两种方法:一种是让计算机系统在日常的使用状况下运行,但选择某些与测量者要求相接近的时间区间。例如要测量系统在中负载条件下的性能,就应选择在每天系统使用最忙碌的时段进行测量。另一种是由测量者编写一组能反映他们要求的典型程序,或者选择市场上已有的一些适合他们要求的典型程序,例如对于字处理和文件服务、数据库处理、图像处理、科学和工程计算等都有一些已编制好的基准程序(benchmark)。两种工作负载相比,前一种工作负载常在做系统性能监控时使用:后一种工作负载在比较各种系统或选购新系统时使用。
|
|
|
测量法、分析模型法和模拟模型法三者得出的结果可以相互起到证实的作用。
|
|
|
|
常见的一些计算机系统的性能指标大都是用某种基准程序测量出的结果。下面介绍几类系统性能的基准测试程序,按评价准确性递减的顺序给出。
|
|
|
(1)实际的应用程序方法运行例如C编译程序、Tex正文处理软件、CAD工具,等等。
|
|
|
(2)核心基准程序方法(Kernel Benchmark)从实际的程序中抽取少量关键循环程序段,并用它们来评价机器的性能。
|
|
|
(3)简单基准测试程序(Toy Benchmark)简单基准测试程序通常只有10~100行而且运行结果是可以预知的。
|
|
|
(4)综合基准测试程序(Synthetic Benchmark)是为了体现平均执行而人为编制的,类似于核心程序,没有任何用户真正运行综合基准测试程序。
|
|
|
(5)整数测试程序Dhrystone用C语言编写,100条语句。包括各种赋值语句、各种数据类型和数据区、各种控制语句、过程调用和参数传送、整数运算和逻辑操作。VAX-11/780的测试结果为每秒1 757个Dhrystones即:
|
|
|
1VAX MIPS=1757 Dhrystones / Second
|
|
|
(6)浮点测试程序Linpack用FORTRAN语言编写,主要是浮点加法和浮点乘法操作。用MFLOPS (Million Floating Point Operations Per Second)表示,GFLOPS、TFLOPS Top500用这些程序进行测试。
|
|
|
(7) Whetstone基准测试程序Whetstone是用FORTRAN语言编写的综合性测试程序,主要由执行浮点运算、整数算术运算、功能调用、数组变址、条件转移和超越函数的程序组成。Whetstone的测试结果用Kwips表示,1kwips表示机器每秒钟能执行1 000条Whetstone指令。
|
|
|
(8) SPEC基准测试程序SPEC是System Performance Evaluation Cooperative的缩写,是几十家世界知名计算机大厂商所支持的非盈利的合作组织,旨在开发共同认可的标准基准程序。
|
|
|
(9) SPEC基准程序是由SPEC开发的一组用于计算机性能综合评价的程序。以对VAX11/780机的测试结果作为基数,其他计算机的测试结果以相对于这个基数的比例来表示。SPEC基准程序能较全面地反映机器性能,有一定的参考价值。SPEC版本1.0是1989年10月被宣布的,是一套复杂的基准程序集,主要用于测试与工程和科学应用有关的数值密集型的整数和浮点数方面的计算。源程序超过15万行,包含10个测试程序,使用的数据量比较大,分别测试应用的各个方面。SPEC基准程序测试结果一般以SPECmark(SPEC分数)、SPECint (SPEC整数)和SPECfp (SPEC浮点数)来表示。其中SPEC分数是10个程序的几何平均值,SPEC整数是4个整数程序的几何平均值,SPEC浮点数是6个浮点程序的集合平均值。1992年在原来SPECint89和SPECfp89的基础上增加了两个整数测试程序和8个浮点数测试程序,因此SPECint92由6个程序组成,SPECfp92由14个程序组成。这20个基准程序是基于不同的应用写成的,主要测量32位CPU、主存储器、编译器和操作系统的性能。1995年,这些厂商又共同推出了SPECint95和SPECfp95作为最新的测试标准程序,之后又不断推出新版本。
|
|
|
(10) TPC (Transaction Processing Council)基准程序TPC是Transaction Processing Council(事务处理委员会)的缩写,TPC基准程序是由TPC开发的评价计算机事务处理性能的测试程序,用以评价计算机在事务处理、数据库处理、企业管理与决策支持系统等方面的性能。TPC成立与1988年,目前已有40多个成员,几乎包括了所有主要的商用计算机系统和数据库系统。该基准程序的评测结果用每秒完成的事务处理数TPC来表示。TPC基准测试程序在商业界范围内建立了用于衡量机器性能以及性能价格比的标准。
|
|
|