基准测试程序
考试要求: 掌握     
知识路径:  > 计算机系统基础知识  > 可靠性与系统性能评测基础知识  > 计算机系统性能的评测方法  > 计算机系统的性能评价


 
       基准程序法(Benchmark)是目前被用户一致承认的测试性能的较好方法,有多种多样的基准程序,例如主要测试整数性能的基准程序、测试浮点性能的基准程序等。
       (1)整数测试程序。Dhrystone是一个综合性的基准测试程序,它是为了测试编译器及CPU处理整数指令和控制功能的有效性,人为地选择一些“典型指令”综合起来形成的测试程序。
       Dhrystone程序测试的结果由每秒多少个Dhrystones来表示机器的性能,这个数值越大,性能越好。VAX11/780的测试结果为每秒1757Dhrystones。为便于比较,人们假设1VAX MIPS=每秒1757Dhrystones,将被测机器的结果除以1757,就得到被测机器相对VAX11/780的MIPS值。有些厂家在宣布机器性能时就用Dhrystone MIPS值作为机器的MIPS值。
       不过不同的厂家在测试MIPS值时,使用的基准程序一般是不一样的,因此不同厂家机器的MIPS值有时虽然是相同的,但其性能却可能差别很大,那是因为各厂家在设计计算机时针对不同的应用领域,如科学和工程应用、商业管理应用、图形处理应用等,而采用了不同的体系结构和实现方法。同一厂家的机器,采用相同的体系结构,用相同的基准程序测试,得到的MIPS值越大,一般说明机器速度越快。
       (2)浮点测试程序。在科学计算和工程应用领域内,浮点计算工作量占很大比例,因此机器的浮点性能对系统的应用有很大的影响。有些机器只标出单个浮点操作性能,如浮点加法、浮点乘法时间,而大部分工作站则标出用Linpack和Whetstone基准程序测得的浮点性能。Linpack主要测试向量性能和高速缓存性能。Whetstone是一个综合性测试程序,除测试浮点操作外,还测试整数计算和功能调用等性能。
       ①理论峰值浮点速度。巨型机和小巨型机在说明书中经常给出“理论峰值速度”的MFLOPS值,它不是机器实际执行程序时的速度,而是机器在理论上最大能完成的浮点处理速度。它不仅与处理机时钟周期有关,而且还与一个处理机里能并行执行操作的流水线功能部件数目和处理机的数目有关。多个CPU机器的峰值速度是单个CPU的峰值速度与CPU个数的乘积。
       ②Linpack基准测试程序。Linpack基准程序是一个用FORTRAN语言写成的子程序软件包,称为基本线性代数子程序包,此程序完成的主要操作是浮点加法和浮点乘法操作。在测量计算机系统的Linpack性能时,让机器运行Linpack程序,测量运行时间,将结果用MFLOPS表示。
       当解n阶线性代数方程组时,n越大,向量化程度越高。其关系如下表所示。
       
       矩阵的向量化程度
       向量化百分比指含向量成分的计算量占整个程序计算量的百分比。在同一台机器中,向量化程度越高,机器的运算速度越快,因为不管n的大小,求解方程时花在非向量操作上的时间差不多是相等的。
       ③Whetstone基准测试程序。Whetstone是用FORTRAN语言编写的综合性测试程序,主要由执行浮点运算、整数算术运算、功能调用、数组变址、条件转移和超越函数的程序组成。Whetstone的测试结果用Kwips表示,1Kwips表示机器每秒钟能执行1000条Whetstone指令。
       (3)SPEC基准程序(SPEC Benchmark)。SPEC(System Performance Evaluation Cooperation)是由几十家世界知名的计算机厂商所支持的非盈利的合作组织,旨在开发共同认可的标准基准程序,目前已更名为Standard Performance Evaluation Cooperation。
       SPEC最初于1989年建立了重点面向处理器性能的基准程序集(现在称为SPEC89),主要版本有SPEC CPU89、SPEC CPU92、SPEC CPU95、SPEC CPU2000、SPEC CPU2006等,SPEC CPU2006包括12个整数基准程序集(CINT2006)和17个浮点基准程序集(CFP2006)。CINT2006包括C编译程序、量子计算机仿真、下象棋程序等,CFP2006包括有限元模型结构化网格法、分子动力学质点法、流体动力学稀疏线性代数法等。
       为了简化测试结果,SPEC决定使用单一的数字来归纳12种整数基准程序。具体方法是将被测计算机的执行时间标准化,即将被测计算机的执行时间除以一个参考处理器的执行时间,结果称为SPECratio。SPECratio值越大,表示性能越快(因为SPECratio是执行时间的倒数)。CINT2006或CFP2006的综合测试结果是取SPECratio的几何平均值。
       SPEC原来主要测试CPU性能,现在则强调开发能反映真实应用的基准测试程序集,并已推广至测试高性能计算机系统、网络服务器上商业应用服务器等。
       (4)TPC基准程序。事务处理委员会(Transaction Processing Council,TPC)基准程序是由TPC开发的评价计算机事务处理性能的测试程序,用于评测计算机在事务处理、数据库处理、企业管理与决策支持系统等方面的性能。其中,TPC-C是在线事务处理(On line Transaction Processing,OLTP)的基准程序,TPC-D是决策支持的基准程序。TPC-E作为大型企业信息服务的基准程序。与TPC-C一样,TPC-E的测试结果也主要有两个指标:性能指标(tpsE,transactions per second E)和性价比(美元/tpsE)。其中,前者是指系统在执行多种交易时,每秒钟可以处理多少交易,其指标值越大越好;后者则是指系统价格与前一指标的比值,数值越小越好。
       TPC基准测试程序在商业界范围内建立了用于衡量机器性能以及性能价格比的标准。但是,任何一种测试程序都有一定的适用范围,TPC也不例外。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有