首页 > 知识点讲解
       数据仓库主要应用场景——联机分析处理(OLAP)
知识路径: > 数据库主流应用技术 > 数据库主流应用技术 > 数据库主流应用技术 > 大数据与数据库 > 
被考次数:3次     被考频率:中频率     总体答错率:46%     知识难度系数:     
相关知识点:5个      
        20世纪60年代末,E.F.Codd所提出的关系数据模型促进了关系数据库及联机事务处理(On-Line Transaction Processing,OLTP)的发展。数据不再以文件方式同应用程序捆绑在一起,而是分离出来以关系表方式供大家共享。随着政府及商业应用的发展,数据量越来越大,同时用户的查询需求也越来越复杂,涉及的已不仅是查询或操纵一张关系表中的一条或几条记录,而且要对多张表中千万条记录进行数据分析和信息综合。关系数据库系统已不能全部满足这一要求。这两类应用,操作型应用和分析型应用,特别是在性能上难以两全,尽管为了提高性能,人们常常在关系数据库中放宽了对冗余的限制,引入了统计及综合数据,但这些统计综合数据的应用逻辑却是分散杂乱的,非系统化的,因此分析功能有限、不灵活,维护困难。在国外,不少软件厂商采取了发展其前端产品来弥补关系数据库管理系统支持的不足,他们通过专门的数据综合引擎,辅之以更加直观的数据访问界面,力图统一分散的公共应用逻辑,在短时间内响应非数据处理专业人员的复杂查询要求。1993年,Codd将这类技术定义为联机分析处理(On-Line Analytical Processing,OLAP)。OLAP作为一类产品同OLTP明显区分开来。
        OLAP是针对待定问题的联机数据访问和分析。为了反映用户所能理解的企业的真实的“维”,原始的数据被进行了转换,从而形成了可用的信息。通过对信息的很多种可能的观察形式进行快速、稳定一致的交互性存取,允许管理决策人员对数据进行深入观察。
        OLAP是以数据仓库进行分析决策的基础,针对特定问题的联机数据访问和分析,OLAP能够对不同数据集合进行基于某个或是多个角度的比较,它能够从不同角度切割数据集合从而进行分析。从某种意义来说,OLAP是有预见性的。OLAP的分析是建立在经验的基础上,对数据进行某种指定关联的分析。在联机事务处理系统中,由于数据的离散性,而使OLAP实现起来相当复杂甚至是不可能,而以数据仓库为依托,辅之以OLAP工具,OLAP的实现将十分简单易行。
        OLAP中的基本概念有:
        (1)变量:变量是数据的实际意义,即描述数据“是什么”。例如,数据“10000”本身并没有意义或者说意义未定,它可能是一个学校的学生人数,也可能是某产品的单价,还可能是某商品的销售量等等。一般情况下,变量总是一个数值度量指标,例如,“人数”“单价”“销售量”等都是变量,而“10000”则是变量的一个值。
        (2)维:维是人们观察数据的特定角度。例如,企业常常关心产品销售数据随着时间推移而产生的变化情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维,简称为时间维。企业也时常关心自己的产品在不同地区的销售分布情况,这时他是从地理分布的角度来观察产品的销售,所以地理分布也是一个维,称为地理维。
        (3)维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,我们称这多个描述方面为维的层次。一个维往往具有多个层次,例如描述时间维,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家等构成了一个地理维的多个层次。
        (4)维成员:维的一个取值称为该维的一个维成员。如果一个维是多层次的,那么该维的维成员是在不同维层次的取值的组合。例如,我们考虑时间维具有日期、月份、年这三个层次,分别在日期、月份、年上各取一个值组合起来,就得到了时间维的一个维成员,即“某年某月某日”。一个维成员并不一定在每个维层次上都要取值,例如,“某年某月”“某月某日”“某年”等等都是时间维的维成员。对应一个数据项来说,维成员是该数据项在某维中位置的描述。例如对一个销售数据来说,时间维的维成员“某年某月某日”就表示该销售数据是“某年某月某日”的销售数据,“某年某月某日”是该销售数据在时间维上位置的描述。
        (5)多维数组:一个多维数组可以表示为(维1,维2,……,维n,变量)。例如,(地区,时间,销售渠道,销售额)就是一个多维数组,其中销售额是变量,它定义在地区维、时间维和销售渠道维这三者的基础上。
        (6)数据单元:多维数组的取值称为数据单元。当在多维数组的各个维中都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值。那么数据单元就可以表示为(维1的维成员,维2的维成员,……,维n的维成员,变量的值)。
        多维分析是指对以多维形式组织起来的数据采取切片、切块、旋转等各种分析动作,以求剖析数据,使最终用户能从多个角度、多侧面地观察数据库中的数据,从而深入地了解包含在数据中的信息、内涵。多维分析方式迎合了人的思维模式,因此减少了混淆并且降低了出现错误解释的可能性。多维分析的基本动作有:
        (1)切片:在多维数组的某一维上选定一维成员的动作称为切片,即在多维数组(维1,维2,……,维n,变量)中选一维,并取其一维成员。
        (2)切块:在多维数组的某一维上选定某一区间的维成员的动作称为切块,即限制多维数组的某一维的取值区间。显然,当这一区间只取一个维成员时,即得到一个切片。
        (3)旋转:旋转即改变一个报告或页面显示的维方向。例如,旋转可能包含了交换行和列,或是把某一个行维移到列维中去,或是把页面显示中的一个维和页面外的维进行交换(令其成为新的行或列中的一个)。
        OLAP的数据来源于数据库。通过OLAP服务器,将这些数据抽取和转换为多维数据结构,以反映用户能理解的企业的真实维。通过多维分析工具对信息的多个角度、多个侧面进行快速、一致和交互的存取,从而使分析员、经理和行政人员能够对数据进行深入地分析和观察。
        在数据仓库系统中OLAP使用的多维数据可以位于不同的层次,可以作为数据仓库的一部分,也可以作为数据仓库工具层的一部分。由于所处的层次的不同,其分析结果的综合程度也相应有高低之分,所以可以满足具有不同应用需求用户的要求。
        1993年,Codd提出了有关OLAP的十二条准则,这也是他继关系数据库和分布式数据库提出的两个“十二条准则”后提出的第三个“十二条准则”。尽管业界对这个十二条准则褒贬不一,但其主要方面,如多维数据分析、客户/服务器结构、多用户支持及一致的报表性能等得到了大多数人的认可。
        (1)OLAP模型必须提供多维概念视图:从用户分析员的角度来看,整个企业的视图在本质上是多维的,因此OLAP的概念模型也应是多维的。企业决策分析的目的不同,决定了分析和衡量企业的数据总是从不同的角度来进行的,所以企业数据空间本身就是多维的。
        (2)透明性准则:无论OLAP是否是前端产品的一部分,对用户来说,它都是透明的。如果在客户/服务器结构中提供OLAP产品,那么对最终分析员来说,它同样也应透明。透明性原则包括两层含义:首先,OLAP在体系结构中的位置对用户是透明的。OLAP应处于一个真正的开放系统结构中,允许分析工具嵌入到分析人员指定的任何位置而不影响嵌入工具的性能,这对保持用户现有的效率,保证良好的性能至关重要。同时必须保证OLAP的嵌入不会引入和增加任何复杂性。其次,OLAP的数据源对用户也是透明的。用户只需使用熟悉的查询工具进行查询,而不必关心输入OLAP工具的数据是来自于同构还是异构的企业数据源。
        (3)存取能力准则:OLAP系统不仅能进行开放的存取,而且还提供高效的存取策略。OLAP用户分析员不仅能在公共概念视图的基础上对关系数据库中的企业数据进行分析,而且在公共分析模型的基础上还可以对关系数据库、非关系数据库和外部存储的数据进行分析。OLAP系统应提供高效的存取策略,应使系统只存取与指定分析有关的数据,避免多余的数据存取。
        (4)稳定的报表性能:当数据的维数和综合层次增加时,提供给最终分析员的报表能力和响应速度不应该有明显的降低和减慢,这对维护OLAP产品的易用性和低复杂性至关重要。即便当企业模型改变时,关键数据的计算方法也无需更改。只有做到这一点,OLAP工具提供的数据报表和所做的预测分析结果才是可信的。
        (5)客户/服务器体系结构:OLAP是建立在客户/服务器体系结构上的。这要求它的多维数据库服务器能够被不同的应用和工具访问到。服务器端智能地以最小的代价完成同多种服务器之间的挂接任务,服务器端必须完成分散的企业数据库的逻辑模式和物理模式之间的映射,并确保它们的一致性,从而保证透明性和建立统一的公共概念模式、逻辑模式和物理模式。客户端负责应用逻辑和用户界面。
        (6)维的等同性准则:每一数据维在数据结构和操作能力上都是等同的。系统可以将附加的操作能力赋予所选的维,但必须保证该操作能力可以赋予其他任意的维,即要求维上的操作是公共的。
        (7)动态的稀疏矩阵处理准则:OLAP工具的物理模型必须充分适应指定的分析模型,提供“最优”的稀疏矩阵处理,这是OLAP工具所应遵循的最重要的准则之一。该准则包括两层含义:第一,对任意给定的稀疏矩阵,存在且仅存在一个最优的物理视图,它能提供最大的内存效率和矩阵处理能力。稀疏度是数据分布的一个特征,如果不能适应数据集合的数据分布,将会导致快速、高效操作的失败。第二,OLAP工具的基本物理数据单元可配置给可能出现的维的子集。同时,还要提供动态可变的访问方法并包含多种存取机制,使得访问速度不会因数据维的多少、数据集的大小而变化。
        (8)多用户支持能力准则:多个用户分析员可以同时工作于同一分析模型上,或者可以在同一企业数据上建立不同的分析模型。该准则可由准则5推出。OLAP工具必须提供并发访问、数据完整性及安全性机制。实际上,OLAP工具必须支持多用户也是为了适合数据分析工作的特点。我们推荐以工作组的形式来使用OLAP工具,这样多个用户可以交换各自的想法和分析结果。
        (9)不受限的跨维操作:多维数据之间存在固有的层次关系,这就要求OLAP工具能自己推导出而不是由最终用户明确定义出相关的计算。对于无法从固有关系中得出的计算,要求系统提供计算完备的语言来定义各类计算公式。该准则是对准则1的一个补充,对操作能力和操作范围做出了要求。
        (10)直观的数据操纵:要求数据操纵直观易懂。综合路径重定位、向上综合、向下挖掘和其他操作都可以通过直观、方便的点拉操作完成。
        (11)灵活的报表生成:报表必须从各种可能的方面显示出从数据模型中综合出的数据和信息,充分反映数据分析模型的多维特征。
        (12)不受限制的维数与聚集层次:OLAP工具的维数应不小于15维,用户分析员可以在任意给定的综合路径上建立任意多个聚集层次。
 
本知识点历年真题:
隶属试卷 题号/题型 题干 难度系数/错误率
   2020年下半年
   数据库系统工程..
   上午试卷 综合知识
第64题
选择题
OLTP指的是(63),OLAP指的是(64)。

43%
   2013年上半年
   数据库系统工程..
   上午试卷 综合知识
第64题
选择题
从时间、地区和商品种类三个维度来分析某电器商品销售数据属于(64)。

52%
>>  更多  本知识点历年真题
 
 相关知识点:
 
软考在线指南
优惠劵及余额
在线支付
修改密码
下载及使用
购买流程
取消订单
联系我们
关于我们
联系我们
商务合作
旗下网站群
高级资格科目
信息系统项目管理师 系统分析师
系统架构设计师 网络规划设计师
系统规划与管理师
初级资格科目
程序员 网络管理员
信息处理技术员 信息系统运行管理员
中级资格科目
系统集成项目管理工程师 网络工程师
软件设计师 信息系统监理师
信息系统管理工程师 数据库系统工程师
多媒体应用设计师 软件评测师
嵌入式系统设计师 电子商务设计师
信息安全工程师
 

本网站所有产品设计(包括造型,颜色,图案,观感,文字,产品,内容),功能及其展示形式,均已受版权或产权保护。
任何公司及个人不得以任何方式复制部分或全部,违者将依法追究责任,特此声明。
本站部分内容来自互联网或由会员上传,版权归原作者所有。如有问题,请及时联系我们。


工作时间:9:00-20:00

客服

点击这里给我发消息 点击这里给我发消息 点击这里给我发消息

商务合作

点击这里给我发消息

客服邮箱service@rkpass.cn


京B2-20210865 | 京ICP备2020040059号-5 |京公网安备 11010502032051号 | 营业执照 | Copyright ©2000-2023 All Rights Reserved 软考在线版权所有