数据聚集与立方
考试要求: 掌握     
知识路径:  > 计算机系统综合知识  > 数据库系统  > 数据仓库与数据挖掘技术  > 数据仓库技术  > 数据仓库的概念


 
       对某一事务可能会有多个观察的角度,这多个角度就构成了多维。数据仓库中多维的交点就是数据仓库用户要观察的事务。聚集是指按照维粒度、指标与计算元的不同,依据实际分析需要对底层数据进行记录行压缩、表联接、属性合并等预处理,是对底层的详细数据进行相应的统计的数据加工形式,包括求和、求平均值等。
       聚集计算的结果是根据用户可能的查询预先计算好的汇总数据。汇总的形式多种多样,可以沿着数据仓库中的多维数据的任何一维或多维进行。如果维分层次,聚集还可以在任何一个层次上进行。维的某种组合对应的聚集数据称为一个方体,给定维集合的所有方体形成的方体格称为该维集合的数据立方(data cube)。数据立方的建立就是通过聚集实现的。数据仓库中的立方也称为多维立方,数据立方的维数超过3时就称为超立方体或超维数聚集。
       数据聚集用于提升数据仓库系统进行联机分析处理时的性能,它通过在问题提出之前就准备好答案来缩短查询响应时间,是OLAP技术能够快速响应的基础。聚集降低了直接访问基础数据对前端应用的影响,减少了对基础数据的重复计算,使用聚集可以在一定程度上保证数据一致性。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有