|
知识路径: > 计算机软件与网络基础知识 > 数据库系统 > 并行数据库系统 >
|
相关知识点:4个
|
|
|
|
|
并行粒度是指查询执行的并行程度,按照粒度从粗到细,主要有不同用户事务间的并行、同一事务内不同查询间的并行、同一查询内不同操作间的并行、同一操作内的并行性4种。
|
|
|
并行操作算法有并行连接算法、并行扫描算法和并行排序算法等。由于连接运算是数据库系统中最常用且最耗时的操作,因此对并行连接操作的研究最多。学者们提出了基于嵌套循环的并行连接算法、基于合并扫描的并行连接算法、基于Hash的并行连接算法和基于索引的并行连接算法等。
|
|
|
并行数据库以提高系统性能为宗旨,强调数据分布的均匀性。数据划分是并行查询处理的重要基础,根据存放关系的结点数目的不同,数据划分技术可分为完全划分(完全分布)和变量划分(部分分布)两种类型。完全划分将每一个关系分布存储到所有结点上,这种方法不适合小关系及结点数目大的系统;变量划分将每一个关系只分布存储到部分结点上,其中结点数目是关系大小和访问频率的一个函数,从而使数据分布更为灵活。
|
|
|
划分数据时可以依据一个属性的值,也可以同时依据多个属性的值,前者称为一维数据划分,后者称为多维数据划分。常用的划分方法有轮转法、Hash法和值域划分法、用户定义划分法、模式划分法和Hybrid_Range划分法等。
|
|
|