并行Hash连接算法 parallel hash join algorithms
把Hash连接算法并行化的一种算法。若Hash函数能把连接关系划分为大小基本相同的子集合,则并行Hash连接算法具有线性时间复杂性。主要有三种具有代表性的并行Hash连接算法。
1.简单并行Hash连接算法
简单Hash连接算法分为两个阶段。第一阶段是数据划分阶段。这一阶段使用Hash函数把连接关系R和S划分为P个可独立连接的子集合对,每对子集合送到唯一一个处理机。第二阶段是连接阶段。在这一阶段,每个处理机执行分配给它的可独立连接子集合对的连接操作,P个处理机并行地完成R和S的连接。简单Hash连接算法simple-hash-join的输入为: 处理机个数P; 分布于P个处理机上的关系R和S;Ri和Si是处理机Pi上的子集 ...... (共1963字) [阅读本文]>>