首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出了并行数据库系统的哈希轮转(Hash-Round-Robin)数据划分方法以及其于该划分方法的并行记录分布B^n树,给出了基于该树的并行连接算法,分析了该算法的效率,这种连接算法充分利用了数据的已有分布及B^n树的特性,还利用了哈希轮转划分的特性,提高了并行连接的效率,该算法已经在自主研制的并行数据库管理系统PAROⅡ中得到实现。  相似文献   

2.
介绍PAROII采用的哈希轮转 (Hash -Round -Robin)数据划分方法以及基于该划分方法的并行RDBn树 ,着重、详细地讨论了基于该树的并行连接算法 ,该算法充分利用了数据的已有分布、Bn 树的特性、叶结合点有序连接、哈希轮转划分的特性 ,这些特性减少了系统的额外消耗 ,提高了并行连接的效率  相似文献   

3.
从划分聚类要求的时间和空间上看,传统的串行算法已很难适应海量的数据,有必要研发高性能、可扩展的并行算法来解决这一问题,基于一些主要的并行划分聚类算法所存在的问题,提出了在机群系统上采取数据并行策略设计的并行划分聚类算法思想。  相似文献   

4.
Skein算法提供一种树形哈希模式,方便了并行硬件资源的充分利用.提出一种并行计算平台,用以评估树形哈希算法与传统线性哈希算法相比的性能提升.该平台通过开关网络连接多个运算单元和多个存储单元,允许并行运算和并发的存储器访问.平台中包含一个控制器,负责动态地向运算单元调度任务,支持算法参数的灵活配置.为了确定最优配置参数,根据平台特征建立了性能模型.实验结果显示,加速比趋近于理论上限,即平台中运算单元的数量.该平台的硬件原型通过台积电65 nm工艺进行综合,工作频率达到833 MHz,对应吞吐率为38.091 Gbps.  相似文献   

5.
提出一种新的索引并行化技术,利用多处理机来提高建立在B树结构上的索引性能,并提出了一种改进的B树结构-FALNB树,基于该树结构,以大结点B树方式在多个处理机上分布索引数据,通过动态调整算法快速进行调整,取得很好的负载平衡效果,给出了时间分析模型,实验结果显示FALNB树能加快查询响应速度,对海量数据的索引有良好性能。  相似文献   

6.
针对传统决策树SPRINT(Scalable Parallelizable Induction of Decision Trees)算法不能处理海量地学数据挖掘的问题, 设计实现了基于G4ICCS(Geology Geography Geochemistry Geophysics Information Cloud Computing System)的决策树并行分类算法PSPRINT。该算法使用哈希表存储连续属性分割点两侧的数据记录, 为并行节点的分割提供依据, 在MapReduce架构下解决了海量地学数据挖掘问题。实验结果表明, 在模拟的云计算环境下, 决策树并行算法可以处理海量地学数据分类问题, 并获得较好的稳定性和较高的处理速度。  相似文献   

7.
基于PAR方法的并行最大和算法的推导   总被引:1,自引:1,他引:0  
在基于薛锦云提出的PAR(Partition-and-Recursion)方法的思想上,通过并行划分数据空间--自然地称之为并行分划递推,给出了在PRAM和超立方互联网络模型上的并行最大和最优算法,它们的时间复杂性为O(log N)。  相似文献   

8.
针对传统的并行哈希划分算法不能高效地利用多核处理器的并行资源,且不能较好处理有倾斜的输入数据的问题,提出了一种在多核处理器中基于MapReduce的哈希划分算法,并且提出了存储结构优化、多步划分优化、数据倾斜优化3种优化策略。该算法将输入数据分成若干块后提交给各个线程并行处理,并选择合适的策略避免写冲突,使其能够高效地利用多核处理器的并行资源。文中提出的哈希表能够提高cache效率,从而提升算法的整体性能。引入MapReduce模型可使多步哈希划分在Map过程和Reduce过程中分别进行;数据倾斜优化策略能使算法适应有倾斜的输入数据,且具有较好的效果。实验结果表明:在多核处理器中,文中提出的算法能够适应各种分布的输入数据,并且使哈希划分的整体性能得到提升。  相似文献   

9.
提出了将串行程序并行化的方法.首先对串行程序进行分段,提出并行划分模型,基于这个模型提出一种并行划分算法PDMA;然后给出了相关程度的定义,并根据程序段之间相关程度,提出了一种对PDMA进行改进的并行划分方法RPDMA;最后对这两种算法进行了比较和时间复杂度分析.  相似文献   

10.
针对有选择条件的连接易于造成选择率偏斜和重分布偏斜的问题,通过在各个处理结点中的A—D(Attribute—Distribute)临时关系以及主控结点中的A—RD(Attribute—Redistribute)临时关系,提出了并行连接改进算法,并且从理论上对该算法的空间复杂度进行了分析.  相似文献   

11.
针对海量数据的关联规则挖掘问题,提出了一种有效的基于等价类划分的并行频繁闭项集挖掘算法.该算法在MapReduce框架下,通过等价类的产生与划分、数据集的分配、异步频繁闭项集挖掘和汇总等步骤,不但较好地解决了多节点间的负载均衡问题,而且易于获得可靠的频繁闭项集.实验表明,该算法能有效克服传统算法挖掘效率低、冗余规则较多的缺点,整体上具有较高的性能.  相似文献   

12.
在分析现有的并行查询优化算法的基础上,提出了一种新的并行查询优化算法,该算法充分考虑并行计算机的物理限制,以丛生树为模型,利用大关系的数量对操作内的并行性,操作间的独立并行性以及操作间流水并行性进行调节,从而保证了高效的并行查询计划的产生。  相似文献   

13.
并行多层快速多极子算法最细层数据的建立   总被引:1,自引:0,他引:1       下载免费PDF全文
分布树最细层数据的建立是并行多层快速多极子算法(MLFMA)的基础.最细层数据分布均匀与否,会影响到后续整个算法的负载平衡及其并行效率.研究了最细层数据的建立方法,提出采用并行正则采样排序算法来代替众多文献所推荐的并行桶排序算法, 以此来建立分布树的最细层数据.针对多种常见的散射体在不同处理器数下的实验结果表明, 在大多数情况下,改进后的算法较原算法性能有较为明显的提高.  相似文献   

14.
提出了一种计算机机群环境下JOIN算法,防止数据偏斜对机群执行效率的影响.给出了数据分布树的形式化定义,构造了基于数据分布树的数据均衡分布机制、抗数据偏斜的JOIN算法.分析和实验表明,该算法适合于海量数据查询并能有效地解决机群并行环境下数据偏斜所造成的查询性能低下的问题.  相似文献   

15.
传统算法数据划分冗余度和倾斜度高,无用连接数据多,降低负载均衡性,对整体效率产生不好的影响,不适于实际应用。为此,面向混合动态数据库集群提出一种新的并行空间连接优化算法。采用网格划分法对数据进行划分,依据空间数据划分结果获取数据分布状态,计算节点按照数据分布状态得到候选集。通过平面扫描形成若干子空间连接的子任务,利用构建节点花费模型,依据花费模型对并行空间连接所需的平均节点访问个数进行评估,把候选任务集分配至不同计算节点,在不同节点执行并行空间连接操作。通过边界过滤策略,删除不可能有结果的元组,提高效率,增强算法的实用性。实验结果表明,所提算法适于实际应用,效率高。  相似文献   

16.
基于并行组合模拟退火的全局优化算法   总被引:2,自引:0,他引:2  
针对目前优化方法求解非线性多极值优化问题时存在的不足,提出了并行组合模拟退火算法。在分析算法性能的同时用并行组合模拟退火算法对两个算例进行了求解,并与模拟退火算法、遗传算法进行了比较。结果表明,该方法简单、可靠,具有较高的精度和适应性。  相似文献   

17.
面对VLSI设计规模日益增大的挑战,除了电路并行以外,其它已有的基本并行策略都无法从根本上解决测试生成的复杂性问题,然而,已有的电路并行测试生成算法并未取得理想的结果,尤其对时序电路,因此,如何划分电路,成为电路并行算法的设计基础和成功的关键,面向逻辑级描述的同步时序电路,以触发器为核的电路划分算法BWFSF将电路划分为大功能块。对Benchmark-89电路的实验结果表明,基于G-F二值算法和BWFSF算法的电路并行测试生成算法在有效减少存储空间消耗的同时,还能够获得稳定的加速比。  相似文献   

18.
传统分布式数据库查询SDD-1算法是基于爬山(Hill Climbing)算法而形成的,在执行时没有考虑可并行选择,在元组数据剧增的情况下,该算法的复杂度呈指数增长,这将无意义于分布式数据库系统.针对这一问题提出了一种基于并行的改进的SDD-1算法.  相似文献   

19.
为了提高查找效率,在无冲突哈希查找算法和Grid of Tries算法的基础上提出了一种基于无冲突哈希和多比特Trie树(NHMT)的IP分类算法.该算法的核心有3部分:哈希函数的构造,主要是采用基于目的端口和协议两域构造哈希函数,使得在最坏情况下完全避免了空间爆炸问题;在Grid of Tries算法的基础上,对Grid of Tries算法改造成修剪的Trie树和多比特Trie树,以减少空间复杂度;在无冲突哈希查找算法的基础上扩展一层用于存放源端口号(或范围),扩展后一般要提高算法的时间复杂度,要通过引入多比特Trie树的方法进行解决.对于空间复杂度方面与无冲突哈希查找算法比较,一般情况下不增加空间复杂度.通过仿真,当对10 000条规则进行包分类时,该算法的分类速度可以达到1 Mbit/s,所消耗的最大内存为8.2 MB.  相似文献   

20.
针对目前并行排序算法适用面窄、需要特殊硬件支持的问题,在进一步分析双调排序算法最优化解的基础上,提出了一种新的基于网格互连网络的处理器编号策略-对分编号策略,并求出了基于该策略的双调排序算法时间复杂的一般形式和最快情况,该策略适用于任意维度的通用网格互连处理器网络,且无需额外的硬件支持,调度实例,证明该策略下的双调排序算法具有无死锁调度的特性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号