首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
针对并行调试器中传统排序模型的缺陷,提出了一套改进的时序处理机制.该机制是在调试系统中加入一个全局记录器,被调试模块在需要事件记录时向全局记录器申请一个全局序号,这样并行模块的事件就被自然地串行化,从而实现了并行程序时序的完全排序.该方法大大简化了排序过程,给记录一重放技术以及动态分析技术提供了有力的支持。  相似文献   

2.
给出两种在SIMD-EREW计算模型上的最优并行排序算法,为了避免存储访问冲突,算法采用了基于并行归并的并行排序方法。对于长度为n的序列,在n^ε个处理单元上,算法的排序时间为O(n^1-εlbn),成本为O(nlbn),已达到了最优,且算法是自适应的。  相似文献   

3.
介绍了一种并行的排序算法:排序网络算法.在比较网络模型的基础上,该算法使用二分法思想,利用双调序列,构造出了一种并行的排序算法:双调排序网络.  相似文献   

4.
本文研究了目前比较流行的并行化方法,并分别使用了基于任务分解的方法.基于分治模式的方法,基于主从模式的方法对粒子群算法(PSO算法)进行了并行化实现,分析了并行PSO算法的优势,并提出其适用范围。  相似文献   

5.
基于分组原理,设计一个无需完整排序的分组数据,从而可大大加快并行选择算法的速度.用并行Multipascal语言编程进行仿真实验,获得了较好的结果.  相似文献   

6.
本文利用修正枢轴选取,给出一种适合所有基本排序算法的并行化方法,对均匀数据模型排序具有理想的并行加速及效率。  相似文献   

7.
线性方程组大数法快速并行解法   总被引:5,自引:2,他引:5  
利用Schmidt正交规范化方法和分治策略,给出了一个求解含部分已定值变量的任意线性代数方程组的快速并行迭代解法,分析了解法的收敛性和计算复杂度,探讨了解法的内在并行性及其对应的消息传递并行算法的设计方法.  相似文献   

8.
Batcher排序网络在排序深度上不是最优的,但由于有较好的并行性和时间复杂度,因此许多并行排序算法都基于Batcher排序网络.通过观察Batcher奇偶排序网络,提出在SIMD SM模型上的一种奇偶排序算法.该算法占用n/2个处理器,在○(log22n)时间里排序n个关键字.  相似文献   

9.
基于有关因果关系复合的CommunicationClosedLayer理论,提出了一种结构化并行程序设计方法,以支持不同并行平台的“通用”并行程序设计方法.因果关系复合的范式定理的证明在理论上保证了采用“SEQOFPAR”形式进行结构化并行秩序设计的可行性;良好的代数性质也使得在这一模型中可采用代数方法的程序变换来进行并行程序设计、优化和验证.与其他并行程序设计模型和方法相比,提供了一种非常自然地综合描述数据并行和控制并行的途径;特别是基于代数变换的程序变换技术,提供了一种既独立于具体的体系结构又可高效实现的可能性.  相似文献   

10.
并行多层快速多极子算法最细层数据的建立   总被引:1,自引:0,他引:1       下载免费PDF全文
分布树最细层数据的建立是并行多层快速多极子算法(MLFMA)的基础.最细层数据分布均匀与否,会影响到后续整个算法的负载平衡及其并行效率.研究了最细层数据的建立方法,提出采用并行正则采样排序算法来代替众多文献所推荐的并行桶排序算法, 以此来建立分布树的最细层数据.针对多种常见的散射体在不同处理器数下的实验结果表明, 在大多数情况下,改进后的算法较原算法性能有较为明显的提高.  相似文献   

11.
并行计算是大规模科学工程计算和数据处理的一个重要工具和必然趋势,本文从并行计算机系统和并行算法两个方面论述了并行处理的基本原理和方法。  相似文献   

12.
根据神经网络串行布局算法 ,进一步研究并提出了与布局问题相适应的神经网络并行计算模型及并行布局算法 ,以负载平衡及系统通信开销最小为目标 .理论分析结果表明 ,运用该算法能达到此目标 ,且具有布局质量高、收敛快、计算简单等特点 ,适于神经网络并行布局  相似文献   

13.
 在医学超声成像系统中由于超声波在人体组织内传播会发生衰减,需要对超声图像进行有效的增益补偿,使超声图像的显示效果更好。但大多数自动增益补偿算法在处理时涉及大量的复杂计算,成为临床实时成像系统中的一大性能提升瓶颈,为此提出了一种基于高性能并行计算平台Fermi架构图形处理单元(GPU)的自动增益补偿并行处理算法。本算法主要的处理流程有数据预处理、区域类型检测、组织强度计算、二次曲面拟合以及自适应增益补偿等部分,核心的并行算法设计包括了粗粒度的并行均值滤波、局部方差系数的并行计算、优化的矩阵转置并行实现以及基于LU分解的粗粒度的矩阵求逆的并行实现等方面。数据测试结果显示,与基于CPU的实现相比,采用Fermi架构的GPU处理不仅可以得到完全一致和较好的增益补偿效果,而且可以取得较大的加速效果,满足实时系统需求,对512×261的图像数据能够达到427帧/s的高帧率,速度提高了大约267倍。  相似文献   

14.
本文提出一种在SIMD-EREW计算模型上实现的并行排序算法.算法采用基数交换排序方法,在处理过程中无存贮访问冲突.对长度为n的序列,算法使用不超过个处理单元,时间复杂度为O(u.log2n),其中u为不超过处理器字长的常数.该算法适合于具有较多重复元素的序列排序.  相似文献   

15.
对于大数据量图像和复杂图像处理算法,并行处理是一种有效的解决方法.基于消息传递接口,设计了一种并行图像边缘检测算法,并在曙光4000L并行机上予以实现.数值实验结果表明,并行图像处理能显著减少计算时间,更多的计算节点能得到更大的加速比,该并行图像处理算法对于大数据量图像更加有效.  相似文献   

16.
该文在对双三次样条曲面插值问题的并行方案的优选、任务分配的优化以及Transputer并行结构上并行通讯的策略进行深入研究的基础上,给出了一种高效的MIMD并行算法,这种算法模式也适用于B样条和非均匀有理B样条等曲面插值问题,因而适用范围广,具有代表性。该算法的优点是各处理机负载平衡度高、通讯量小,其效率几乎接近1,大大高于现有解三对角方程组的并行直接法的效率(如分块LDL^T分解,DDM方法的效  相似文献   

17.
带状方程组二叉树MIMD算法   总被引:1,自引:0,他引:1  
利用行处理法和分治策略给出了一个基于分布式存储MIMD二叉树树机模型求解任意带状方程组的并行迭代算法,证明算法对相容性带状方程组收敛并分析算法的通信复杂度.  相似文献   

18.
介绍了用Monte Carlo方法求解抛物型方程的3种游动模型, 给出了相应的证明及误差的概率估计式; 将Monte Carlo方法和区域分解算法相结合提出一种可并行计算抛物型方程的方法, 针对形式一般的方程给出了具体算法, 并指出算法适用的条件; 分别对二维、 三维抛物型方程进行数值实验, 实验结果表明该算法通过合理的安排, 几乎不需要数据传递, 在并行机上可以节省大量的计算时间.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号