首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 734 毫秒
1.
黄丽嫦 《科学技术与工程》2012,12(15):3626-3629,3635
分析了矩阵的LU分解原理,并在双核微机上设计实现了一种矩阵的LU并行递归分解算法.该算法的特点是引入分块矩阵把LU分解形成迭代递归的形式,进而较好地发挥了新型微机的并行运算和高速缓冲存储器的功能.实验结果表明该算法是可行和有效的.  相似文献   

2.
鉴于容错并行算法的设计是影响其容错性能的关键因素,首先,根据容错并行算法的设计方法,给出了容错并行算法的分类,并对各类算法的特点进行了分析;然后,根据分类方法选择了并行矩阵三角分解和快速傅里叶变换2种典型的并行算法,设计出2类并行算法应用所对应的容错并行算法;最后,在一个256结点的机群系统上对设计的容错并行算法的性能进行了测试,结果表明容错并行算法可以实现很低的容错开销.  相似文献   

3.
数据挖掘是用来发现数据库中隐含的各个数据之间的关系和特性,聚类分析是数据挖掘所要完成的工作之一.选取了三个并行聚类分析算法并研究了与之对应的并行算法,然后讨论了并行算法的性能,并得到了一些实验结果.最后提出了一个新的并行算法,相比较其它并行聚类算法,本文所提出的算法是最有效的.  相似文献   

4.
介绍了分子动力学并行仿真计算的软硬件环境,分析了现有的几种并行算法,确定采用区域分解法作为并行算法,并在此基础上提出了基于区域二次划分的分子动力学并行仿真算法.另外,阐述了原子链、原子近邻表和原子亲属表的概念,提出了基于永久序号的消息传递策略.最后,设计了分子动力学并行仿真程序,并分别在1、2、3、4台结点机上进行了实验,运行结果表明:加速比随着结点数的增加而增加,并行效率虽略有下降但都在87.5%以上,并行效率并没有随着结点数的增加有明显的降低,说明并行程序具有很好的扩展性.  相似文献   

5.
在雷达辐射源信号时频原子分解中,原子库的特性直接影响着时频原子库的挑选,如何选取最佳的时频原子库对不同类型的雷达辐射源信号进行分解具有很重要的意义.针对这一问题,利用5种结构性能不同的原子库,结合量子进化算法对5种不同类别的雷达辐射源信号进行时频原子分解.实验结果表明,时频原子选择与雷达辐射源信号的特点密切相关.  相似文献   

6.
GROMOS96分子动力学模拟的并行优化算法   总被引:2,自引:0,他引:2  
介绍了流行的分子动力学软件GROMOS96中的MD算法 ,分析了制约GRO MOS96性能的原因 ,并提出一种优化的算法 ,将邻域原子搜索的时间复杂度从O(N2 )降低到O(NlogN) ;同时并行化了GROMOS96算法 ,并进一步在国产曙光并行机上开发了基于MPI的软件 ,证实了性能的改进  相似文献   

7.
通过分析影响算法的并行效率的主要因素,根据分而治之策略中的分块思想提出了一种求解三对角方程组的并行追赶算法。然后在机群系统中,MPI环境下实现了该并行算法,对并行算法的加速比和效率与原串行算法进行了比较,结果表明此算法有较高的计算效率。  相似文献   

8.
通过分析影响算法的并行效率的主要因素,根据分而治之策略中的分块思想提出了一种求解三对角方程组的并行追赶算法。然后在机群系统中,MPI环境下实现了该并行算法,对并行算法的加速比和效率与原串行算法进行了比较,结果表明此算法有较高的计算效率。  相似文献   

9.
分析对称矩阵LDLT分解过程的并行结构,给出对称矩阵LDLT分解的并行算法,然后考虑粗粒度组合后的负载平衡,提出基于OpenMP的对称矩阵LDLT分解并行算法的实现方案,并对该方案的并行计算性能进行数值实验.实验表明,基于OpenMP的对称矩阵LDLT分解并行算法在多核处理器系统中能够显著地提高算法性能.  相似文献   

10.
对带形对称系统提出了新的并行算法,在划分基础上充分利用矩阵的稀疏性,使算法具有高的分解效率及并行加速比。  相似文献   

11.
相对于先前的并行人工蜂群算法进行了一些改进,主要采用OpenCL本地内存、并行规约等技术,提出了一种基于图形处理器(GPU)改进的并行人工蜂群算法.该算法将采蜜蜂映射为OpenCL一个工作项,跟随蜂采用右邻域优先的局部选择机制.实验结果表明:文中提出的改进并行人工蜂群算法提高了算法的执行效率,收敛速度得到提升.  相似文献   

12.
随着图像数据量的增加,传统单核处理器或多处理器结构的计算方式已无法满足图像灰度化实时处理需求.该文利用图像处理器(GPU)在异构并行计算的优势,提出了基于开放式计算语言(OpenCL)的图像灰度化并行算法.通过分析加权平均图像灰度化数据处理的并行性,对任务进行了层次化分解,设计了2级并行的并行算法并映射到“CPU+GPU”异构计算平台上.实验结果显示:图像灰度化并行算法在OpenCL架构下NVIDIA GPU计算平台上相比串行算法、多核CPU并行算法和CUDA并行算法的性能分别获得了27.04倍、4.96倍和1.21倍的加速比.该文提出的并行优化方法的有效性和性能可移植性得到了验证.  相似文献   

13.
为获得分布式数据集上用户所期望的聚类结果,提出了基于约束信息的并行k-means聚类算法.在分析并行k-means能够有效实现对水平分布式数据集进行聚类的基础上,修改并行k-means算法的目标函数,设计约束并行k-means算法,将站点用户的约束信息以chunklet的形式引入到分布式聚类过程,从而引导算法执行有偏搜...  相似文献   

14.
并行算法的研究应以实用性、可实现性以及最大的并行处理效率为出发点.在解常微分方程(组)RungeKutta并行算法的基础上进一步提出了一种针对Transputer并行多处理机系统实现的异步并行算法,该算法可划分成若干OCCAM并发进程一一映射到多个处理机上且进程间采用异步通讯机制.作为一个应用实例,文中用OCCAM语言编写了三阶RungeKutta异步并行算法程序,做了算例,并获得了令人满意的结果.实例表明,由于该算法避免了进程间同步通讯等待所需的时间开销,而使算法的效率得以提高.  相似文献   

15.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

16.
圆饼装填是一个将多个芯片设计组合到一个圆饼上,构造费用通过几个设计分担而减少的过程。本文在SIMD-CREW并行计算模型下,通过修改Preparata并行排序算法及其用到的Valiant并行归并算法,给出了分配2个设计到一个包的基本圆饼装填问题BWPP的并行算法,在O(n^1.5)台处理机上,算法的时间复杂性是O。  相似文献   

17.
提出一种基于最短路径的QoS度量并行算法(QPAS)的两级并行算法。将多重链路网络按连接规则划分为若干网络分区,利用QPAS算法并行计算出每个分区内的QoS路由,并将路由结果发送给相应的分区处理器,最终由分区处理器调用最短路径并行算法计算出分区间代价最小路径。最后研究了路由更新频度。实验结果表明,基于QPAS的两级并行算法的时间复杂度更低,适用于有限节点网络的路由寻优。  相似文献   

18.
对计算机软件水流速度测量数据处理进行了研究,分析比较了单测点处理算法、多测点串行处理算法及多测点并行处理算法,指出在多测 点情况下,多点并行同步测量算法及可满足多点实时测量要求与经济性要求,讨论了Windows环境下流速测量软件的实现及优化方法,并通过工程实例验证了多测点并行处理算法的优越性。  相似文献   

19.
彭颖  王方 《中国西部科技》2011,10(14):31-32,21
目前并行程序设计的状况是并行软件的发展落后于并行硬件,并行软件的缺乏是发展并行计算的主要障碍。基于这种状况,本文提出了构建并行算法库的思想,并给出了一个实例,说明如何将常用算法函数封装在一个高效优化的并行库中,从而可以被复用,从此免去并行程序员复杂、低效的劳动。  相似文献   

20.
描述了DNS、Cannon、Fox、Systolic矩阵乘并行算法的原理,并对其时间复杂度进行了理论分析。通过对并行算法的各项性能参数的对比分析,得到的结论是DNS算法的时间复杂度最好,但加速比、效率和成本不是最优的。Cannon算法和Fox算法的算法思想类似,但是Cannon算法比Fox算法在数据播送上的花费少,因此整体性能较好。Systolic算法是基于流水线技术的并行矩阵乘算法,有较好的综合性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号