首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 140 毫秒
1.
结构动力分析隐式积分并行算法与实现   总被引:2,自引:0,他引:2  
在分布式并行计算机环境下进行了有限元并行算法的研究,建立了结构动力分析的两种隐式积分方法(Newmark方法和Wilson-θ方法)的并行化方法与算法步骤,设计了变带宽一维存储时有效刚度矩阵的三角分解并行算法;基于Transputer的分布式MIMD并行计算机上,采用3L并行FORTRAN编写了计算程序,并将其移植到有限元串并行混合分析软件PFEM中。以平面问题和空间板弯问题作为实例进行了数值计算。结果表明计算方法具有较高的并行效率。当自由度为7579,最大带宽为726时,2个和3个处理器工作的并行效率分别为0.70和0.55。  相似文献   

2.
结构动力分析显式积分并行算法与实现   总被引:2,自引:0,他引:2  
在分布式并行计算机环境下开展有限元并行算法研究是计算力学领域的前沿课题之一。基于区域分裂法,提出了结构动力分析两种形式的显式积分法的并行算法及步骤;同时,在用Transputer组成的分布式MIMD并行计算机上,采用3L并行Fortran编写了计算程序,并将其移植到串并行混合有限元分析软件PFEM中;最后,通过对三维空间钢架结构的实际分析,不仅验证了算法和程序设计的正确性,而且结果表明算法具有较高的并行效率。当2个和3个CPU工作时,并行效率分别为0.8和0.7。  相似文献   

3.
基于CMP的多种并行蚁群算法及比较   总被引:1,自引:0,他引:1  
基于片上多核处理器(Chip Multi-processor,CMP)的多种并行蚁群算法,包括并行最大最小蚂蚁系统、并行蚁群系统及两者的混合等5个并行算法,提出一种在CMP的每个处理器核心上模拟一个子蚁群,整体蚁群共享同一信息素矩阵,实现信息素隐式交流的方法.用多线程实时优先级实现该算法,并用若干旅行商问题实例进行了测试,分析了不同并行策略的影响.测试结果表明,基于CMP的并行蚁群具有相对于核心数目的线性加速比,异种蚁群混合策略在解的稳定性上更具优势。  相似文献   

4.
基于EBE策略,讨论求解大型线性方程组CG方法及PCG方法的并行计算.在不显式形成总刚度阵的情况下利用单元级矩阵的Cholesky分解构造总刚度阵的近似,形成预条件矩阵,提出了求解大型线性方程组的EBE—PCG并行算法,并讨论了算法在网络机群(COW)并行计算环境下的实现.结合实际算例,对EBE-PCG并行算法进行了并行效率分析.结果表明基于单元级Cholesky分解的EBE—PCG算法具有很好的并行效率,是一种适合网络机群并行环境的高效并行算法.  相似文献   

5.
目的设计并实现一种基于数据划分的矩阵乘法的并行算法,将划分的数据交给多个线程同时执行,充分挖掘计算机的性能。方法根据OpenMP并行编程的基本风格,并在Visual Studio2005上搭建能够实现并行编程的环境平台。结果并行算法所花费的时间较非并行算法短。结论通过与非并行矩阵乘法性能进行比较,验证该算法可以有效地利用多核处理器的优势。  相似文献   

6.
提出了一种基于区域分解法的显隐混合校正并行算法.通过对二维波动方程的数值试验,发现该算法具有无条件稳定性,其数值计算结果与整个区域上采用隐格式的计算结果相当,计算精度明显好于Kuznetson算法和改进的Kuznetson算法,计算时间也比Kuznetson算法和改进的Kuznetson算法的时间少,且小于隐格式计算时间的一半.  相似文献   

7.
针对数值计算中前缀和运算数据量大、耗时巨大这一难题,提出了一种基于开放式计算语言(Open Computing Language,OpenCL)的分段式前缀和并行算法。首先进行了分段式前缀和算法的并行性分析,对任务进行了层次化分解与组合,设计了两级并行的分段式前缀和算法;然后通过OpenCL编程将前缀和并行算法映射到CPU+GPU系统平台上,实现了层次化并行前缀和处理;最后,根据计算单元(Compute Unit,CU)的资源条件,增加CU中本地存储器的分配,通过改进工作节点的访问模式来降低bank冲突,提高访存速度。实验结果表明,与基于AMD Opteron 2439 SE CPU的串行算法、基于OpenMP(Open Multi-Processing)并行算法和基于统一计算设备架构并行算法性能相比,前缀和并行算法在OpenCL架构下NVIDIA Tesla C2075计算平台上分别获得了33.51倍、6.26倍和2.41倍的加速比。验证了提出的并行优化方法的有效性和性能可移植性。  相似文献   

8.
研究在共享内存式计算机架构下,基于OpenMP及矢量算术逻辑单元(VALU)硬件加速的表面积分方程矩量法的混合并行求解技术. 讨论了矩量法并行程序设计中的关键问题,并分析了影响并行计算的主要因素. 针对一些典型散射目标,给出了由混合并行程序得到的雷达散射截面数值结果. 通过对计算数据的对比分析,指出负载平衡及内存读取连续性是影响混合并行效率的关键问题所在.   相似文献   

9.
数制之间相互转换的并行算法   总被引:4,自引:0,他引:4  
数制转换是计算机科学中一种最基础的运算,但现有的算法基本上都是串行算法。随着并行计算机的出现,并行算法的研究也越来越受到人们的重视。要发挥并行计算机的作用,提高并行计算机资源的利用率,必须有一套强有力的并行算法的支持。本文给出了十进制与其它进制之间相互转换的并行算法,并对算法的性能进行了分析。  相似文献   

10.
给出了多孔介质中不可压缩流体混溶驱动问题的一种数值逼近格式。该格式包含两种方法:对压力方程采用标准混合元方法,对浓度方程采用非重叠区域分解和特征线法。该算法用Galerkin隐格式求解子区域内部的值而用积分平均方法显式逼近内边界上的值,从而实现了并行计算,并求得该算法的最优L2-模误差估计。  相似文献   

11.
基于工作站机群的并行频域体绘制   总被引:1,自引:1,他引:1  
体绘制是三维数据场可视化中的一类重要算法,近年来人们分别通过对频域技术和并行技术的研究和应用使得这类算法有了很大的提高,然而迄今为止,这两个方面的成果仍然没有能够有机地结合起来。有鉴于此,本文介绍了一个基于工作站群机环境的并行频域体绘制算法。由于该算法充分发挥了频域技术和并行技术的优点,有效地提高了绘制速度。已在一个工作站机群环境中具体实现。对于该算法的各方面性能,文中都给出了详细的测试统计数据。  相似文献   

12.
基于空间域分解的交通网络仿真并行化方法   总被引:1,自引:0,他引:1  
为了提高交通网络微观仿真的速度,节省仿真运算时间,将并行计算技术应用于微观交通仿真中,建立了交通网络并行仿真模型并在工作站集群上实现.模型中采用了基于空间域分解的并行方法,该方法可以将不同地理位置的交通子网分配到集群中的每台结点机进行仿真运算.通过在5个不同规模路网上的并行仿真实验,对提出的交通并行仿真模型进行了测试.实验结果表明,该并行仿真模型可大大减少交通网络仿真计算时间,与单机仿真相比,并行仿真平均可节省62.9%的运行时间.同时由于随着结点机数量的增加,并行仿真中的通信开销也会相应增加,因此对于特定的交通网络方案及仿真逻辑,存在最优的结点机数量使得仿真运算时间最少.  相似文献   

13.
利用区域分解方法,对模拟大气重力波在中高层大气中非线性传播过程的数值模式进行了并行化处理,从而建立了并行数值模式.在两个并行机群上对并行数值模式的测试结果表明:在千兆以太网和内存配置较低的机群系统上,并行效率随着进程个数的增加而减低,当进程个数增加到16时,并行效率仅为0.65.在内存配置较高的机群系统上,并行效率随着进程个数的增加并不减小,甚至出现了超线性加速现象.比如当进程个数为160个时,并行效率达到1.28.通过比较研究可以说明,机群系统的缓存、物理内存和网络通讯延时都是影响加速比的重要因素.尽可能大的缓存和物理内存能够有效提高加速比,网络交换机的选择需要在延时和带宽间进行权衡.  相似文献   

14.
介绍了模糊关联规则挖掘算法的基本思想及实现步骤,提出了模糊关联规则的并行挖掘算法.并行挖掘算法采用并行的模糊c-均值算法将数量型属性划分成若干个模糊集,并借助模糊集软化属性的划分边界.用改进布尔型关联规则的并行挖掘算法来发现频繁模糊属性集.最后由多个处理器并行地产生满足最小模糊信任度的模糊关联规则.在分布式互连的PC/工作站环境下进行性能分析,结果表明并行的挖掘算法具有好的可扩展性、规模增长性和加速比性能.  相似文献   

15.
本文把秩1修正技术和一阶线递推并行消去法结合起来,给出了求解三对角Toeplitz方程组的MIMD并行算法,该算法结构简单,存储省,处理机之间通讯比较少,而且对处理机台数没有特殊要求,相对于追赶法的加速比可接近P/2(P为处理机台数)。值得指出的是,本文的算法关键产考虑并组织了一阶常系数线性递推的并行计算。  相似文献   

16.
一种基于局部信息的聚类密度度量   总被引:1,自引:0,他引:1  
为有效处理密度不均匀聚类问题,以数据集蕴涵的局部信息为出发点,提出一种数据点密度度量———松散度,用以揭示数据点与其相邻数据点的相对紧密程度及类属关系,从而解决密度不均匀聚类问题.依据松散度的性质实现了一种基于松散度的聚类方法,以验证松散度度量的有效性.实验结果表明,使用松散度来度量数据点的聚类密度信息可以有效处理密度不均匀聚类问题.  相似文献   

17.
根据已有的网络监测技术, 提出一个集群系统监测模型MCM. MCM将每个监测任务交给一个监测模块, 并可以灵活地加入和删除这些监测模块, 这种设计使得MCM可以有效地支持对分布式计算资源、 服务以及异常事件的监测. MCM为集群资源管理, 跨域并行作业, 网格资源协同分配和元调度算法提供了资源监测基础设施. 最后, 基于MCM和Platform公司的集群产品EGO, 实现了一个高效的综合性集群监测系统.  相似文献   

18.
Data aggregation from various web sources is very significant for web data analysis domain.In addition,the recognition of coherence micro cluster is one of the most interesting issues in the field of data aggregation.Until now,many algorithms have been proposed to work on this issue.However,the deficiency of these solutions is that they cannot recognize the micro-cluster data stream accurately.A semantic-based coherent micro-cluster recognition algorithm for hybrid web data stream is proposed.Firsdy,an objective function is proposed to recognize the coherence micro-cluster and then the coherence micro-cluster recognition algorithm for hybrid web data stream based on semantic is raised.Finally,the effectiveness and efficiency evaluation of the algorithm with extensive experiments is verified on real music data sets from Baidu inc.and Migu inc.The experimental results show that the proposed algorithm has better recall rate than the non-semantic micro cluster recognition algorithm and single source data flow micro cluster recognition algorithm.  相似文献   

19.
提出一种基于最短路径的QoS度量并行算法(QPAS)的两级并行算法。将多重链路网络按连接规则划分为若干网络分区,利用QPAS算法并行计算出每个分区内的QoS路由,并将路由结果发送给相应的分区处理器,最终由分区处理器调用最短路径并行算法计算出分区间代价最小路径。最后研究了路由更新频度。实验结果表明,基于QPAS的两级并行算法的时间复杂度更低,适用于有限节点网络的路由寻优。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号