首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 531 毫秒
1.
利用区域分解方法,对模拟大气重力波在中高层大气中非线性传播过程的数值模式进行了并行化处理,从而建立了并行数值模式.在两个并行机群上对并行数值模式的测试结果表明:在千兆以太网和内存配置较低的机群系统上,并行效率随着进程个数的增加而减低,当进程个数增加到16时,并行效率仅为0.65.在内存配置较高的机群系统上,并行效率随着进程个数的增加并不减小,甚至出现了超线性加速现象.比如当进程个数为160个时,并行效率达到1.28.通过比较研究可以说明,机群系统的缓存、物理内存和网络通讯延时都是影响加速比的重要因素.尽可能大的缓存和物理内存能够有效提高加速比,网络交换机的选择需要在延时和带宽间进行权衡.  相似文献   

2.
本文以FLUENT软件和高性能集群作为数值模拟平台,通过改变高层建筑物高度进行了并行数值模拟。并对并行数值模拟结果和集群并行计算效率进行了分析,分析结果表明:随着建筑物高度的增加,建筑物周围最大风速和最大风速比增大,建筑物对其周围空气流动的影响增强。在并行计算中,当CPU个数相同时,随着网格数量的增加,并行效率呈增加趋势但增大的幅度越来越小;当网格数相同时,随着CPU个数增加,并行计算效率呈减小趋势。  相似文献   

3.
非对称广义特征值问题的并行处理是并行计算结构力学的重要部分,这方面的工作目前在国内外研究得还很少.将串行计算中求解非对称广义值问题AX=λBX(A、B为n阶实矩阵)行之有效的QZ算法作了并行化处理,并就得到的并行QZ算法在Challenge L并行机上进行了试算.数值结果表明:当处理机个数为2或4时并行效率良好,但当处理机个数为8时并行效率不高.  相似文献   

4.
为了将中尺度大气模式MM5应用到并行和网格计算领域,对中尺度大气模式MM5的原理进行研究,搭建了并行和网格环境,给出了需要的组件和配置流程,对网格和并行计算进行了比较.结果表明,CPU个数不再是提升MM5运行效率的瓶颈;在网络环境较差的条件下,gridftp比ftp更安全和稳定.  相似文献   

5.
为了利用并行计算研究接地系统的冲击响应,在阻塞通信模式条件下提出了一个并行编程模型,对进程拓扑结构的优化设计进行了讨论.利用微机集群并行系统研究了接地系统冲击响应过程,得到了较好的并行效率,并对其中出现的超线性加速现象进行了分析.利用数值模拟结果讨论了冲击接地阻抗(TGR)与水平接地体厚度之间的关系.结果表明,接地体厚度对接地阻抗有一定的影响,但当厚度从0.33 m增加到0.5 m时,接地体性能没有显著改善.  相似文献   

6.
针对混合润滑数值分析将动压效应、弹性变形和界面接触特性耦合而非常耗时的问题,基于共享内存并行系统的多线程程序设计语言OpenMP,提出一种多线程混合润滑并行计算数值方法——红黑线交叉并行计算法.该并行计算模型是将雷诺方程求解域分成两个相互独立的子求解域,依次对两个子求解域进行并行数值求解,可以有效克服CPU线程间数据争用问题,加快求解速度.着重研究了并行计算核数、网格数量和工作站配置对并行计算性能的影响,分析结果表明:并行计算模型能够有效提高滑动轴承混合润滑计算速度,并行计算速度的提升幅度与并行计算核数成非线性关系,随着CPU核数的增加计算速度的增加幅度逐渐减小;此外,与内存和缓存相比,CPU的主频对并行计算速度有非常大的影响.  相似文献   

7.
针对FP-Growth算法在大规模数据环境下存在挖掘效率低和占用内存大等问题,提出在分布式计算框架Hadoop的MapReduce编程模式下实现FP-Growth算法并行化处理.结果表明,在相同数据量下,通过负载均衡的并行化FP-Growth算法,加速比呈线性增大,具有良好的加速比和可扩展性,且随着数据量增大,算法效率明显提高.  相似文献   

8.
加速比是衡量并行处理性能的重要指标之一;较高加速比的获得除与任务的划分、并行算法的选择等有关外,还与各节点间的通信有关;在大多数并行系统中,在数据规模确定的情况下,程序的加速比随节点数的增加而增加,但是大多数机群系统的节点间是共享物理传输介质的,这就使得许多并行程序的加速比在节点数目超过某一个值之后会随着节点数的增加而减少;文章通过数值实验研究,分析了节点间通信对加速比的影响,进一步论证了节点间通信对加速比的重要影响。  相似文献   

9.
一种量子化学有限元并行计算方法   总被引:2,自引:0,他引:2  
利用有限元法计算了量子化学中双原子分子的Hartree-Fock-Slater方程,用八节点等参元来离散所要求解的方程,在计算离散后的广义特征值问题时,采用迁移式子空间迭代法来求解.本方法能以较高的精度和效率求得所需的前q维特征值和特征向量,具有编程容易、子空间维数低和占用内存少的优点.所提方法也适用于并行计算,并行程序是在微机机群系统上发展的,用SPMD(singleprogrammultipledate)模式在MPI(messagepassinginterfaces)并行编程平台上实现,MPI系统用于处理机群节点间的通信.给出计算两个双原子分子——BH分子和LiH分子基态总能量的数值算例,获得了较精确的计算结果,显示了本方法的优越性.  相似文献   

10.
针对单台微型计算机进行数值模拟耗时长的问题,在微软公司开发的32位视窗操作系统下建立了网络并行计算环境.把2台微型计算机连成一个星形结构的以太网,以并行虚拟机作为网络并行计算平台、Vi sualC 作为开发工具,通过建立帐号及主目录、配置网络、设置系统环境变量和测试等步骤,完成了并行虚拟机的配置与调试.采用C语言自行研制了并行凝缩算法的源程序,并进一步以主从进程模式对金属平板轧制过程的弹塑性力学行为进行了数值模拟.研究结果表明,所建立的网络并行计算环境运行可靠,并行加速比可达1 785,并行效率达到了89%,与单台微型计算机相比,不仅提高了运行速度,且大大缩短了计算时间.  相似文献   

11.
针对JPEG2000芯片设计中的完全小波系数存储占用大量存储器问题,在小波变换总体结构中对小波系数的LH、HL和HH子带采用双缓存的物理存储结构.为了解决由此产生的写覆盖,首先建立小波滤波器的时序模型,得到输入输出延时时钟数,根据此时钟数和缓存标志位的状态决定其输入地址发生器的地址产生,以实现可控的小波滤波器输出.在图像大小为256×256像素、码块大小为16×16像素时,与完全系数存储结构相比,该结构可节约片上存储器达576kb.通过对子带内小波系数的分布模型和缓存内的位平面数统计分析表明,该结构对编码并行性的影响较小,仿真实验同时证明了并行效率的降低不会超过2%.  相似文献   

12.
将并行计算方法应用于含运动边界流场的数值模拟,采用弹簧方法生成非结构运动网格.并行程序结构采用主从模式,主进程只负责数据的发送和接收,每个从进程的计算任务对应一个子区域.通过守恒型ALE(Arbitrary Lagrangian-Eulerian)方程的求解,对NACA0012翼型振动问题进行了数值模拟,并对不同分区数目情况下的计算时间、并行计算加速比和并行计算效率进行了比较.算例结果表明,随着分区数的增加,进行计算CPU的效率先增加后下降,而并行计算的加速比不断增加.  相似文献   

13.
针对三维多子区激光推进并行数值模拟问题,基于按子区独立进行区域分解策略,引入物理网格点负载权重,实现了负载平衡.通过提高Cache命中率、优化消息传递、并行写文件等措施,使设计实现了所研究问题的并行化.并在某国产巨型机上对不同算例进行了测试.当并行度为16时,最低加速比高于8.96,实现了采用并行计算加快激光推进机理研究的目的.  相似文献   

14.
在对Ni-Cu二元合金进行三维模拟时采用了目前最有效的微观组织数值模拟方法—相场法.但是随着空间维数的增多,计算规模小、计算时间长、计算效率低成为突出的问题.为了解决以上问题,探讨基于MPI并行算法求解Ni-Cu二元合金自由生长的三维相场模型,分别采用MPI中点对点通信和组通信对串行程序进行并行设计,并对2种通信模式的加速比进行比较.同时采用不同的划分方法对并行程序中计算域进行划分并比较并行效率.结果表明:MPI并行方法可以使计算规模扩大到1 000个×1 000个×500个网格;在规模相同的情况下,组通信的加速比相对串行程序最高可以达到15.45倍,要高于点对点通信的10.06倍最高加速比;无论计算规模大小,点对点通信均适用,组通信由于数据缓存区的限制,不适用于计算规模较大的情况;面向行划分方式的计算效率和安全性均高于面向块划分方式.  相似文献   

15.
基于DDR内存总线的高速网络接入技术   总被引:1,自引:0,他引:1  
在机群系统中,机群的互连网络性能对整个机群系统的性能有着至关重要的影响.机群系统要求互连网络具有高带宽、低延迟、高可靠等特性,传统的互连网络接入方法基本上基于PCI接口.本文提出了基于DDR DIMM内存总线的接入思想,采用可编程逻辑器件FPGA实现网络接口设计,通过直接读写内存方式提高并行接入带宽,并将部分通讯协议下载到网卡上以提高计算和通讯的速度.实测表明,在不包括上层协议的情况下,接口卡的数据接入带宽可达3120 Mbps,给出了基于FPGA的实现方法,并用Xilinx Virtex-Ⅱ Pro-20 FPGA进行了仿真和验证.  相似文献   

16.
基于EPROCESS特征的物理内存查找方法   总被引:1,自引:1,他引:0  
为了快速定位目标活动进程,提取对应的物理内存数据,分析了Windows系统中进程运行时其EPROCESS结构的特性及作用,提出了基于EPROCESS特征的物理内存查找方法.该方法利用EPROCESS结构的特性,定位出活动进程的EPROCESS结构,找出进程页目录基地址,并根据虚拟地址描述符的功能,提取活动进程物理内存.实验结果表明,该方法能快速、有效地定位活动进程,提取出活动进程物理内存,缩小取证分析范围,提高取证效率.  相似文献   

17.
缓存压缩技术在计算机体系结构领域的应用日臻成熟.然而,因为现场可编程门阵列(FPGA)应用程序运行过程中对存储器的访问更规则,所以现有的计算机缓存压缩技术直接用于FPGA效率不高.本文提出了一种新颖的适用于FPGA的快速在线数据压缩的页式高速缓存压缩方法.该方法可以将数据压缩为标准大小的高速缓存行,避免了其他缓存压缩技术压缩数据后导致的内存碎片化问题.此外,我们还提出了一个简化的页式内存管理单元,以解决以往缓存压缩技术在新旧数据替换时空间不足的问题.实验结果表明:我们的页式高速缓存消耗硬件资源少,能够有效地压缩图像和矩阵数据,同时具备极低的压缩和解压缩延时的优点.  相似文献   

18.
设备驱动是计算机系统可靠运行的前提.现有的设备驱动方法,数据要经过驱动层缓存向应用层拷贝、应用层缓存向存储设备拷贝的过程,当数据量比较大时,系统的响应速度会受到一定的限制.通过对Linux内核的对象机制和虚拟内存机制的研究,提出基于对象的内存映射型设备驱动方法,使用户进程直接访问设备内存以提高响应速度,并对该驱动的性能进行测试和评价.  相似文献   

19.
在国产百万亿次超级计算机曙光5000A上进行了天体大规模数值模拟软件的性能和可扩展测试实验,详细介绍了软件中的测试程序以及测试环境和过程,并对测试结果进行了分析.对于80×80×50的网格规模,采用每节点4进程测试了16~128个处理器核,每节点8进程、16进程分别测试了16~512个处理器核,相对加速比最终分别达到5.33、10.48和12.57,并行效率分别达到66.66%、32.58%和32.29%.对于160×160×100的网格规模,测试了每节点16进程的64~8 192个核的性能,最大相对加速比为12.46,并行效率为9.73%.测试结果表明,曙光5000A具有良好的性能,测试结果对软件下一步的优化研究具有重要的指导意义.  相似文献   

20.
通过分析影响算法的并行效率的主要因素,根据分而治之策略中的分块思想提出了一种求解三对角方程组的并行追赶算法。然后在机群系统中,MPI环境下实现了该并行算法,对并行算法的加速比和效率与原串行算法进行了比较,结果表明此算法有较高的计算效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号