首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
基于Linux集群的高性能计算环境   总被引:1,自引:0,他引:1  
为了提高高性能集群计算系统的计算能力,采用了类似于Beowulf的系统结构和Linux操作系统,提出了Linux环境下基于MPICH软件包的并行集群构建方法,在实验室网络环境下使用多台普通计算机完成了集群的构建,实现了集群的单一登录,单一文件管理,为今后在集群上进行并行编程提供了一个实际的软硬件环境。研究结果表明:构建的基于Linux集群的高性能计算环境,在多机并行环境下,运算时间较单机环境有明显提高。  相似文献   

2.
研究蒙特卡罗控制变量方法在CPU(central processing unit)集群和GPU(graphic processing unit)计算环境中的实现问题.以离散取样的随机波动率下的算术平均亚式期权为例,选取合适的控制变量,分别研究了在CPU集群和GPU计算中算法与硬件并行加速两者的运算效率,并讨论了模型参数的变化对计算结果的影响.数值试验表明采用算法与硬件加速相结合的方法可以极大提高计算效率、缩短运算时间.  相似文献   

3.
地震勘探技术发展早已进入TB(terabytes)级数据时代,并逐步迈向PB(petabytes)级。为提升海量数据处理效率,将地震数据处理算法进行并行化是一种广泛采用的手段。但是一些复杂度较高的算法,诸如地震数据重建类方法等,并行化难度较大,加速效果不理想。Spark作为一种面向大数据处理的通用分布式并行计算技术,可以应用于并可简化地震数据处理算法并行化过程。借助于Spark的优势,通过两个实例讨论了基于Spark的地震数据重建并行化方法,提出了对于具有复杂输入输出组织数据方式的算法的并行化方法,提升了算法效率。研究成果为该类算法的Spark并行化开发提供了有益借鉴。  相似文献   

4.
为解决分子动力学计算系统LAMMPS(Large scale Atomic/Molecular Massively Parallel Simulator)运算数据量大、不易控制的问题,应用云计算方法,设计了智能化、高效化的集群LAMMPS运算系统架构。该架构将FTP(File Transfer Protocol)存储技术、UDP(User Datagram Protocol)快速网络传输、LAMMPS分子动力学计算技术相结合,降低了运算过程中的人工干预,提高了分子模型处理效率,并为分子级别物理、化学的计算机仿真研究提供了新的集群化解决方案。  相似文献   

5.
基于CUDA技术城市小区电波传播并行计算的研究   总被引:1,自引:1,他引:0  
无线电射线跟踪效率一直是电波传播场强模拟预测的核心问题之一。随着计算统一设备架构(compute u-nified device architecture,CUDA)技术的提出彻底改变传统的x86硬件架构体系,从硬件底层上为并行计算提供了可能。在CUDA被提出用于通用计算的前提下,提出了CUDA技术与射线跟踪相结合,介绍了CUDA如何实现异构体计算,如何在CUDA硬件平台上实现并行化编程,然后通过一个简单的三维地理数据模型实现了无线电波射线跟踪的并行化计算。最后对实验结果进行了分析与总结,证明CUDA技术能很好地提高运算效率。  相似文献   

6.
天波超视距雷达信号处理的并行化   总被引:1,自引:1,他引:1  
在Sun工作站群,Sun HPC Cluster Tools系统和MPI消息传递接口环境下,研究了天波超视距雷达信号处理的并行化,对其两个核心部分二维FFT(距离-多普勒变换)和数字波束形成实现了并行。通过不同粒度并行方案的比较发现,粗粒度方案在MPI环境下具有较好的并行效果,同时在现有硬件和软件环境下进行了方案的比较、选择、可扩展性的分析和设计,实验结果表明,并行处理方案在数据处理的速度和实时性方面有较大提高。  相似文献   

7.
利用Spark平台对电力用户侧的大数据进行分析,提出基于梯度提升树的并行负荷预测方法.首先对历史负荷和天气数据集进行并行化分割处理,并采用特征提取与转换方法获取到预测模型所需的特征向量;然后合理设定Spark集群节点数以及调节Hadoop分布式文件系统(HDFS)分块大小;最后将参数调优后的梯度提升树模型部署到Spark分布式平台上进行训练与预测,并将该模型预测结果与其他预测模型进行精度比较.研究结果表明:通过合理划分HDFS中存储块的大小能有效提高集群对于大数据处理的效率,分布式梯度提升树算法在快速性与准确性上均有比较大的优势,能够满足电力负荷预测的要求.  相似文献   

8.
响应面法对提拉单晶生长参数进行数值模拟优化时,要通过单晶提拉的数值模拟计算获得响应面函数拟合所需要的试验数据,这些数据的获得占据整个响应面法优化求解的大部分时间。为提高优化效率,本文应用响应面方法的并行化算法对直拉单晶生长参数进行了优化。在Windows环境下搭建并行运算平台,采用C语言编制,以MPI消息传递方式的并行响应面优化并行程序。通过对串行和并行程序的优化所需时间进行对比,可以使并行后的优化效率提高80%以上。采用并行化的响应面法优化方法对提拉单晶生长向着更高的方向发展提供了更迅捷的途径。  相似文献   

9.
将并行计算理论和方法引入到导管架碰撞极限承载力的非线性分析中,根据美国石油学会API RP 2A-WSD标准中的方法建立桩腿非线性抗侧力-位移曲线,考虑桩-土非线性的特点分析导管架碰撞极限承载力。利用该方法对埕岛油田某导管架平台的碰撞极限承载力进行研究,分别得到平台在碰撞力作用下的平台顶部荷载-位移曲线、主桩腿弯矩变化、Mises应力变化曲线等。将集群并行运算的结果与单一PC机的结果进行对比,验证并行计算的计算精度和计算效率,同时研究不同影响因素对并行加速比和并行效率的影响。计算结果表明:平台主桩腿最大位移、应力随碰撞位置的降低而增大;碰撞位置越低,平台的碰撞极限承载能力越大;并行计算所得到的结果与单一PC机运算得到的结果相差很小,是可信的;并行加速比随着参与并行结点数的增加而增大,并行效率随着参与并行结点数的增加而下降;随着模型节点和单元数目的增多,集群的并行效率提高,并且越复杂的模型和结构在进行计算时集群并行计算能力的优势越明显。  相似文献   

10.
针对蛋白质多重结构比对需要大量运算的问题,基于渐进式成对结构比对策略,设计了并行化的蛋白质多重结构比对架构及其在网格计算环境下的实现机制.实验结果表明并行算法大大提高了比对效率,减少了比对时间,提高了重用性.该并行蛋白质多重结构比对架构及实现方法可应用于其他的多重结构比对.  相似文献   

11.
基于工作站机群系统研究了H.264视频编码的并行实现方法以增强视频编码实时处理性能,对实现过程中的并行处理策略和数据划分方法进行了深入分析,在多种层次上剖析了各种方法的优势与不足,指出采用联合调度策略的并行编码系统能够在实时高效编码的同时获得可扩展性和低时延.对采用联合调度策略的并行编码系统进行了系统的性能分析,并且导出了该类并行视频编码系统"加速比"的计算关系式,表明增加并行处理节点数和减小"同步等待时间"与"基本数据单元处理时间"的比值可以提高该类并行计算系统的加速比.  相似文献   

12.
针对地球物理勘探领域海量数据处理需求和行业高性能资源整合需求,结合地震资料数据并行处理特征,利用网格技术建设应用网格分布并行处理平台,详细介绍平台的体系结构和关键技术,成功部署包含两个虚拟社区的应用网格平台。进行Marmousi模型地震波场正演模拟网格并行处理、基于模糊聚类作业划分策略的叠前深度偏移并行处理、积分法叠前时间偏移并行处理。验证了平台的稳定性和并行作业划分策略的有效性,平台效率与传统并行处理平台相比效率相当。结果表明,利用该平台可以进一步整合更多高性能资源,扩大并行处理规模,提高资源的利用率,缩短数据处理周期。  相似文献   

13.
使用TCP/IP协议将某些地震数据处理软件设计成网络并行处理程序,可极大地提高计算效率。文章详细叙述了实现该方法的一种技术路线,对网络并行程序设计和网络并行处理中会遇到的一些问题进行了讨论,并提出了解决方案。实际运算结果证实该技术路线和解决方案是切实可行的  相似文献   

14.
将并行计算方法应用于含运动边界流场的数值模拟,采用弹簧方法生成非结构运动网格.并行程序结构采用主从模式,主进程只负责数据的发送和接收,每个从进程的计算任务对应一个子区域.通过守恒型ALE(Arbitrary Lagrangian-Eulerian)方程的求解,对NACA0012翼型振动问题进行了数值模拟,并对不同分区数目情况下的计算时间、并行计算加速比和并行计算效率进行了比较.算例结果表明,随着分区数的增加,进行计算CPU的效率先增加后下降,而并行计算的加速比不断增加.  相似文献   

15.
针对传统钻削过程中经常出现断屑、排屑困难以及加工质量差等问题, 提出了轴向超声振动辅助钻削加工方法,并研究了其运动特性和断屑机理.利用自行设计的轴向超声振动辅助钻削系统对45号钢进行了传统钻削与轴向超声振动辅助钻削的对比试验.从孔的粗糙度、表面微观形貌、切屑形态等方面进行研究.结果表明,相对于传统钻削,轴向超声振动辅助钻削能有效降低孔表面粗糙度,改善孔表面微观形貌.另外,对试验结果进行方差分析,结果显示主轴转速和超声振幅对孔表面粗糙度有显著影响,其中当振幅在20μm,主轴转速在450r/min时加工效果最好.  相似文献   

16.
根据3D点云数据处理计算特点,按照BSP模型的技术思想,建立了3D点云BSP并行计算模型。讨论了HAMA框架下的3D点云BSP并行计算模型的实现方法,构建了一个由普通PC组成的HAMA计算集群。以3D点模型构建计算为例,给出了一种3D点云数据处理BSP算法设计方法。实例的计算结果表明:BSP并行计算方法能高效地完成3D点模型构建计算,与其它计算方法相比,计算效率有所提高。  相似文献   

17.
基于TMS320C80的视频图像处理系统的研制   总被引:6,自引:0,他引:6  
目的 研究基于多处理器的并行运算在图像处理中的应用,方法 建立TMS320C80硬件平台,采用C语言与两种汇编语言混合编程的方法实现图像蝗并行处理,结果 该图像处理系统能够完成图像的实时处理,进行边缘提取的速度可达到30帧/s,采用互相关模板匹配方法进行跟踪的速度可达到14帧/s,结论 基于多CPU的并行运算可以对图像进行实时处理,减少硬件系统的复杂性,并行运算的效率主要由多个任务在多个处理器上的  相似文献   

18.
透平机械转子系统不对中故障定量诊断监测方法研究   总被引:1,自引:0,他引:1  
针对透平机械转子系统不对中故障程度难以定量诊断的问题,提出一种基于转子的状态监测数据建立转子平行不对中量与节点振动通频幅值的关系曲线来定量诊断转子平行不对中故障的方法。对平行不对中状态下的转子进行受力分析得到转子不对中激励力,通过建立的转子试验台有限元数值分析模型计算得到不同不对中激励力下的转子节点振动通频幅值,进而通过分析转子节点振动通频幅值与不对中量的对应关系曲线及转子运行正常数据对关系曲线进行修正;根据监测得到的转子节点振动通频幅值反推出转子平行不对中量,达到对平行不对中故障定量诊断的目的。最后试验验证了定量诊断方法的可行性。  相似文献   

19.
基于MapReduce的中文词性标注CRF模型并行化训练研究   总被引:1,自引:0,他引:1  
针对条件随机场模型面对大规模数据传统训练算法单机处理性能不高的问题, 提出一种基于MapReduce框架的条件随机场模型训练并行化方法, 设计了条件随机场模型特征提取及参数估计的并行算法, 实现了迭代缩放算法的并行。实验表明, 所提出的并行化方法在保证训练结果正确性的同时, 大大减少了训练时间, 效率得到较大提升。  相似文献   

20.
在石油勘探地震资料处理中,反Q滤波方法能有效地对地震波进行振幅补偿和相位校正,为地震反演和储层预测提供更准确的信息。对于大规模的地震道集数据处理,反Q滤波方法在CPU计算平台上执行时间较长,影响了地震解释的效率。分析发现,反Q滤波方法大量时间消耗在振幅相位补偿与短时傅里叶变换。在GPU平台上,首先,对振幅相位补偿部分进行并行化;其次,对批量短时傅里叶变换用CUFFT库进行加速;最后,对批量短时傅里叶变换进一步优化并将其应用于反Q滤波方法。实验结果表明,相比CPU计算环境,基于CUFFT库的反Q滤波并行算法效率提升了3.9倍,优化后的批量短时傅里叶变换进一步将效率提升了12%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号