首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 62 毫秒
1.
目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接字的直接操作,完成了透明的容错功能.实验结果显示此策略对并行检查点系统性能有一定程度的改善,可以降低系统实现的复杂度,提高卷回恢复的可靠性,而且独立于并行系统,具有良好的移植性.  相似文献   

2.
郑杰辉 《科技资讯》2009,(25):32-32
并行虚拟机上的容错技术是一个研究热点。本文在原有PVM系统功能的基础上,应用检查点卷回技术设计了一个FTPVM系统,详细探讨了系统的结构设计及主要功能的实现。  相似文献   

3.
为了提高局域网下信息存储和传输的安全性与高效性,利用消息传递接口(Message Passing Interface)实现在多核处理器中加密/解密文件的方法.实验结果表明,针对大容量的多媒体文件,基于消息传递接口的并行处理模式具有明显的优势.  相似文献   

4.
并行处理是提高计算能力的一种方法,通过网络相互连接的工作站和PC构成一个庞大的资源,以多计算机互连为基础的集群成为一种新的高效的大规模并行计算工具.本文讨论了基于消息传递机制的并行处理系统MCC的设计和实现方案.MCC系统提供了消息队列管理、节点管理、任务管理等功能,为用户提供了一个良好的并行程序开发和设计的环境.  相似文献   

5.
对于大数据量图像和复杂图像处理算法,并行处理是一种有效的解决方法.基于消息传递接口,设计了一种并行图像边缘检测算法,并在曙光4000L并行机上予以实现.数值实验结果表明,并行图像处理能显著减少计算时间,更多的计算节点能得到更大的加速比,该并行图像处理算法对于大数据量图像更加有效.  相似文献   

6.
并行程序的应用在提高程序运行效率的同时,也带来了不确定性的错误.这种错误往往难以复现,传统的调试工具越发难以满足并行程序的调试需求.据此提出了一种面向并行程序错误检测以及确定性回放的方法,针对并行程序中容易发生的数据竞争、死锁、原子性违反这几类错误进行检测判断;对并行程序的运行进行插桩以保证程序重复执行时的次序一致.在此理论基础上设计实现了Eclipse插件.通过试验,该工具可以对并行程序易发的错误进行有效的检测判断,较大程度地减少程序调试的工作量.  相似文献   

7.
在设计飞控计算机时采用了冗余技术(4余度容错计算机),保证系统实现人以两次故障工作,三次故障安全(fo/fo/fs).采用完善的余度管理技术和余度表决监控算法,进行故障的隔离定位和屏蔽,飞控计算机采用多速率任务调度策略,保证了系统的实时性.作者详细地描述了该容错计算机的软件/硬件设计结构、系统调度策略和余度管理算法,  相似文献   

8.
一种基于PVM的交错一致检查点算法   总被引:1,自引:0,他引:1  
研究了一种基于PVM的交错一致检查点算法,该算法对系统资源的战胜率小,冻结时间短,尤其当计算节点具有多个处理器时,进行检查点操作不会由于对存储器的争用而导致用户进程的冻结,提高了检查点算法的效率,同时,该算法的IPC机制是基于PVM的消息传递机制,因而所有操作对用户程序是透明的。  相似文献   

9.
介绍了虚拟接口体系结构的消息传递标准 ,对它的结构作了较详细的分析 ,并和已有的通信类协议在结构及实现方法等方面作了比较 ,显示了这种传递标准的优越性和发展潜力  相似文献   

10.
针对当前网络存储技术存在的存储服务瓶颈问题,介绍了一个高可靠可扩展PC集群存储系统的容错设计方案.利用广泛用于加密解密技术的SHA-1算法来产生数据对象的副本ID,然后根据各个存储结点的权值信息,利用散列函数将数据对象复制到各个存储结点,使系统具有很好的容错性.另外描述了系统中对数据对象存储、读取、删除的基本方法,并介绍一种类似基于时戳的法定数选举方法来维护系统中数据对象副本的一致性.最后对系统的可靠性以及系统所支持的最大用户量进行了分析.  相似文献   

11.
MPI并行编程环境及程序设计   总被引:2,自引:0,他引:2  
通过对MPI原理和特点的研究,给出了并行MPI程序的基本设计思路和执行过程,并实现了向量相加的并行计算.  相似文献   

12.
通过对MPI并行进程的拓扑结构及其通讯特点进行分析,提出了网络拓扑结构切片的思想,并实现了在MPI中对一般网络拓扑结构进行任意切片的MPI库函数。通过对MPI笛卡尔拓扑结构进行切片实验性能分析,得出构造切片通讯子进行通讯的方法要优于使用原始通讯子的方法。  相似文献   

13.
当前,拥有超级计算能力的计算机系统通常是大型商用系统形成计算机集群.与所有的分布式系统一样,这些系统通过独立的计算机硬件协同合作共同实现超级计算的能力.然而在拥有超级计算能力的同时,集群中的任何一个组件随时都可能失效,从而导致错的输出.为了提高集群在系统出现故障的情况下的鲁棒性,许多容错技术已经被设计和实现,用以处理各种类型的系统故障.本文对各种现有的容错技术进行了总结归纳,以便在此基础之上进行进一步的研究从而适应当前环境下的系统容错.  相似文献   

14.
针对异构网格的复杂环境,提出了一种基于网格平台的新型消息传递接口(MPI)程序设计和运行框架Grid MPI(G-MPI),实现了网格中集群内部节点和集群外部节点的有效通信,从而提供了一个更广意义上的虚拟集群环境.G-MPI作为一个网格中间件,提供给网格平台上有并行任务需求的用户使用.G-MPI提供了C/C 编程接口,使得在集群环境下用这两种语言开发的并行程序,不必经过改动,就可以移植到网格环境下运行.网格环境下并行程序的开发,也变得相对容易.G-MPI加强对并行任务运行状态监控的同时,针对某些特殊的并行任务,给出了新框架下任务异常时的二次调度方案.应用实例验证了新框架的有效性.  相似文献   

15.
基于区域分解和MPI的线性带状方程组归并迭代解法器   总被引:1,自引:0,他引:1  
线性带状方程组并行解法器往往基于两层迭代的区域分解方法,采用M P I(m essage pass ing in terface)实现,因此导致的总迭代次数太多或者进程通信开销太大都会使解法器效率低下。该文通过研究减少迭代次数和降低进程通信开销的方法,设计了一种适合区域分解和M P I系统的高效的归并迭代并行解法器。这种解法器通过引入全局加速收敛算法,把两层迭代归并为一层迭代,有效减少了迭代求解的总次数,并且采用分块并行技术降低M P I系统上加速收敛算法的进程通信开销。实验证明归并迭代并行解法器能够保证和串行解法器大致相当的总迭代次数,分块并行加速收敛技术能够降低接近1/2的全局进程通信时间。  相似文献   

16.
用传统的串行算法进行矩阵相乘运算会受到矩阵规模、单机的CPU主频、内存大小和存储器空间等方面的限制.而使用并行算法是解决上述限制的最有效途径.为此,在集群计算环境下,使用SPMD计算模型和基于MPI消息传递技术设计实现了矩阵相乘的并行算法.实验表明,此并行算法在一定矩阵规模下具有较好的加速比和并行效率.  相似文献   

17.
针对MPI互操作问题进行研究,重点探讨了跨域并行计算所涉及的计算资源描述、进程信息交互等技术问题.采用动态虚连接技术优化了点点通信的性能,并采用拓扑感知的聚合优化算法优化了全局通信,实现了多域MPI运行环境Lyra-MPI,支持MPI2.0的动态特性.测试结果表明Lyra-MPI系统的综合能力强,可以很好地支持大规模MPI应用的跨域运行.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号