首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接字的直接操作,完成了透明的容错功能.实验结果显示此策略对并行检查点系统性能有一定程度的改善,可以降低系统实现的复杂度,提高卷回恢复的可靠性,而且独立于并行系统,具有良好的移植性.  相似文献   

2.
并行处理是提高计算能力的一种方法,通过网络相互连接的工作站和PC构成一个庞大的资源,以多计算机互连为基础的集群成为一种新的高效的大规模并行计算工具.本文讨论了基于消息传递机制的并行处理系统MCC的设计和实现方案.MCC系统提供了消息队列管理、节点管理、任务管理等功能,为用户提供了一个良好的并行程序开发和设计的环境.  相似文献   

3.
并行程序可以充分发掘硬件计算能力并提高程序性能,但是在多核集群环境中编写并行程序十分复杂。该文提出了面向多核集群的并行编程框架,Horde。Horde提供了一组简单易用的消息传递接口和事件驱动(event-driven)编程模型,用以帮助程序员表达算法逻辑中潜在的并行性,将计算分解与底层硬件结构去耦合,从而简化编写并行程序的复杂度,灵活地在不同的底层结构的集群上进行映射并能保持良好的性能。此外,Horde也提供了有效的任务对象迁移机制,可以实现动态负载均衡与在线容错。在128核集群上的实验表明:Horde可以有效执行并行程序,并且可以实现高效的任务对象迁移。  相似文献   

4.
黄大鹏 《广东科技》2008,(3):106-108
本文主要介绍了一种利用集群技术实现双机容错的开发方法。通过对变电站自动化技术和容错相关技术的深入研究,结合现有的变电站自动化体系结构,采用了基于MSCS的纯软件的双机容错模式。分析了容错系统的可用性,并依据分析对双机容错系统进行了有针对性的改进,加强了集群的心跳侦测,保证了数据接管时的完整和准确,设计实现了一个低成本、高可用的后台监控系统,该系统已通过测试并投入使用。  相似文献   

5.
设置检查点是保存和恢复进程运行状态的一种重要技术,是实现容错、卷回调试和进程迁移的重要手段,研究了全透明检查点系统Epckpt在检查点技术的实现方法和机制上的局限性,给出了有效的改进方案,该方案可以实现进程号的恢复和对用户文件的检查点设置,同时采用检查点写复制缓冲机器提高了原有的检查点算法的性能。  相似文献   

6.
MPI在曙光—1000上的实现与分析   总被引:3,自引:0,他引:3  
消息传递接口MPI(mesagepasinginterface)定义了并行机消息传递接口标准,为解决并行程序的移植问题带来了新的曙光.作为国产大规模并行计算机曙光-1000系统软件设计的一部分,我们在曙光-1000上设计并实现了MPI.本文介绍了实现工作、应用实例以及对MPI的性能分析.  相似文献   

7.
电力营销信息管理系统是电力公司的业务支撑系统,其服务器系统要求的高可靠性已成为制约电力营销系统实施的关键因素之一;针对传统Cluster集群服务器系统存在的可靠性不足问题,对美国Stratus容错服务器的性能作了深入的技术剖析,结合电力营销系统的特点,提出了基于Stratus容错服务器的高连续可用性的电力营销系统结构,剖析了该方案的经济技术优势;实施应用效果表明,该方案经济性好,可实现连续可用性.  相似文献   

8.
为解决高可用异构容错系统的可用性评价问题,提出了一种针对高可用异构容错系统的混合可用性评价模型。设计实现异构容错原型系统,包括硬件体系结构框架及软件系统。采用Markov过程与随机Petri网相结合的方式,从可用性量化和系统状态转换两方面构建系统的可用性模型。根据该可用性模型估算系统的高可用指标,并与同构及非容错单机系统进行比较分析。结果表明,该可用性模型能够对异构容错系统进行准确的可用性评价,验证了系统5个9的高可用指标要求。最后总结了影响系统高可用性的主要因素及提升系统可用性的有效方法。  相似文献   

9.
本文介绍了一种8031两模冗余容错单片机系统,该系统采用脉冲级同步、总线采样比较检验错和检查点恢复等技术,具有故障卷回恢复、诊断隔离、降级运行功能,从而较大地提高系统的可靠性。  相似文献   

10.
蔡兴文 《科学技术与工程》2012,12(35):9540-9544
为了简化对地观测地面系统遥感数据并行处理软件的开发工作,在分析遥感数据处理流程、并行任务调度和容错策略的基础上,设计了遥感数据并行处理框架。该框架集成了遥感数据预处理并行任务调度、消息和数据交换、故障管理等公共功能,并设计实现了简单易用的插件接口规范,以支持多载荷、多种遥感数据预处理功能的扩展以实现并行处理,具有较好的通用性和功能扩展性。最后基于消息传递接口(MPI)技术,在集群上实现了遥感数据处理并行框架,并在此框架上实现遥感数据预处理的并行系统,完成了系统并行性能测试与分析,结果表明该框架在简化遥感数据预处理并行功能开发的同时还能满足遥感数据并行处理效率要求。  相似文献   

11.
设计了一个能降低系统自举时间,避免系统调用瓶颈,容错,动态可变以及面向应用的开放式并行操作系统。系统范围的消息传递是低延迟高效率,把并行操作系统设计成一族程序模块,并行应用是这个族不可缺少的组成部分,利用面向对象来高效地实现这样的并行操作系统。  相似文献   

12.
在分析导致I/O节点失效主要原因的基础上, 提出一种有效的并行文件系统容错方法: 子文件循环冗余备份. 该方法保证了I/O节点失效时并行文件的正常访问, 提高了并行文件系统的可靠性和有效性.  相似文献   

13.
在分布式计算机系统中,由于处理机间无共享内存,因此采用消息传递的方式实现处理机间的数据交换。文章介绍了消息传递接口标准和几种典型的并行计算环境,讨论了基于消息传递的网络并行编程环境的特点,并对其开发进行了初步探讨。  相似文献   

14.
以直通式交换网络为基础,研究高速并行计算和实时仿真的通信软件。在直通网协议上直接构造消息通信原语,不用TCP/IP协议;引入活跃消息(active message),支持高层通讯机制,减少通讯量和通信开销;在硬件基础上提供广播机制;为减少中断开销和通信阻塞,引入可编程控制的POLLING机制。实现了HPMPS(high performance message passing system)。所论述  相似文献   

15.
基于DSVM和消息传递的并行哈希连接算法的性能分析   总被引:1,自引:1,他引:0  
基于分布式共享虚拟存储器(DSVM) 的软件设计方法是运行在网络工作站(NOW) 上的支持并行计算与分布处理的新途径,它与传统的消息传递的编程方法不同·描述了在面向对象的分布式数据库系统ShusseUo 上,用DSVM 和消息传递两种方式分别实现并行哈希连接操作的3种算法;设计了测试数据库和3 种不同的负载;并分析了DSVM 和消息传递这两种设计方法的性能·大量的测试结果表明,基于DSVM 的算法的性能比传统的消息传递的算法稍差,但DSVM 具有易编程等优点,因此在并行处理上仍是一项很有研究和开发价值的技术·  相似文献   

16.
以一种实际研制成功的手持式计算机系统为背景,介绍了容错技术在该机上的应用和实际使用效果,同时也可作为同类型机器在引入容错技术以提高其可行性时进行借鉴和参考,有较强的实用性和推广性。  相似文献   

17.
对Grapes,Mx3dg和TH-PaPSM三种应用程序的通信模式进行了分析.重点讨论了点对点消息的数量、大小和目的进程的分布情况,对并行应用程序中的消息局部性进行了量化研究.本研究对设计符合真实应用的测试程序、优化科学应用程序具有较好的参考价值.  相似文献   

18.
HC-1型手持式计算机中的容错技术   总被引:2,自引:0,他引:2  
以一种实际研制成功的手持式计算机系统为背景,介绍了容错技术在该机上的应用和实际使用效果,同时也可作为同类型机器在引入容错技术以提高其可靠性时进行借鉴和参考,有较强的实用性和推广性。  相似文献   

19.
有TCP连接容错功能的网络负载平衡调度系统   总被引:2,自引:0,他引:2  
针对现有集群网络服务器负载平衡调度方案的不足,提出具有TCP连接容错功能的网络负载平衡调度系统。该系统基于Linux Virtual Server,使用两个前端调度设备并行调度。两个调度设备使用同构网卡为客户提供单一系统映像;通过内核中对请求包的过滤实现分流;通过相互容错屏蔽调度设备故障。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号