首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
利用Linux操作系统检查点机制,中断正在运行的Apache服务器进程,进行核心转储产生了Core文件,在这个Core文件中保存被中断进程的上下文。位于集群中另外一个结点上的空闲Apache服务器进程重新加载Core文件,恢复被中断进程的上下文,恢复进程中断前打开的文件和网络连接,实现Apache服务器进程的迁移,并给出了集群中Apache服务器进程迁移的理论研究和实现技术。  相似文献   

2.
提出一种预设系统的一致检查算法PCCP1.算法以有通信关系的相关进程为设检查点的原则,设置系统一致检查点.描述了算法PCCP1的基本思想和执行过程,及在实验室环境中的模拟实现.  相似文献   

3.
利用Linux操作系统检查点机制,中断正在运行的Apache服务器进程,进行核心转储产生了Core文件,在这个Core文件中保存被中断进程的上下文。位于集群中另外一个结点上的空闲Apache服务器进程重新加载Core文件,恢复被中断进程的上下文,恢复进程中断前打开的文件和网络连接,实现Apache服务器进程的迁移,并给出了集群中Apache服务器进程迁移的理论研究和实现技术。  相似文献   

4.
软件容错技术是保证系统高可靠性及高可信性的有力工具。设计并实现了一种在VxWorks系统下基于检查点的任务恢复机制。通过对VxWorks系统下检查点文件内容的分析,采用3种方法来解决检查点的任务恢复问题:基于内存预先分配的主动内存管理,解决任务恢复时数据内存地址变化的问题;建立系统内核对象池,实现支持多任务之间同步和通信的内核对象的恢复;设计用户层任务恢复中间件,实现用户级检查点设置和任务恢复。最后设计基于VxWorks和PowerPC的计算平台原理样机,通过对单任务、多个单任务、多任务通讯、以及多任务协调工作4个测试用例的分析表明,所设计的基于检查点的任务恢复实现方案能正确保存任务关键信息及保证任务恢复的正确性和一致性。  相似文献   

5.
为了保证大规模集群系统的可靠性和可用性,设计并实现了一个面向集群消息传递并行程序的容错系统。该系统采用检查点设置与卷回恢复技术,提出了基于内存排除的退出重进入并行环境策略,实现了对用户程序完全透明的容错功能、进程迁移以及系统自动重构。实验结果表明:检查点设置和系统恢复开销小于10%,符合大规模并行程序容错功能的要求。该系统提高了集群系统的可靠性和可用性,其设计结构和实现方法可以方便地移植到其他消息传递系统。  相似文献   

6.
目前采用检查点设置技术的并行程序容错系统存在着不能透明处理通信环境变量的缺点,需要在设置检查点之前关闭进程间通信套接字,在恢复之后重新构建,为此提出了基于内存功能划分的通信隔离策略,分离计算模块和通信模块,避免对通信套接字的直接操作,完成了透明的容错功能.实验结果显示此策略对并行检查点系统性能有一定程度的改善,可以降低系统实现的复杂度,提高卷回恢复的可靠性,而且独立于并行系统,具有良好的移植性.  相似文献   

7.
介绍Condor的工作原理和Condor的检查点机制.对Condor的检查点机制进行了改进,实现了进程迁移时间的减少,减少了作业运行时间,同时还削弱了目标节点对源节点的依赖性.通过一个具体的作业调度程序成功地测试了Condor的检查点的正确性、检查点功能的可用性、检查点库提供的一些编程接口API的可用性和对Condor检查点机制改进的可行性.  相似文献   

8.
针对Linux下ELF可执行文件的加栽执行过程,采用先产生原进程整体构架,再恢复断点信息的方法,实现了中断进程的恢复。该方法有内核改动小,可扩展性较大等优点,对集群及分布式应用具有一定参考价值。  相似文献   

9.
在并行和分布式计算环境中,随着系统规模的增长,系统出错的概率大大增加.为保证分布式系统的高可靠性,检查点/回滚恢复技术是一种广泛使用的容错技术.在对传统检查点技术进行分析和评述的基础上,介绍了分布式检查点系统设计的关键技术及实现方法.  相似文献   

10.
在对定时器、注册表读写、系统快照及进程创建等技术的综合研究的基础上,设计并建立了进程组互启模型,实现进程组中进程的自身安全,从而解决反安全软件对部分计算机安全检测进程的克制问题。  相似文献   

11.
一种基于PVM的交错一致检查点算法   总被引:1,自引:0,他引:1  
研究了一种基于PVM的交错一致检查点算法,该算法对系统资源的战胜率小,冻结时间短,尤其当计算节点具有多个处理器时,进行检查点操作不会由于对存储器的争用而导致用户进程的冻结,提高了检查点算法的效率,同时,该算法的IPC机制是基于PVM的消息传递机制,因而所有操作对用户程序是透明的。  相似文献   

12.
远程高性能计算环境的设计与实现技术   总被引:1,自引:0,他引:1  
Ri CE(remote high computing environm ent)系统旨在建立以高性能并行计算机为计算资源的远程计算环境。系统合理划分本地机和远端机的工作任务 ,引入增量更新、压缩传送、检查点设置和恢复等多种传输措施 ,并集成了负载平衡工具 ,提供了身份检查、日志记录等安全机制 ,改变了传统的 Telnet工作模式。具有联网、远程执行过程对用户透明、系统安全性好和适应我国低带宽、实时性差、可靠性低的网络现状的特点。用户可以以较低的成本方便地使用远程计算机系统 ,从而充分发挥高性能计算机的性能。 Ri CE系统目前已在曙光 2 0 0 0和 IBM SP2等系统上运行通过 ,表明该系统性能良好 ,达到了系统设计目标  相似文献   

13.
Checkpointing Scheme for Relevant Distributed Real-Time Tasks   总被引:2,自引:0,他引:2  
IntroductionReal-ti me response and reliability are the mostconcerned characteristics for perfor ming distributed real-ti me tasks in a safety critical system. Generally , adistributed real-ti me scheduling is adopted to ensure thereal-ti me response first , and fault-tolerant method ofresource redundancy is needed then.For transient faults in the certain occurrence andrecovery rates ,this paper studies the fault-tolerant methodbased on the static scheduling for distributed real-ti metasks . T…  相似文献   

14.
This paper describes a parallel computing platform using the existing facilities for the digital watershed model. In this paper, distributed multi-layered structure is applied to the computer cluster system, and the MPI-2 is adopted as a mature parallel programming standard. An agent is introduced which makes it possible to be multi-level fault-tolerant in software development. The communication protocol based on checkpointing and rollback recovery mechanism can realize the transaction reprocessing. Compared with conventional platform, the new system is able to make better use of the computing resource. Experimental results show the speedup ratio of the platform is almost 4 times as that of the conventional one, which demonstrates the high efficiency and good performance of the new approach.  相似文献   

15.
When applied to mobile computing systems,checkpoint protocols for distributed computing systems would face many new challenges, such as low wireless bandwidth, frequent disconnections, and lack of stable storage at mobile hosts. This paper proposes a novel checkpoint protocol to effectively reduce the coordinating overhead. By using a communication vector, only a few processes participate in the checkpointing event. During checkpointing, the scheme can save the time used to trace the dependency tree by sending checkpoint requests to dependent processes at once. In addition, processes are non- blocking in this scheme, since the inconsistency is resolved by the piggyback technique. Hence the unnecessary and orphan messages can be avoided. Compared with the traditional coordinated checkpoint approach, the proposed non-blocking algorithm obtains a minimal number of processes to take checkpoints. It also reduces the checkpoint latency, which brings less overhead to mobile host with limited resources.  相似文献   

16.
<正> Due to the mobility of mobile hosts,checkpoints and message logs of the computing process may disperseover different mobile support stations in the checkpointing and rollback recovery protocol for mobilecomputing.Three existing checkpoint handoff schemes do not give well consideration to the efficiency offailure-free process execution and the recovery speed of the failure process at the same time.A dynamicadaptive handoff management of the checkpointing and rollback recovery protocol for mobile computing isproposed in this paper.According to the individual feature and current state of each mobile host,differentimplementations are selected dynamically to complete the handoff process upon the handoff event.Performance analyses show that the proposed handoff management incurs a low loss of performance duringfailure-free and achieves a quick recovery upon the process fault.  相似文献   

17.
介绍了业主方工程建设项目的管理的思想、内容、方法和手段,分析了项目管理的核心职能,指出业主方应明确在项目管理业务中的角色,使其能够正确运用自身权利,发挥出项目建设管理的核心作用,以保证项目管理业务流程的高效运作和项目的成功。  相似文献   

18.
基于因子分析对工程项目风险评价   总被引:1,自引:1,他引:0  
崔楷 《河南科学》2012,30(1):138-140
针对工程项目管理的实际,以多元统计分析中的因子分析为基础,建立了工程项目风险的评价指标体系,运用SPSS软件,对工程项目管理的数据进行因子分析,最后以因子得分作为工程项目风险的综合评价值,得出影响工程项目风险的重要因素,从而抓住重要因素,提高效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号