首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于自主计算的集群故障管理系统结构
引用本文:李璟,刘宏伟,董剑,舒燕君.基于自主计算的集群故障管理系统结构[J].清华大学学报(自然科学版),2011(Z1).
作者姓名:李璟  刘宏伟  董剑  舒燕君
作者单位:哈尔滨工业大学计算机科学与技术学院;
基金项目:国家“八六三”高技术项目(2006AA01A103)
摘    要:随着计算机技术的不断发展和系统规模的不断扩大,高可用集群系统的管理和维护变得越来越复杂。为了提供稳定的计算环境,并及时发现定位系统中的故障隐患,提出了故障的主动管理方法。该文首先分析了自主计算的相关概念和技术,在分析集群计算环境管理需求的基础上,提出了一种基于规则的自主故障管理软件结构。根据集群系统的特点,选择分级管理方式,设计了局部故障管理模块(LFM)和全局故障管理模块(GFM),并具体说明了二者内部的功能结构。

关 键 词:集群故障管理  自主计算  分级管理  

Cluster system fault management architecture based on autonomic computing
LI Jing,LIU Hongwei,DONG Jian,SHU Yanjun.Cluster system fault management architecture based on autonomic computing[J].Journal of Tsinghua University(Science and Technology),2011(Z1).
Authors:LI Jing  LIU Hongwei  DONG Jian  SHU Yanjun
Institution:LI Jing,LIU Hongwei,DONG Jian,SHU Yanjun(Department of Computer Science and Technology,Harbin Institute of Technology,Harbin 150001,China)
Abstract:With the continuous development of computer technologies and the expansion of system scales,cluster system management and maintenance is becoming more complex.A proactive fault management method for cluster computing systems was developed to provide reliable computing resources.The cluster fault management software architecture is based on autonomic computing and the requirements of cluster management.The level management system uses local and globe fault management.The functional structures of these two mo...
Keywords:cluster fault management  autonomic computing  level management  
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号