首页 | 本学科首页   官方微博 | 高级检索  
     检索      

归纳式学习中连续型数据的区间划分问题
引用本文:陈秉正,韩春鹏.归纳式学习中连续型数据的区间划分问题[J].系统工程理论与实践,2001,21(4):1-7.
作者姓名:陈秉正  韩春鹏
作者单位:清华大学经济管理学院
基金项目:国家自然科学基金(79670049)
摘    要:主要研究的是归纳式学习中连续型样本数据的分组问题 .在归纳式学习方法中 ,对样本数据的不同分组会直接影响到所生成的反映变量间相互关系的规则 ,从而影响到对新样本的识别效果 .特别是对样本数据为连续型的数据的分组问题 ,目前尚未得到很好的解决 .本文在类相关离散化方法的基础上 ,提出了用极大熵法进行初始区间划分 ,用多因素优选法调整区间的边界 ,二阶概率统计检验与实际意义相结合进行区间合并的一整套划分区间的方法 ,并用本文建立的新方法体系对中国宏观经济的某些指标间的相互关系进行了分析 ,取得了良好的效果.

关 键 词:归纳式学习  分类  离散化    
文章编号:1000-6788(2001)04-0001-07
修稿时间:1999年7月27日

Discretization for Inductive Learning from Continuous Sample Data
CHEN Bing-zheng,HAN Chun-peng.Discretization for Inductive Learning from Continuous Sample Data[J].Systems Engineering —Theory & Practice,2001,21(4):1-7.
Authors:CHEN Bing-zheng  HAN Chun-peng
Institution:School of Economics and Management,Tsinghua University
Abstract:This paper is mainly about discretization for inductive learning from continuous sample data. In inductive learning approach, how to discretize the sample data can directly affect the creation of the production rules and the recognizing result. But the problem of discretization of continuous data hasn't been well solved. In this paper, a new discretization method, based on the class\|dependent discretization, is proposed. This approach consists of three main processes: interval initialization using the maximum entropy criterion, interval improvement using multi\|dimensional optimization, and interval combination using the second\|order probability statistical estimation and the criteria from real world. In addition, this paper uses the new method to analyze some problems of China macro\|economy. It is proved that the method in this paper can get a promising result.
Keywords:inductive learning  classification  discretization
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《系统工程理论与实践》浏览原始摘要信息
点击此处可从《系统工程理论与实践》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号