粗等价类双边递减下多次Hash的渐增式求核与约简算法 |
| |
作者姓名: | 赵洁 张恺航 董振宁 徐克付 |
| |
作者单位: | 1. 广东工业大学 管理学院 管科系, 广州 510520;2. 中国科学院 信息工程研究所, 北京 100093 |
| |
基金项目: | 国家自然科学基金(71401045,71571052);广东省自然科学基金(2016A030310300) |
| |
摘 要: | 为设计高效约简算法,首先以全局等价类为最小计算单位提出粗等价类概念,证明粗等价类下约简与原信息系统等价;然后深入剖析1,0,-1三类粗等价类的性质,把求正区域等价转化为0-粗等价类双边递减下的渐增式计算,结合1和-1-粗等价类的传递性,设计双边横向删减实体和纵向删减属性的优化规则,可在每一轮增量计算中缩减计算域,基于此设计多次Hash的属性增量划分方法;最后给出新的渐增式快速求核与约简算法,其中求核基于纵向优化规则,可在一次计算中求得多个非核属性,无需遍历全部属性.基于UCI、海量和超高维3类数据集进行多个实验,实验结果证明本文求核与约简算法是高效完备的,在海量数据与超高维数据集下有较大优势.
|
关 键 词: | 粗糙约简 核 粗等价类 多次Hash |
收稿时间: | 2015-07-31 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《系统工程理论与实践》浏览原始摘要信息 |
|
点击此处可从《系统工程理论与实践》下载全文 |
|