首页 | 本学科首页   官方微博 | 高级检索  
     检索      

对基于SNM数据清洗算法的优化
引用本文:张建中,方正,熊拥军,袁小一.对基于SNM数据清洗算法的优化[J].中南大学学报(自然科学版),2010,41(6).
作者姓名:张建中  方正  熊拥军  袁小一
基金项目:国家自然科学基金资助项目
摘    要:对基本邻近排序算法SNM(basic sorted-neighborhood method)进行分析,指出其不足;提出基于SNM算法的一种优化算法,通过采集中南大学冶金矿物工程机构知识库的2 000多条文献记录作为样本数据进行实验研究,对记录的"脏数据"按照DC标准和相关规范进行清洗与排重.研究结果表明:与SNM算法相比,在同样的运算环境下,优化算法在招回率、误识别率和执行时间上有明显优势.

关 键 词:数据挖掘  数据清洗  重复记录  SNM算法

Optimization algorithm for cleaning data based on SNM
ZHANG Jian-zhong,FANG Zheng,XIONG Yong-jun,YUAN Xiao-yi.Optimization algorithm for cleaning data based on SNM[J].Journal of Central South University:Science and Technology,2010,41(6).
Authors:ZHANG Jian-zhong  FANG Zheng  XIONG Yong-jun  YUAN Xiao-yi
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号