首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于D-S证据理论的不确定数据清洗
引用本文:樊金辉,岳昆,张骥先,刘惟一.基于D-S证据理论的不确定数据清洗[J].云南大学学报(自然科学版),2014,36(6):815-822.
作者姓名:樊金辉  岳昆  张骥先  刘惟一
作者单位:1.云南大学 信息学院 计算机科学与工程系,云南 昆明 650091
基金项目:国家自然科学基金(61163003,61472345);云南省中青年学术技术带头人后备人才培养计划(2012HB004);云南省应用基础研究计划(2014FA023,2013FB010);云南大学高水平创新团队培育计划
摘    要:数据清洗的任务是检测数据中存在的错误、缺失或不一致,通过删除、填充、修改等方法提高数据质量.针对存在元组级不确定性的数据表上的选择投影连接操作,基于D-S证据理论中置信区间的概念,给出辨识框架构建和置信区间计算的方法,提出了一种基于待测数据项置信区间来检测查询结果中错误数据的方法.实验结果表明,提出的不确定数据错误检测方法具有高效性、准确性和可用性.

关 键 词:不确定数据    数据清洗    错误检测    D-S证据理论    置信区间
收稿时间:2014-03-21

Cleaning uncertain data based on the D-S evidence theory
FAN Jin-hui,YUE Kun,ZHANG Ji-xian,LIU Wei-yi.Cleaning uncertain data based on the D-S evidence theory[J].Journal of Yunnan University(Natural Sciences),2014,36(6):815-822.
Authors:FAN Jin-hui  YUE Kun  ZHANG Ji-xian  LIU Wei-yi
Institution:1.Department of Computer Science and Engineering,School of Information Science andEngineering,Yunnan University,Kunming 650091,China
Abstract:Data cleansing is to detect errornous,missing or inconsistent data,which can be removed,filled or corrected to improve data quality.Aiming at the selection-projection-join operations on the tuple-level uncertain data tables,in this paper we gave the algorithms for constructing Frames of Discernment and computing the evidence intervals based on the corresponding concepts in the D-S evidence theory.Then,we proposed the method for detecting errornous data in the query results based on the evidence interval of the target data items.Experimental results show that our proposed method is efficient,accurate and applicable.
Keywords:uncertain data    data cleansing    error detection    D-S evidence theory    evidence interval  
本文献已被 CNKI 等数据库收录!
点击此处可从《云南大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《云南大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号