首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
在文本分类中,互信息是一种被广泛应用的特征选择方法,但是该方法仅考虑了特征的文档频而没有考虑特征的词频,导致它经常倾向于选择出现频率较低的特征.为此,提出了一个新的文档频并把它引人到互信息方法中,从而获得了一种优化的互信息方法,该优化的互信息方法不但考虑了特征的文档频而且还考虑了特征出现的词频,实验结果表明该优化的互信息方法性能良好.  相似文献   

2.
介绍模糊粗糙集约简算法,利用模糊区分矩阵产生最小约简.通过分析,说明了算法的不足,提出相应的改进策略.将启发性知识结合区分矩阵,提出了基于属性特征权值的启发式约简算法,文中算法意义更加直观,计算也更加简单,提高了约简算法的速度.采用VC进行实验,通过对多个UCI数据集进行测试,结果说明了改进算法的有效性.  相似文献   

3.
针对现有Web新闻文本分类方法准确率低且不能适应文本类型变化的问题,提出一种基于进化模糊规则的Web新闻文本挖掘和分类方法.首先,对每篇Web文本进行术语提取,并利用词频-逆向文档频率(TF-IDF)算法过滤掉一些具有较低描述能力的术语.然后,基于计算收集到的新的新闻文本内容与类别之间的余弦距离,利用eClass0分类器创建和更新模糊规则的数量和属性.最后,根据模糊规则推理和余弦距离进行文本分类.实验结果表明,该方法具有较高的正确分类率,且能够自适应Web新闻文本类别的变化.  相似文献   

4.
基于广义粗糙集的属性约简   总被引:1,自引:0,他引:1  
目前,人们对广义粗糙集的研究主要集中在集合的近似计算上,而真正利用广义粗糙集进行属性约简的研究还很少见.基于广义粗糙集理论研究了信息系统中属性约简的问题.首先定义了关系信息系统及其属性约简的概念.然后给出了属性约简的判定定理和辨识矩阵并详细地研究了属性约简的基本性质.最后给出了计算信息系统中属性的所有约简的一般方法.  相似文献   

5.
属性约简是粗糙集理论的热点研究内容之一,从信息论出发,提出一种新的信息熵定义.约简算法从条件信息熵出发,迭代选择属性重要性最大的属性,得到信息系统的约简.在此基础上,构造基于条件信息熵的不完备信息系统的动态属性约简算法.在删除单个对象的情况下,新算法通过新的数据集有无删除对象的不可区分对象来判断是否更新原有约简.通过实例说明算法的有效性和可行性.  相似文献   

6.
基于政府部门或企事业单位发布的电子文档都是不允许被非法恶意的篡改,本文提出了一种基于汉字次序的文本零水印算法.首先统计电子文档中汉字的出现频次,然后提取高频次和低频次汉字出现的次序作为文档特征来构造零水印.仿真实验结果表明该文本水印算法构造的水印具有很好的透明性,在电子文档受到篡改的情况下,不需要原文档就可以有效地检测出.  相似文献   

7.
在测试代价敏感决策系统中,测试代价敏感属性约简方法是一种寻找测试代价尽量小的属性集的有效方法.但是,约简后决策系统只保留了简洁完整的信息,其所构造的分类器精度会有所降低.假设我们拥有有限但多于最小测试代价的资源,那么我们可以充分利用这些资源来获得更高质量的分类器.本文针对这种情况做了以下两个工作:1)我们在最小测试代价约筒的基础上添加好属性,寻找一个更好的属性集.2)提出了一种改进的决策树算法,提高分类器质量.该算法选择一些当前最好的属性值来构建结点,这些属性值能够覆盖当前相应的训练集.实验表明:1)改进的决策树算法能够获得比ID3更高的分类准确度;2)与最小测试代价约简的分类器相比,在最小测试代价约筒的基础上添加一些的好属性,可以获得更高质量的分类器;3)该方法在减少测试代价开销的同时,保证了分类器的质量.  相似文献   

8.
城市中危险化学品的运输直接影响人民人身安全,为了合理规划运输路线,提出了一种基于蚁群优化(ACO)算法的多目标路线规划方案.首先,将运输路线图和相关属性建模成一个有向图.然后,根据路线距离、车辆负载和人口分布等属性,构建运输风险和运输时间的计算方法 .最后,综合考虑运输风险和运输时间构建一个目标函数,通过ACO算法来寻找最优路线.仿真结果表明,该方法能够得到最优路线,有效降低运输风险.  相似文献   

9.
一种基于变精度区分矩阵的不完备信息系统属性约简   总被引:1,自引:0,他引:1  
基于相容关系把多数包含关系引入不完备信息系统,对容差关系进行了扩充,使之更具有灵活性,在此基础上提出一种能容忍数据中包含噪声的变精度区分矩阵,给出了基于该变精度区分矩阵的一种有效属性约简算法,并通过具体实例验证了该算法.  相似文献   

10.
属性核的确定对于求属性约简具有重要的意义,利用协调信息系统中条件属性的划分相对于决策属性划分的概率分布为单点分布的性质,提出一种新的求核算法.采用多个UCI数据集进行实验,结果表明该算法的效率高于基于辨识矩阵和基于信息熵的求核算法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号