排序方式: 共有68条查询结果,搜索用时 203 毫秒
41.
急切式学习策略和懒惰式学习策略有着不同的学习和分类机制.通过分析急切式学习策略下的普通决策树模型和懒惰式学习策略下的懒惰式决策树模型,提出了一种新的决策树分类模型即Semi-LDtree.它生成的决策树的结点,如普通决策树一样,包含单变量分裂,但是叶子结点相当于一个懒惰式决策树分类器.这种分类模型保留了普通决策树良好的可解释性,实验结果表明它提高了分类速度和分类精确度,特别是在大的数据集合上效果更加明显. 相似文献
42.
基于领域知识的文本分类 总被引:3,自引:0,他引:3
提出了一种基于知识的文本分类方法,其中引入领域知识,利用领域特征作为文本特征,增强文本表示能力,将文本分类过程看作集聚计算过程.文本索引过程采用了改进型特征选取和权重计算方法.提出了一种基于互信息的学习算法,从训练语料中自动学习领域特征集聚计算公式.实验结果显示基于领域知识的文本分类技术总体性能优于传统的贝叶斯分类模型,领域知识的应用能够有效改善对相似主题和相反主题的分类性能. 相似文献
43.
44.
45.
贝叶斯算法在文本分类时需要进行特征提取,传统特征提取算法存在特征提取不够准确,进而导致分类效率不高。为解决此问题,提出一种基于滑动窗口的特征选取方法,该方法能扩大特征的选取范围。实验表明,改进后的方法可以有效地提高文本的分类精度。 相似文献
46.
研究了如何将神经网络应用于生成北京所辖饭店的客房出租率预测模型的建立,给出了客房出租率预测的结果.实验结果说明,用神经网络预测出的客房出租率优于多回归法和自然推论法. 相似文献
47.
48.
通过软件缺陷预测可以有效地提高软件测试效率,保证软件产品的质量。针对新开发的项目面临训练数据不足,标注代价高以及源项目与目标项目的缺陷模式难以匹配的问题,提出了基于主动学习的跨项目软件缺陷预测方法。首先使用主动学习方法对目标项目进行筛选标注,其次将得到的标签集与跨项目数据进行数据融合和模式匹配,最后构建跨项目软件缺陷预测模型。采用真实的软件缺陷数据进行实验,在保证预测率的前提下,曲线下面积(area under curve, AUC)能够达到0.692,与传统方法相比综合性能均有显著提升。结果表明:所提方法可以通过模式匹配有效提高跨项目软件缺陷预测模型的性能。 相似文献
49.
jBNC是一个著名的基于贝叶斯网的分类器,当处理的数据集不是很大,并且数据集的属性值的个数不是很多时,jBNC拥有很出色的性能.对jBNc原来计算统计信息的接口作出了修改,将巨大的数据集和jBNC所需要的统计信息存储到数据库的表中,并且应用SQL语句来计算各种所需要的统计信息.通过这种方法,jBNC就具有了处理大数据集的能力.实验结果说明了这种改进的有效性,同时也指出了该方法的缺点. 相似文献
50.
一种基于粗糙集合理论的树扩张型贝叶斯网络分类器 总被引:3,自引:0,他引:3
在许多实际问题中朴素贝叶斯分类器的属性独立性假设是不成立的,为了进一步提高分类精度,许多研究者提出了一些试图放宽属性独立性假定的方法,其中树扩张型朴素贝叶斯分类器是近来广泛研究的一种有效的方法.基于基本粗糙集合理论中属性不精确或部分依赖关系的定义,提出了一种新的选择性受限树型贝叶斯网络分类器.通过实验表明该分类器在大多数实际问题上比当前两种最新的TAN分类器具有更低的误分类率,并且保持了计算上的高效性. 相似文献