排序方式: 共有107条查询结果,搜索用时 15 毫秒
1.
文章提出一种融合互近邻和可信度的K近邻算法,根据互近邻的概念删除噪声数据;利用由近邻诱导待分类样本标签的可信度,避免待分类样本近邻中大类吃小类的概率。该算法不仅可以减小噪声数据对分类的影响,而且一定程度上增强了K近邻分类算法的稳定性。该算法在UCI标准数据集上进行了测试,性能相当或优于其他分类器。 相似文献
2.
关联规则在高校学位预警中的应用 总被引:2,自引:1,他引:1
关联规则挖掘算法能发现大量数据中项集之间相关的关联,运用Apriori算法对计算机科学与技术专业某一届毕业生成绩数据进行挖掘,得到了不能授予学位学生的不及格课程规律,这些规律对低年级学生的学习和在学位预警中具有一定的指导意义。 相似文献
3.
结合可信度约束,提出解决序列模式发现研究的算法,并分别对以下两种方案展开研究.I:先寻找所有满足最小支持度的最大高频序列,后计算最大高频序列的各阶可信度.II:先计算最大高频序列的各阶可信度,后寻找所有满足最小支持度的最大高频序列。 相似文献
4.
两类决策系统中规则获取的联合决策矩阵算法 总被引:1,自引:0,他引:1
提出了联合决策矩阵的概念以及基于联合决策矩阵的两类决策系统规则获取算法.将条件属性等价矩阵和决策属性等价矩阵合并到一个矩阵中,大大减少了矩阵生成过程的比较次数,能有效提高算法的效率.用一个实例说明了算法的执行过程,并通过算法复杂度分析与实验结果对比,进一步说明了该方法的有效性. 相似文献
5.
基于RBF神经网络的粮食生产预测研究 总被引:1,自引:1,他引:0
提高中国粮食生产量的预测精度与效率是人们关注的一个重要问题.对RBF神经网络的结构、特性和训练算法作了简要的概述.根据粮食产量与其影响因素之间存在的映射关系,应用RBF神经网络建立了多因素非线性时间序列预测模型,并进行了仿真试验.结果表明,用RBF神经网络进行粮食生产预测得到了十分满意的结果. 相似文献
6.
一种改进的中文分词歧义消除算法研究 总被引:1,自引:1,他引:0
随着信息技术的飞快发展,今天的互联网上信息已成爆炸式增长,文本挖掘技术成为目前研究的热点.文章概述了中文分词的算法,通过介绍歧义存在的种类,分析了分词结果歧义性存在的必然性;在中文分词基础上,提出了一种采用"动词优先"的歧义消除算法,使分词结果最大程度地消除歧义,从而提高了分词的精度,为文本挖掘之后的环节打下了基础. 相似文献
7.
一种基于层次树的高效密度聚类算法 总被引:2,自引:1,他引:1
基于密度的聚类算法具有挖掘任意形状聚类和处理"噪声"数据等优势,同时也存在时间消耗大、参数问题局限及输入顺序敏感等缺陷.为此,文章提出一种基于层次树的密度聚类算法DCHT(Density Clustering Based on Hierarchical Tree),以层次树描述子聚类信息,动态调整密度参数,基于密度探测树结构中相邻子聚类得到最终的聚类簇.理论分析和实验结果表明,该算法适用于大规模、高维数据,并具有动态调整参数和屏蔽输入顺序敏感性的优点. 相似文献
8.
基于Relief算法的特征学习聚类 总被引:3,自引:0,他引:3
聚类作为数据挖掘常用工具之一,是按照事物间的相似性进行的一种无监督分类.然而传统的聚类方法较少考虑特征权值.为此,通过研究、分析Relief算法及其在聚类应用中存在的问题,提出了一种基于Relief算法的特征评价函数,并将此函数运用到特征学习聚类中,以解决特征权值取值不当对聚类产生的负面影响. 相似文献
9.
新闻网页自动识别的相关特征研究 总被引:1,自引:0,他引:1
因特网包含着内容广泛、形式各异的信息资源.新闻网页的过滤、摘要和分类已经成为当今的研究热点,因此,如何准确地识别出新闻网页成为迫切需要解决的问题.在研究典型新闻网页特征的基础上,提出一种面向新闻网页自动识别的网页特征集,并采用三种不同的分类算法构建分类器.实验结果表明,在本文所提出的新闻网页特征集的基础上构建的分类器能很好的识别新闻网页. 相似文献
10.
传统的决策树方法在实际应用中存在很多不足,如生成树规模过大,抗噪性较差等,因此,提出了将变精度粗糙集和混合变量集算法应用于决策树分类中,通过变精度和混合属性集分类减小树的规模和过度拟合问题,降低了噪声数据对属性选择的影响,并通过实验证明该算法与传统的算法相比具有较大的优越性。 相似文献