首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 89 毫秒
1.
对随机近邻分类方法做了深入的研究 ,采用了随机近邻判决准则 ,对一事例数据进行了计算 ,并与多元系统聚类得出的结果进行对比 ,显示出随机近邻分类方法具有较好的非线性、非球形分类的特点 ,值得进一步推广应用  相似文献   

2.
针对动态心电图波形数据量大且具有明显个体差异性的特点,提出了一种改进的K近邻分类算法,用于动态心电图波形分类.该算法首先将实例间的度量改为曼哈顿距离(City Block Distance),然后引入高斯核函数,将K近邻算法改进为非线性分类算法,以达到分类动态心电图波形的目的.实验结果表明,该算法在对动态心电图波形进行分类时,分类精度在90%以上.  相似文献   

3.
为了提高网络入侵检测模型的准确率与泛化性,提出基于随机k-近邻集成算法的网络流量入侵检测模型。首先,该模型提出一种集成赋权距离,来提高预测精度;其次,采用一种随机策略的集成方法对k-近邻模型进行集成,从而提高了其在异常检测过程中的全局和局部优化能力;然后,利用并行计算的方法提高了算法运行的效率;最后,构建了基于随机k-近邻集成算法的网络入侵检测模型,并采用KDD99数据集进行实验。实验结果表明,基于随机k-近邻集成算法相对于其他模型具有更好的检测效果,准确率和召回率分别达到99.05%和91.96%。  相似文献   

4.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。  相似文献   

5.
文章针对传统K-近邻分类方法学习效率低下的问题,提出一种基于并行计算的加速K-近邻分类方法(K-nearest neighbor classification method based on parallel computing,PKNN),即并行K-近邻分类.该方法首先将所需要分类的样本划分为不同的工作子集,然后在每个子集上进行并行的K-近邻分类.由于划分后每个工作子集的规模均远小于整个数据集的规模,因此降低了分类算法的复杂度,可有效处理大规模数据的分类问题.实验结果表明,PK-NN方法能提高分类效率.  相似文献   

6.
信息采集技术日益发展导致的高维、大规模数据,给数据挖掘带来了巨大挑战,针对K近邻分类算法在高维数据分类中存在效率低、时间成本高的问题,提出基于权重搜索树改进K近邻(K-nearest neighbor algorithm based on weight search tree,KNN-WST)的高维分类算法,该算法根据...  相似文献   

7.
曲超 《科学技术与工程》2013,13(19):5696-5701
在K近邻和逆K近邻理论基础上提出了K近邻团的概念。通过度量对象间的相似度,任意两个元素都互为K近邻和逆K近邻的对象集合构成一个K近邻团。利用同一个K近邻团中的对象彼此都具有较高相似性的特点,选取不同的K值对目标集合进行聚类。通过实验证明了该方法的有效性。  相似文献   

8.
在一组数据中寻找第k小元素是一个常见的问题.确定性算法可以在Θ(n)的时间内完成,但是却有一个很大的常数使得算法不太实用.源于Hoare的随机选择算法可以使得算法执行比较的期望次数小于4n.改进算法中随机选择分组元素的方法,将使新算法在数据为均匀分布时执行比较的期望次数小于3n.  相似文献   

9.
K-邻近算法作为一种比较简单,易于实现并且错误低的分类算法,广泛应用于网页分类、模式识别和数据挖掘等多个领域中.本文介绍了传统K-邻近算法并分析了该算法在网页相似度值的计算存在的不足,在此基础上,本文提出了基于类中心向量的K-近邻算法,通过理论分析和仿真实验结果证明了该算法对于中文网页分类具有较好的分类效果.  相似文献   

10.
本文用自定义的模糊加权距离代替K—近邻分类器中的明氏距离,这种替代突出了每一样本中占有优势的特征分量对距离的贡献。仿真实验及实用结果表明这种替换可进一步改善分类器的性能。  相似文献   

11.
基于随机森林的文本分类模型研究   总被引:3,自引:0,他引:3  
随着WWW的迅猛发展,文本分类成为处理和组织大量文档数据的关键技术.随机森林模型是决策树的集成,并且由一随机向量决定决策树的构造.当森林中的决策树的数目增大,随机森林的泛化误差将趋向一个上界.将随机森林模型应用于文本分类,在Reuter21578数据集上的实验表明,分类效果比较好,性能比较稳定,将共同C4.5,KNN,SM0,SVM4种典型的文本分类器进行了比较,结果显示它的分类性能胜于CA.5,同KNN,SMO和SVM方法相当.  相似文献   

12.
提出一种改进随机子空间与C4.5决策树算法相结合的分类算法.以C4.5算法构建决策树作为集成学习的基分类器,每次迭代初始,将SMOTE采样技术与随机子空间方法相结合,生成在特征空间和数据分布上差异明显的合成样例,为基分类器提供多样化的平衡训练数据集,采用绝大多数投票方法进行最终决策的融合输出.实验结果表明,该方法对少数类和多数类均具有较高的识别率.  相似文献   

13.
为了克服由错误标记样本所引发的问题,提出半监督分类器模型。从标记数据和未标记数据中学习得到决策准则,并在马尔科夫随机场中,运用一个新的基于鲁棒误差函数的能量函数,分别设计基于迭代条件模型和马尔科夫链蒙特卡罗的两种算法来推断标记样本和未标记样本的类别。实验结果表明这两种方法对于现实世界的数据集来说是高效的,并具有很好的鲁棒性。  相似文献   

14.
一个正常的全染色满足相邻点的点染色及关联边的色集不同时,称为邻点可区别全染色,其所用最少染色数称为邻点可区别的全色数。文中研究了一些Hamming距离图的邻点可区别全染色。  相似文献   

15.
针对词袋模型中的聚集算法对编码矢量之间空间关系信息或者概率分布信息单独建立数学模型,将马尔可夫随机场模型中的拟合参数矢量集合视为编码矢量的聚集矢量集合,计算每个聚集矢量对应的两两图像之间的核矩阵,然后使用基于支持向量机的多核学习方法求解核矩阵的最优线性组合系数以及支持向量系数,最后使用所得训练模型对测试图像进行分类.对于15类场景数据集和Caltech 101数据集,本文算法的分类正确率达到82.67%和62.94%,与其他算法相比具有更高的平均分类正确率.  相似文献   

16.
针对机构运动链的同构判断问题进行了讨论 ,提出了一种运动链同构判断的邻接矩阵法 ,并举例说明了此方法的具体运用 ,从而证明了采用邻接矩阵法 ,可准确、高效地判断运动链同构 .  相似文献   

17.
对2个随机变量的关系进行研究,首先引述了协方差和相关系数的概念,对相关系数从2个方面给出其内涵的深刻解释,阐述了相关系数与相关关系、线性相关与不相关之间的联系。其次,对随机变量的相关关系、线性关系、不相关关系及独立关系和非独立关系等分别进行了详细介绍,深入挖掘各种关系深刻内涵,揭示各种关系的内在联系。特别是对不相关关系、非独立性和独立性几种关系,通过实例进行了深入探讨。最后,对随机变量之间的各种关系进行分类,给出随机变量间按相关性优先划分的各种关系分类图,为初学者学习2个随机变量间的关系提供系统依据。  相似文献   

18.
煤矿监测数据实质是一种数据流,煤矿安全评价可以看作是数据流的分类,分类的标识为安全和不安全。在随机决策树模型的基础上,使用Hoeffding Bounds不等式与信息熵确定分割点,代替用随机选择方法确定分割点。实验结果表明该方法对数据流分类具有更好的分类精度,为煤矿安全评价提供了一种新的实用方法。  相似文献   

19.
改进线性同余法随机数发生器   总被引:4,自引:0,他引:4  
在粒子输运Monte Carlo程序中广泛采用线性同余法随机数发生器。为了改善该发生器产生的随机数序列的统计品质,该文基于洗牌法思想设计了一种新的随机数发生器。在新算法中,以原线性同余法随机数发生器的中间整型变量为基础,通过位操作来构造实现洗牌效果所需的随机整型变量。由于位操作的计算量较少,使得新算法在计算量上不会有明显的增加。而统计检验的结果表明,该方法对随机数序列统计品质的改善是显著的。同时,该文还阐述了新算法在并行环境中的应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号