期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

胡远来母智弘《成都理工大学学报(自然科学版)》2002,29(6):690-693

对随机近邻分类方法做了深入的研究 ,采用了随机近邻判决准则 ,对一事例数据进行了计算 ,并与多元系统聚类得出的结果进行对比 ,显示出随机近邻分类方法具有较好的非线性、非球形分类的特点 ,值得进一步推广应用相似文献

2.

苑静中《天津师范大学学报(自然科学版)》2008,28(3):60-63

针对动态心电图波形数据量大且具有明显个体差异性的特点,提出了一种改进的K近邻分类算法,用于动态心电图波形分类.该算法首先将实例间的度量改为曼哈顿距离（City Block Distance）,然后引入高斯核函数,将K近邻算法改进为非线性分类算法,以达到分类动态心电图波形的目的.实验结果表明,该算法在对动态心电图波形进行分类时,分类精度在90%以上. 相似文献

3.

基于随机k-近邻集成算法的网络流量入侵检测

张承烨李卓轩曹进德《南通大学学报(自然科学版)》2023,(3):26-32

为了提高网络入侵检测模型的准确率与泛化性,提出基于随机k-近邻集成算法的网络流量入侵检测模型。首先,该模型提出一种集成赋权距离,来提高预测精度;其次,采用一种随机策略的集成方法对k-近邻模型进行集成,从而提高了其在异常检测过程中的全局和局部优化能力;然后,利用并行计算的方法提高了算法运行的效率;最后,构建了基于随机k-近邻集成算法的网络入侵检测模型,并采用KDD99数据集进行实验。实验结果表明,基于随机k-近邻集成算法相对于其他模型具有更好的检测效果,准确率和召回率分别达到99.05%和91.96%。相似文献

4.

一种改进的代价敏感随机森林算法

下载免费PDF全文

杨杰明高聪曲朝阳阚中锋高冶常成《科学技术与工程》2018,18(6)

随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。相似文献

5.

一种并行的加速K-近邻分类方法

王秀华王建珍《太原师范学院学报(自然科学版)》2014,(4):44-46,79

文章针对传统K-近邻分类方法学习效率低下的问题,提出一种基于并行计算的加速K-近邻分类方法(K-nearest neighbor classification method based on parallel computing,PKNN),即并行K-近邻分类.该方法首先将所需要分类的样本划分为不同的工作子集,然后在每个子集上进行并行的K-近邻分类.由于划分后每个工作子集的规模均远小于整个数据集的规模,因此降低了分类算法的复杂度,可有效处理大规模数据的分类问题.实验结果表明,PK-NN方法能提高分类效率. 相似文献

6.

基于权重搜索树改进K近邻的高维分类算法

下载免费PDF全文

梁淑蓉陈基漓谢晓兰《科学技术与工程》2021,21(7):2760-2766

信息采集技术日益发展导致的高维、大规模数据,给数据挖掘带来了巨大挑战,针对K近邻分类算法在高维数据分类中存在效率低、时间成本高的问题,提出基于权重搜索树改进K近邻(K-nearest neighbor algorithm based on weight search tree,KNN-WST)的高维分类算法,该算法根据... 相似文献

7.

一种基于K近邻团的聚类算法

下载免费PDF全文

曲超《科学技术与工程》2013,13(19):5696-5701

在K近邻和逆K近邻理论基础上提出了K近邻团的概念。通过度量对象间的相似度,任意两个元素都互为K近邻和逆K近邻的对象集合构成一个K近邻团。利用同一个K近邻团中的对象彼此都具有较高相似性的特点,选取不同的K值对目标集合进行聚类。通过实验证明了该方法的有效性。相似文献

8.

一种改进的随机选择算法

周鹏《三峡大学学报(自然科学版)》2007,29(5):470-473

在一组数据中寻找第k小元素是一个常见的问题.确定性算法可以在Θ(n)的时间内完成,但是却有一个很大的常数使得算法不太实用.源于Hoare的随机选择算法可以使得算法执行比较的期望次数小于4n.改进算法中随机选择分组元素的方法,将使新算法在数据为均匀分布时执行比较的期望次数小于3n. 相似文献

9.

改进的K-近邻算法在中文网页分类的应用

盛魁《佳木斯大学学报》2011,(6):908-911

K-邻近算法作为一种比较简单,易于实现并且错误低的分类算法,广泛应用于网页分类、模式识别和数据挖掘等多个领域中.本文介绍了传统K-邻近算法并分析了该算法在网页相似度值的计算存在的不足,在此基础上,本文提出了基于类中心向量的K-近邻算法,通过理论分析和仿真实验结果证明了该算法对于中文网页分类具有较好的分类效果. 相似文献

10.

面向不平衡数据集的一种改进的k-近邻分类器

刘鹏杜佳芝吕伟刚窦明武《东北大学学报(自然科学版)》2019,40(7):932-936

心脏心律失常数据集的心电图(ECG)数据往往存在各心律失常类型下样本数量不平衡问题.针对此问题,提出了一种新的模式识别分类方法,即改进的基于核的差重建的加权k-近邻分类器(modified kernel difference-weighted k-nearest neighbor classifier, MKDF-WKNN),通过引入修正因子对含样本数较多的类别进行权值抑制,对含样本数较少的类别进行权值的加大,并使用UCI心脏心律失常数据集对ECG数据进行分类.实验结果表明,提出的算法和其他一些基于KNN的算法如KNN,DS-WKNN,DF-WKNN和KDF-WKNN相比,对于不平衡的心律失常数据集的分类有更好的效果. 相似文献

11.

改进随机子空间与决策树相结合的不平衡数据分类方法

胡小生《佛山科学技术学院学报(自然科学版)》2013,(5):22-26

提出一种改进随机子空间与C4.5决策树算法相结合的分类算法.以C4.5算法构建决策树作为集成学习的基分类器,每次迭代初始,将SMOTE采样技术与随机子空间方法相结合,生成在特征空间和数据分布上差异明显的合成样例,为基分类器提供多样化的平衡训练数据集,采用绝大多数投票方法进行最终决策的融合输出.实验结果表明,该方法对少数类和多数类均具有较高的识别率. 相似文献

12.

基于随机森林的文本分类模型研究 总被引：3，自引：0，他引：3

张华伟王明文甘丽新《山东大学学报(理学版)》2006,41(3):5-9

随着WWW的迅猛发展，文本分类成为处理和组织大量文档数据的关键技术．随机森林模型是决策树的集成，并且由一随机向量决定决策树的构造．当森林中的决策树的数目增大，随机森林的泛化误差将趋向一个上界．将随机森林模型应用于文本分类，在Reuter21578数据集上的实验表明，分类效果比较好，性能比较稳定，将共同C4．5，KNN，SM0，SVM4种典型的文本分类器进行了比较，结果显示它的分类性能胜于CA．5，同KNN，SMO和SVM方法相当．相似文献

13.

基于马尔可夫随机场和多核学习的图像分类

杨赛赵春霞《华中科技大学学报(自然科学版)》2014,(10)

针对词袋模型中的聚集算法对编码矢量之间空间关系信息或者概率分布信息单独建立数学模型,将马尔可夫随机场模型中的拟合参数矢量集合视为编码矢量的聚集矢量集合,计算每个聚集矢量对应的两两图像之间的核矩阵,然后使用基于支持向量机的多核学习方法求解核矩阵的最优线性组合系数以及支持向量系数,最后使用所得训练模型对测试图像进行分类.对于15类场景数据集和Caltech 101数据集,本文算法的分类正确率达到82.67%和62.94%,与其他算法相比具有更高的平均分类正确率. 相似文献

14.

若干Hamming距离图的邻点可区别全染色

田双亮《长春工程学院学报(自然科学版)》2007,8(1):78-79

一个正常的全染色满足相邻点的点染色及关联边的色集不同时,称为邻点可区别全染色,其所用最少染色数称为邻点可区别的全色数。文中研究了一些Hamming距离图的邻点可区别全染色。相似文献

15.

用邻接矩阵法判断运动链同构

谭蓉《兰州理工大学学报》2002,28(3):46-48

针对机构运动链的同构判断问题进行了讨论 ,提出了一种运动链同构判断的邻接矩阵法 ,并举例说明了此方法的具体运用 ,从而证明了采用邻接矩阵法 ,可准确、高效地判断运动链同构 . 相似文献

16.

随机变量间的相互关系与分类

石业娇 ;孟宪涛《沈阳师范大学学报(自然科学版)》2014,(2):222-225

对2个随机变量的关系进行研究,首先引述了协方差和相关系数的概念,对相关系数从2个方面给出其内涵的深刻解释,阐述了相关系数与相关关系、线性相关与不相关之间的联系。其次,对随机变量的相关关系、线性关系、不相关关系及独立关系和非独立关系等分别进行了详细介绍,深入挖掘各种关系深刻内涵,揭示各种关系的内在联系。特别是对不相关关系、非独立性和独立性几种关系,通过实例进行了深入探讨。最后,对随机变量之间的各种关系进行分类,给出随机变量间按相关性优先划分的各种关系分类图,为初学者学习2个随机变量间的关系提供系统依据。相似文献

17.

基于改进的随机决策树的煤矿安全评价方法

孙刚 ;周华平 ;孙克雷《阜阳师范学院学报(自然科学版)》2014,(2):46-49

煤矿监测数据实质是一种数据流,煤矿安全评价可以看作是数据流的分类,分类的标识为安全和不安全。在随机决策树模型的基础上,使用Hoeffding Bounds不等式与信息熵确定分割点,代替用随机选择方法确定分割点。实验结果表明该方法对数据流分类具有更好的分类精度,为煤矿安全评价提供了一种新的实用方法。相似文献

18.

改进线性同余法随机数发生器 总被引：4，自引：0，他引：4

沈华韵张鹏王侃《清华大学学报(自然科学版)》2009,49(2):191-193

在粒子输运Monte Carlo程序中广泛采用线性同余法随机数发生器。为了改善该发生器产生的随机数序列的统计品质,该文基于洗牌法思想设计了一种新的随机数发生器。在新算法中,以原线性同余法随机数发生器的中间整型变量为基础,通过位操作来构造实现洗牌效果所需的随机整型变量。由于位操作的计算量较少,使得新算法在计算量上不会有明显的增加。而统计检验的结果表明,该方法对随机数序列统计品质的改善是显著的。同时,该文还阐述了新算法在并行环境中的应用。相似文献

19.

基于邻接谱主分量分析的肿瘤分类方法

陈乐王年苏亮亮王蕊平《安徽大学学报(自然科学版)》2011,35(4):86-91

基于谱图理论展开针对基因表达谱数据的分类研究,将反映图结构的特征表示引入到基因表达谱数据分类中,从而高维空间离散点分布问题便可以转化成为具有结构信息的图问题.文中对基因表达谱数据样本点构造高斯权邻接矩阵,SVD分解后,采用特征记分准则进行筛选,找出最大限度区分肿瘤样本与正常样本的主分量作为样本特征,输入KNN分类器进行分类,通过对白血病两个亚型(ALL与AML)与结肠癌表达谱数据进行实验,证明了文中方法的可行性与有效性. 相似文献