首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在多源域迁移学习应用中,现有的分类模型大多对数据标签要求较高,难以适应数据集的动态变化和标签缺失情况.针对该问题,提出一种基于动态域定界的循环分类模型CAMDOT(cyclic classification model based on dynamic domain delimitation).首先,引入互信息量化各数据域间的相关性,提高分类模型适应异构用户和数据动态变化的能力.其次,针对数据标签缺失和不平衡问题,提出一种循环分类算法.最后,通过理论与实验分析,验证该模型在多源域数据训练中具有较高的分类准确率.  相似文献   

2.
针对绝大部分多变量决策树只能联合数值型属性,而不能直接为带有分类型属性数据集进行分类的问题,提出一种可联合多种类型属性的多变量决策树算法(CMDT).该算法通过统计各个分类型属性的属性值在各个类别或各个簇中的频率分布,来定义样本集合在分类型属性上的中心,以及样本到中心的距离.然后,使用加权k-means算法划分决策树中的非终端结点.使用这种结点划分方法构建的决策树可用于数值型数据、分类型数据以及混合型数据.实验结果表明,该算法建立的分类模型在各种类型的数据集上均获得比经典决策树算法更好的泛化正确率和更简洁的树结构.  相似文献   

3.
针对单一变量选择算法中模型分类精度和泛化能力较低的问题,提出一种混合变量选择算法.该算法分为两个阶段:过滤阶段,利用互信息快速排除一部分无关变量,降低样本空间的维数;封装阶段,在置换理论框架下,利用随机森林精选剩余变量.实验结果表明,该算法与对比算法相比具有更高的分类精度和泛化能力.  相似文献   

4.
为了提高SVM在大规模数据集上的训练效率和检测精度,对训练数据预处理后进行无监督聚类,通过一定规则选取对训练SVM有用的样本向量,并结合改进的AdaBoost算法来增强SVM在大规模数据的分类和泛化能力,最后通过Kdd Cup 99数据进行实验验证算法性能.  相似文献   

5.
一种基于AdaBoost的SVM分类器   总被引:6,自引:0,他引:6       下载免费PDF全文
针对AdaBoost的分量分类器的分类精度和差异性互为矛盾、以至于该矛盾的存在降低了AdaBoost算法的分类精度和泛化性的问题,提出了一种变σ-AdaBoostRBFSVM算法,通过根据训练样本调整各个分量分类器的核函数参数值,使分量分类器在精度和差异性之间达到一定的平衡,从而提高了集成分类器的分类精度和泛化性。对标准数据集的分类实验结果表明了算法的有效性。  相似文献   

6.
目前决策树中很多分类算法例如ID3/C4.5/C5.0等都依赖于离散的属性值,并且希望将它们的值域划分到一个有限区间。利用统计学法则,提出一种新的连续属性值的划分方法;该方法通过统计学法则来发现精准的合并区间。另外在此基础上,为提高决策树算法分类学习性能,提出一种启发式的划分算法来获得理想的划分结果.在UCI真实数据集上进行仿真实验.结果表明获得了一个比较高的分类学习精度、与常见的划分算法比较起来有很好的分类学习能力。  相似文献   

7.
针对假币的特征未知以及样本数量不平衡的局限性问题,提出基于半监督辅助分类生成对抗网络的纸币红外特征鉴伪算法.辅助分类生成对抗模型可以扩充样本的数据集,经过半监督的方式训练得到分类器进行分类,实现对纸币红外特征的鉴伪.实验结果表明,该算法能提高假币鉴伪的准确率以及泛化能力.  相似文献   

8.
提出了一种基于LPA和Tri-Training算法的半监督文本倾向性分类框架.通过LPA对初始样本进行快速分类,获得更多可信的有标签数据,优化分类框架的训练过程.引入Tri-Training算法,提高分类框架的泛化能力和可用性.实验结果表明,在不同标注比例的样本集上,该框架都有较好的分类性能,相较有监督学习算法和单一的半监督算法提高了分类精度,并有较强的鲁棒性,为解决有标签样本比例较少情况下的文本倾向性分类提供了一个新的思路.  相似文献   

9.
由于符号属性数据缺乏固有的几何特性,不能简单地将现有的数值属性数据分类算法应用于符号属性数据.为了提高符号属性数据的性能,提出一种基于关联关系分析的支持向量机分类方法(Support Vector Machine Classification Approach Based on Correlation Analysis,CA_SVM).通过分析属性值与标签之间的相关性,得到属性值对标签的影响因子;然后结合属性值在类内出现的频率,使得所有原始符号数据下的属性值在不失信息的情况下转换成数值型数据;转换后的数据既可以体现属性值与标签之间的关联关系,也可以有效地表示相同属性下属性值之间的距离;最后用支持向量机(Support Vector Machine,SVM)进行分类.在标准UCI数据集上的实验结果表明,CA_SVM模型能够提高分类精度.  相似文献   

10.
为了提取一个类标区别于其他类标的本质特征,增强类标数据集的可解释性,提出了一种面向主属性值的类标特征分析方法.该方法首先建立了一种直观的面向主属性值的类标特征模型,然后设计了对应的类标特征抽取算法,最后给出了一种基于类标特征分析的分类算法.实验结果表明:所建立的类标特征模型能够直观、有效地描述类标数据集中各类标的特征,给出的类标特征抽取算法有较高的执行性能,提出的分类算法在针对类标较少的数据集时有较高的分类准确率.  相似文献   

11.
在具有缺失数据的数据集的分类过程中,缺失的数据中蕴含着有用的信息未被考虑的情况会引起分类精度的下降。增量式的学习能够利用不断加入的信息更新学习模型,并充分利用先验信息求解当前问题。给出了一个利用朴素贝叶斯分类模型实现对缺失数据的增量分类的算法。该算法在增量学习的过程中考虑了缺失数据和先验信息对分类器的影响。  相似文献   

12.
针对传统基于卷积神经网络的服装分类算法无法满足海量多样服装分类需求的问题,提出一种卷积注意力融合的服装分类网络.该网络采用并行结构,包含一个ResNet分支和一个Transformer分支,充分利用卷积运算提取的局部特征和自注意力机制提取的全局特征,以增强网络的表征学习能力,从而提高服装分类算法的性能和泛化能力.为验证该方法的有效性,在数据集Fashion-MNIST和DeepFashion上进行了对比实验.结果表明:在数据集Fashion-MNIST上,该方法取得了93.58%的准确率;在数据集DeepFashion上,该方法取得了71.1%的准确率;该方法优于其他对比方法的实验结果.  相似文献   

13.
针对糖尿病数据特征维度较高,单一分类器过度拟合导致性能受限,不能较好对糖尿病进行分类识别这一问题,提出了一种深度置信网(Deep Belief Networks,DBN)融合梯度提升决策树(Gradient Boosting Decision Tree,GBDT)的糖尿病检测算法(DBN-GBDT).该算法利用DBN对海量数据的特征提取和拟合复杂模型的能力,GBDT算法具有很强的泛化能力,将DBN用于特征提取和特征降维,GBDT方法用于分类.将提出的算法用于糖尿病数据分类识别,并与DBN、GBDT、SVM和随机森林四种经典方法进行对比.实验结果表明,该算法分类精度较高,稳定性更强,为糖尿病检测提供了新的方法.  相似文献   

14.
卷积神经网络的全连接层作为一个经典的分类器,是根据传统的梯度下降法来实现训练的,泛化能力有限.针对这一问题,提出了一种将卷积神经网络和极限学习机相结合的混合模型应用于图像分类领域.卷积神经网络用于从输入图像中提取特征,特征映射最终会被编码成一维向量送入极限学习机中进行分类.给出了混合模型的详细设计,包括参数设计、结构分析以及迭代过程中反向传播算法的推导.实验结果表明,混合模型分类精度和快速性优于传统模型.在MNIST数据集上的分类精度达到了99.32%,GTSRB德国交通标志数据集上的分类精度达到99.35%.批尺寸相同时,混合模型的训练时间仅为卷积神经网络模型的9.9%~10.3%,同时测试速度是卷积神经网络模型的1.50~1.56倍,大幅缩短了时间.  相似文献   

15.
提出了一种新的量化容差关系,建立了变精度粗糙集模型并提出了基于重要度的属性约简算法。新的模型考虑了决策属性值对条件属性值概率分布的影响并且具有一定噪声数据处理和错误分类容许能力。最后通过实例表明了该模型具有处理含有空值数据问题的能力。  相似文献   

16.
二进制粒神经网络及其在分类中的应用   总被引:1,自引:0,他引:1  
为了提高分类器的正确识别率并降低特征选择的时间复杂度, 提出二进制粒神经网络框架.在该框架下,提出一种二进制粒神经网络分类算法.该算法通过二进制粒矩阵将特征空间进行最优约简,并利用基于BP的学习算法实现分类;将该算法在UCI数据集上进行测试,并与BP神经网络分类算法进行比较.仿真实验表明,二进制粒神经网络分类算法比BP神经网络分类算法分类正确率更高,泛化能力更强,是一种有效可行的分类算法.  相似文献   

17.
一种改进的基于粗糙集的启发式值约简算法   总被引:1,自引:0,他引:1  
在求得决策表中属性值核的基础上,用属性重要度指导增加后续属性值,还引入包含度和支持度统计度量,生成了不同置信度水平下的决策规则集,并设计了基于规则集的分类算法。对Monk数据集的对比实验表明,该算法是有效的。  相似文献   

18.
不完备数据聚类是聚类分析中的一个重要问题.现有的不完备数据聚类算法对缺失值仅填充一次进行聚类,没有充分利用数据的已知信息,致使填充效果不佳,影响了聚类的有效性.文章提出了一种基于动态填充的不完备数据聚类算法.首先利用均值填充法对缺失数据进行初始完备化,然后利用K-means算法对填充后的数据集进行聚类,同时用含缺失值对象所在类的类中心的相应属性值对其再次填充,直到聚类结果不再变化时停止.该算法在多个UCI数据集上进行了实验验证,结果表明算法是有效的.  相似文献   

19.
针对传统的神经网络训练算法收敛速度慢和泛化性能低的缺陷,提出一种新的自适应粒子群优化算法用于神经网络的训练.该算法通过改进自适应搜索策略以提高网络泛化性能,并结合Ionosphere雷达信号分类数据集进行仿真测试.研究结果表明:基于自适应粒子群优化算法训练的神经网络在分类准确率和分类误差上明显优于传统的BP算法,且很好地提高了网络泛化能力和优化效果.  相似文献   

20.
针对传统SVM无法适应文本数据库随着时间不断更新的问题,通过对新增文本集的KKT条件的分析,研究了加入新增文本集后支持向量集的变化,提出了使用增量SVM进行文本分类的算法,并通过实验验证了通过该算法得到的分类器和传统分类器有着相似的分类能力和泛化能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号