共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
禄铠铣 《哈尔滨师范大学自然科学学报》2015,(1):81-84,113
列举了有关基于聚类融合的不平衡数据分类的办法,可以解决少数类的识别率很低,利用传统分类手段予以解决.利用此种方法能够发现,引入少数类边界区域与在多数类核心当中的样本聚类一致性系数,并且分别对欠抽样方法对少数类与多数类的训练集. 相似文献
4.
针对传统FCM算法无法获得令人满意的聚类结果的问题,提出了基于样本与特征双加权的自适应FCM聚类算法。采用特征和样本双加权的策略,以特征权重信息熵作为代价函数,与样本权重、特征权重相融合,通过迭代优化的方法动态计算各属性特征对不同类别的权重系数、每个样本对聚类的重要性权重值,综合考虑各个样本的贡献度和各个特征的重要性,从而达到提高聚类结果质量的目的。使用5个来自UCI的标准机器学习数据集,对聚类算法的有效性进行验证。结果表明,对于具有不同样本贡献度和不同特征重要性的数据集,提出的算法具有较好的聚类效果。 相似文献
5.
经典的卷积神经网络模型损失函数在设计时只考虑输出与标签之间的比较,没有涉及到图片之间的差异.为了提高卷积神经网络模型提取特征的差异,提出了基于Triplet network模型约束的卷积神经网络模型,这种方法提高了卷积神经网络提取有效特征的能力,减少数据集数量对于模型的影响.在MNIST数据集和cifar-10数据集上进行实验,提出的新模型在这2个数据集上比经典的卷积神经网络模型识别效果更好. 相似文献
6.
KNN算法通过近邻样本的个数分类,Entropy-KNN算法给出新的相似度定义,而且投票时综合待测样本与近邻样本的个数和各类近邻的平均距离,但两种算法均未考虑近邻样本间的相似.提出的基于层次聚类法的Entropy-KNN算法,首先对训练集按类别进行层次聚类,接着在与待测样本最相似的子类中选取近邻样本,使得近邻样本具有较高的相似度,最后结合Entropy-KNN算法进行分类.在蘑菇数据集上的实验结果表明,该算法的分类准确率高于Entropy-KNN算法. 相似文献
7.
《黑龙江大学自然科学学报》2016,(4)
基因组数据的聚类分析,可以从多个数据集中识别与特定的生物学表型相关联的基因。传统的聚类方法仅进行单向聚类,即仅对基因表达谱的特征(基因)或样本进行聚类,没有考虑基因与样本的关联性。针对基因表达数据提出了一种新的无监督双向聚类算法,同时对基因和样本进行聚类。对已提出的聚类性能评价指标进行了改进,利用改进的指标确定双向聚类算法最优的聚类个数。将该方法分别应用到乳腺癌和青少年类风湿性关节炎基因表达数据中,结果显示,与传统方法相比,本方法具有较好的聚类效果。 相似文献
8.
《应用科学学报》2019,(6)
增量聚类算法可以解决数据量大、内存不足的问题.传统的增量式模糊聚类(incremental multiple medoids based fuzzy clustering, IMMFC)算法只为每个数据块选择一个或多个相同数目的中心,当聚类中的对象权重较小时聚类效果不好.该文提出新的增量式模糊聚类算法用于处理大数据集.首先将大数据集分成多个小的数据块,并对每个小的数据块进行模糊聚类;然后从每个小数据块的每个簇群中选择目标中心点,中心点的个数是簇群中对象的权重之和大于阈值的最少对象数.最后合并所有选定的中心点,并对最终数据块进行模糊聚类,获取最终的中心点.实验结果表明,与IMMFC算法相比,当数据块占总数据的10%以上时,所提算法优于IMMFC. 相似文献
9.
现有的三维卷积神经网络(Three-dimensional convolutional neural network, 3D-CNN)模型常有参数过多和特征提取不全面的情况,并且对样本标签有限问题的处理存在不足。针对样本标签有限的问题,采用生成式对抗网络模型对原始数据进行数据增强,解决了个别样本标签少导致分类模型出现过拟合的现象;针对3D-CNN网络提取特征不全面的问题,所设计高效的3D-CNN网络模型,在网络中加入纹理信息增强模型,使网络能更好地提取图像的空谱特征。实验表明,算法在小样本数据情况下比原始网络分类精度更高,能自适应提取高光谱图像的空谱联合特征。 相似文献
10.
就2021年“高教社杯”全国大学生数学建模竞赛E题“中药材的鉴别”的第1、2问给出了可行的解法。针对问题1,使用极差和主成分分析方法将数据进行降维,利用平均轮廓法和肘部法则来确定最佳的聚类个数,使用K-Means聚类的方法将中药品聚类分为3类。针对问题2,分别使用支持向量机、BP神经网络、Logistic回归方法构建了药材产地分类模型,三个模型在训练集和测试集的准确率、精确率、召回率和F1值都分别均在0.8及0.7以上。特别地,Logistic回归模型在训练集和测试集的F1值高达0.866、0.789。结合三个分类模型为待鉴别的15个产品找到了合适的产地。这样的药材鉴别方法分析速度快、分类效果好,可为其他红外光谱数据分类鉴别问题提供借鉴。 相似文献
11.
提出一种基于模糊c均值(FCM)和BP神经网络的棉麻纤维识别方法。首先,根据纤维横向和纵向截面形态的不同,提取6个特征参数,然后运用模糊c均值算法将样本聚类成3类,再将聚类后的数据作为BP神经网络的输入进行训练和预测,最后进行仿真实验。结果表明,将两种算法结合起来用于纤维的识别具有明显优势,是值得推广的纤维识别方法。 相似文献
12.
传统的分类算法通常设置统一的最小置信度提取规则.如果训练数据集是不平衡的数据,统一置信度的分类算法在小类的准确率不高.本文提出了一种基于训练集类分布的多置信度不平衡数据分类算法CBMI.在CBMI算法中,根据训练数据中类的分布设置不同的最小置信度提取规则,小类置信度的临界值比大类置信度低.此外,算法CBMI综合三种度量选择“好”的属性值.实验结果表明,基于多置信度不平衡数据分类算法CB—MI提高了小类数据分类的正确率. 相似文献
13.
14.
15.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳... 相似文献
16.
为了改善传统脑电信号分类时间长、精度不够准确且分类难度较大的问题,利用脑电传感器(Mind Wave传感器)及Real Term软件从串口抓取数据获取脑电波TGAM数据包,并对采集的脑电信号数据进行分解计算处理,得到各个波段数据,使用基于负熵的独立分量分析的固定点算法(FastICA)提取脑电信号特征,并用深度学习分类算法对脑电信号进行分类。传统机器学习算法不能准确分类复杂的脑电信号,运用卷积神经网络(Convolutional Neural Network,CNN)提取数据进行训练,构建分类器,实现了对脑电信号更高效更准确的分类。实验结果表明,与Fisher线性判别、BP神经网络、朴素贝叶斯相比,此算法可以更准确地区分是否清醒的状态,对脑电信号分类的研究具有重大意义。 相似文献
17.
18.
利用深度残差网络的高分遥感影像语义分割 总被引:1,自引:0,他引:1
《应用科学学报》2019,(2)
遥感影像分割是影像解译与分析的必要过程,随着深度学习在特征表达上的优势逐步显现,以深度网络为基础模型的影像语义分割已成为自动分割的主要研究趋势.该文提出了一种基于深度残差网络的多尺度语义分割模型,旨在针对小样本遥感影像数据集,提高具有不同尺度分割对象的遥感影像分割精度.首先将深度残差网络以全卷积网络形式进行微调,实现端到端语义分割模型结构构建;然后针对全卷积网络粗糙分割输出的问题,引入Atrous卷积精细化模型上采样过程,进而提高输出标签图精度;最后针对小样本数据进行随机多尺度数据增强,通过样本扩充提高模型分类精度和鲁棒性.试验基于ISPRS 2D Vaihingen语义分割数据集,影像分割结果的分类精度达到89.7%,尤其在小尺度对象上具有较好分割效果. 相似文献
19.
模糊k-最近邻(fuzzy k-nearest neighbor,FkNN)及其改进的分类方法忽略了样本存在分布不均匀以及噪声样本的情况,不能充分体现每个类样本特征的差异性,影响了分类的准确率.为此,提出了一种基于紧密度的模糊加权kNN数据分类方法.首先基于样本间紧密度计算样本的隶属度;然后根据特征的模糊熵值分别计算每个类样本特征的权重,并使用加权欧氏距离确定近邻训练样本;最后根据待分类样本所属的每个类别的隶属度确定其类别.对UCI多个数据集的实验结果表明该方法是有效的. 相似文献
20.
针对人体行为识别难于兼顾速度与精度的问题,提出了一种结合运动历史图像(MHI)与卷积神经网络的行为识别算法.该算法首先从原始视频序列中计算MHI,不仅减少了待处理的信息量,还提取了行为识别中的关键时空信息;接着以MHI作为输入,搭建了深度卷积神经网络,可以更好地表达时空信息;最后利用随机梯度下降法与dropout策略训练网络,实现行为类别分类.对比不同卷积神经网络训练与测试实验,该算法在Weizmann行为识别数据集上取得了95%的平均识别率,相较于未改进的网络结构提升了1.2%;对于持续时间为1.6s的行为动作,该算法的识别时间为1.56s.实验结果表明,所提算法在维持较高识别准确率的同时,实现了人体行为的在线实时识别与分类. 相似文献