首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对单细胞转录组数据上细胞分类准确率较低的问题, 提出一种新的细胞集成分类算法. 该方法能充分利用不同分类模型的优点, 降低单细胞数据的分类误差. 分别在慢性粒细胞白血病单细胞测序数据和三阴性乳腺癌单细胞测序数据两个不同数据集上进行实验验证, 实验结果表明, 由集成算法划分的细胞分类更清晰准确, 验证了该算法的有效性.  相似文献   

2.
深度学习在网格分类中的应用越来越受到人们的关注,在网格分类任务中,通常使用交叉熵损失作为损失函数。文章提出一种利用数据的结构相似性和几何一致性的正则化损失,将其加入损失函数中进行优化,可有效提高网格的分类准确率。从实验结果的量化指标来看,提出的正则化损失对于网格半监督分类任务的准确率有很好的提升效果。  相似文献   

3.
大部分时间序列数据分析的一个重要组成部分是相似性度量方式.在众多相似性度量方式中,基于最长公共子序列的相似性度量方式是一种常用的有效方法,但该方法仅仅度量序列点对点的数值差异,而忽略了序列的变化趋势.为此提出一种基于趋势信息的时间序列离散化方法并用最长公共子序列进行相似性度量.该方法能够很好地度量时间序列的趋势信息.此外,还将其与现有的点对点函数线性结合.与现有相似性度量方法不同,该方法能同时考虑时间序列的趋势信息和函数距离,相似性度量方案运用最近邻分类算法规则进行分类.为了进行全面的比较,在42个时间序列数据集上测试该算法的有效性.实验结果表明,所提出的方法能有效提高时间序列分类准确率.  相似文献   

4.
【目的】针对粉尘环境中单幅图像深度预测精度低的问题,提出了一种基于输入特征稀疏化的粉尘图像深度预测网络。【方法】使用粉尘图像的直接传输率与深度的关系设计预估计深度网络,利用图像颜色衰减先验原理进一步获取粉尘图像的稀疏深度特征。将该稀疏深度特征与粉尘图像一起作为深度预测网络的输入。深度预测网络以“编码器-解码器”为模型框架,编码器中使用残差网络(ResNet)对粉尘图像进行编码,设计融合通道注意力机制的稀疏卷积网络对稀疏深度特征进行编码。解码器中采用反卷积以及多尺度上采样的方法,以更好的重建稠密的深度信息。使用最小绝对值损失和结构相似性损失作为边缘保持损失函数。【结论】在NYU-Depth-v2数据集上的实验结果表明该方法能够从粉尘图像中有效预测深度信息,平均相对误差降低到0.054,均方根误差降低到0.610,在δ<1.25时准确率达到0.967.  相似文献   

5.
【目的】从脑网络中提取准确的判别性特征作为分类特征,可以提高SCZ的分类准确率,避免依靠量表的主观诊断造成缺陷。传统的脑网络特征如介数、聚类系数等丢失了拓扑信息,最小生成树丢失了部分脑区连接,子图虽然保留了拓扑信息,但传统的判别子图的筛选会产生部分冗余信息,进而影响分类准确率。【方法】提出一种基于频率排序的判别子图的筛选方法(frequently scoring screen, FSS),使用FSS筛选判别子图,在不损失原有判别信息的情况下,消除冗余信息。使用OpenfMRI的公开数据,对比了使用不同特征和不同分类算法的分类性能。【结果】FSS特征的分类性能优于其他传统脑网络特征,且该特征不受分类算法影响,分类准确率优于已有SCZ分类文献。  相似文献   

6.
【目的】针对k-Means聚类算法及MinMax k-Means聚类算法需要人为提前给定聚类数量而导致数据划分准确率偏低以及MinMax k-Means算法聚类效果受类簇边缘点影响较大等不足提出解决方案。【方法】将k-Means和MinMax k-Means算法的目标函数相结合,建立多目标优化模型,提出基于多目标优化方法的k-Means算法。分析簇数异常情况下最小中心方差与最大簇内方差之间的关系。【结果】发现当分类簇数大于最优簇数时,最小中心方差小于最大簇内方差,据此提出了基于多目标优化方法的k-Means自适应算法。【结论】数值实验表明:提出的自适应算法在人工数据集和UCI标准数据集均具有较好的自适应性且聚类效果较优。  相似文献   

7.
提出一种基于信息熵和动态时间规整(DTW)的多维时间序列相似性度量的方法。首先,基于马氏距离(mahalanobis distance)的DTW,不仅考虑了多维时间序列的各个变量间的相互关系,而且对于长度不同的时间序列,通过动态规整可以进行准确地对齐。其次,利用信息熵理论,通过最小化损失函数,对马氏距离矩阵进行学习,来获得全局最优的马氏矩阵。为了验证所提算法的效果,选用UCI数据集中的5个数据集,采用最近邻分类算法对其进行分类实验。实验结果表明:该算法相比于其他算法,具有较高的分类准确率,且时间消耗较少。  相似文献   

8.
【目的】针对使用船舶自动识别系统(automatic identification system, AIS)数据进行船舶类型识别中原始特征较少和时空特征利用不充分的问题,提出了基于数据块的双向长短期记忆卷积神经网络的渔船类型分类方法。【方法】首先将数据以数据块的形式输入模型,保留短时内的时序特征;然后利用宽卷积核深度卷积神经网络(wide convolutional kernel deep convolutional neural network, WDCNN)模型首层的大卷积对数据进行特征提取;最后采用双向长短期记忆网络(bidirectional long-short-term memory networks, BiLSTM)提取数据的深层时间信息,得到最终的船舶分类结果。【结果】在真实的船舶AIS数据集上进行测试后发现:本模型较主流船舶分类模型对渔船分类的正确率有一定的提升,F1值达到了5%左右的提高。【结论】本试验模型更有利于海事部门对渔船的监管,同时对海上渔场、鱼群分布的研究也有一定的参考价值。  相似文献   

9.
【目的】提高保险领域中保单累积损失预测的准确率。传统的Tweedie回归模型只能对非零均值建立回归模型,却不能对零概率建立回归模型,从而导致该模型的拟合效果并不理想。【方法】考虑到保单损失数据中往往包含着大量的零索赔,此时可视其为一种半连续型数据。因此,基于半连续两部模型,并考虑到累积损失中非零连续部分的分布类型,提出3种不同的累积损失预测模型,并结合一组实际损失数据进行模型对比分析。【结果】与Tweedie回归模型相比,本研究所提出的半连续两部回归模型的赤池信息准则值(Akaike information criterion, AIC)和贝叶斯信息量准则值(Bayesian information criterion, BIC)更小,具有较好的拟合效果。【结论】本研究结果可为保险领域中的保单累积损失预测提供参考。  相似文献   

10.
【目的】植物病虫害准确检测是病虫害精准化防治的关键,笔者构建准确高效的植物病虫害监测模型,为病虫害的早期诊断与预警提供重要依据。【方法】针对现有植物病虫害检测模型泛化能力弱、小目标漏检率高等问题,提出一种基于视觉加强注意力改进的植物病虫害检测模型——YOLOv 5-VE(vision enhancement)。为方便检测实验样本中的小目标采用Mosaic 9数据增强方法;设计出基于视觉注意力的特征加强模块CBAM(convolutional block attention module);为确定不同目标重叠在一起和被遮挡的定位损失引入边界框定位损失函数DIoU。【结果】YOLOv 5-VE模型在实验数据集上的识别精度和检测平均准确率达到65.87%和73.49%,比原模型提高了1.07%和8.25%,在型号为1 080 Ti的GPU上检测速度可达35帧/s。【结论】该方法可以在背景复杂的野外场景快速有效地检测和识别种类多样的病害和虫害,可以提高检测的鲁棒性能,提升模型对病虫害目标的特征提取能力,降低野外复杂场景对检测带来的干扰,表现出良好的应用潜力,可广泛运用于大规模的植物病虫害检测。  相似文献   

11.
端到端的事件抽取涉及两个子任务:事件检测和事件元素抽取,当前大多数研究工作并未解决元素抽取中角色重叠的问题,并且忽略了数据集提供的静态信息。文章提出一种基于两个独立编码器的事件抽取模型,通过词典增强的序列标注方法检测触发词和事件类型,再将事件类型、实体类型和边界信息作为元素抽取阶段的补充特征,使用多个角色二分类网络实现“分离式”的元素识别和角色分类,最后将基于静态数据统计得到的角色辨识度对所有分类器的损失函数加权求和,作为最终的损失函数,进而更好地拟合数据集特点。在两个公开的中文数据集ACE2005和DuEE上,实验F1值分别达到57.1%和76.1%,并且该方法有效提高了对角色重叠事件的识别准确率。  相似文献   

12.
基于非负矩阵分解模型, 提出一种新的数据补全算法. 该算法通过循环遍历确定最佳构造矩阵和rank值, 解决了单细胞转录组测序(RNA-seq)数据中存在缺失值的问题,  避免了由于单细胞测序深度不足对细胞分型分析的影响. 在慢性粒细胞白血病单细胞测序数据上的实验结果表明, 由补全算法恢复缺失值后的细胞分型更清晰, 验证了该算法的有效性.  相似文献   

13.
基于卷积神经网络提出了一种多任务模型将乳腺癌组织学图像分为良性与恶性及其子类.该模型是多任务模型,任务一将病理图像分为良性与恶性,任务二将图像分为良性与恶性的子类.模型总的损失函数是两个分类任务损失函数的加权和.该模型采用卷积层和全局平均池化层替代末端全连接层作为分类层,应用数据增强方法提升模型的性能.模型使用乳腺癌病理图像数据集BreaKHis进行消融实验并与VGG16模型进行对比.实验结果显示:提出的模型能够取得更好的性能,在二分类上达到了98.55%~99.52%的分类准确率,在多分类上达到了92.26%~94.85%的分类准确率.  相似文献   

14.
【目的】研究基于面向对象方法的林分类型识别,解决森林资源监测的核心问题。【方法】以福建省将乐林场为研究样本,采用基于QuickBird遥感影像的蓝、绿、红、近红外4个多光谱波段为面向对象分类的试验数据,借助eCognition Developer 8.7(易康)软件,设置10种分割尺度(25~250,步长为25),应用带有线性核函数支持向量机分类器(support vector machine,SVM),分别对每种分割尺度下的3组特征(单独光谱、光谱+纹理、光谱+纹理+空间)进行面向对象林分类型分类。【结果】以尺度参数150对QuickBird遥感影像进行分割质量最高(ED3Modified=0.37)。10种尺度上,在光谱特征中加入纹理特征能够明显提高分类精度,但引入空间特征分类精度几乎无变化。基于光谱+纹理特征在分割尺度150时获得了最高分类精度(总精度达到85%,Kappa系数为0.86)。【结论】分割尺度对面向对象林分类型识别精度有着重要影响。在所有尺度(25~250)下,光谱、纹理特征分类精度均高于单独使用光谱特征分类总精度,空间特征在林分类型分类中并没有起到作用。匹配良好的分割和参考对象时能够得到更高精度的分类结果,同时,轻微的过度分割或分割不足不会明显影响分类结果。基于易康软件的面向对象方法对QuickBird多波段遥感数据进行林分类型分类能够获得比较满意的结果。  相似文献   

15.
单细胞转录组测序技术(single-cell RNA sequencing, scRNA-seq)的快速发展为分析生物数据提供了有力支持.对scRNA-seq数据进行聚类分析,能够发现潜在的细胞亚型并研究细胞的异质性.但由于scRNA-seq数据存在高维性、高稀疏性以及dropout事件等问题,为聚类分析带来了挑战.提出一种基于对比学习的聚类方法,假设数据服从零膨胀负二项分布,应用自编码器框架学习细胞的表示.实验结果表明提出的方法在真实数据集上有优越的性能,在不同规模的数据集上具有良好的可扩展性.  相似文献   

16.
针对传统食品图像识别方法提取特征能力差、准确率差、运行效率差和卷积神经网络识别相似食品图像难度大等问题, 提出了一种新的食品图像识别模型ChinaFood-CNN, 以实现对食物的精准分类; 在多分类损失函数SoftmaxWithLoss的基础上, 针对食品图像类间相似性大的问题, 提出了最大类间距损失函数(MCSWithLoss), 以增大相似类之间的距离, 实现相似类的区分; 针对随机选取样本时的训练集冗余问题, 在网络模型训练时使用负样本选择算法.实验结果表明:ChinaFood-CNN模型对食品图像的识别准确率达69.2%, 分别比AlexNet、VGG16、ResNet模型提升了17.6%、16.8%和3.6%.  相似文献   

17.
【目的】局部保持投影(LPP)是一种经典的非线性数据降维方法。在LPP方法基础上人们提出了判别局部保持投影方法(DLPP),并取得了良好的效果,但DLPP方法存在小样本问题,针对该问题提出了广义矩阵指数判别局部保持投影(GEDLPP)算法。【方法】基于矩阵函数的性质,使用广义矩阵指数函数来重构DLPP,即为GEDLPP算法。【结果】提出的算法有两个优点:一是解决了DLPP方法的小样本问题;二是GEDLPP所隐含的非线性映射拉伸了不同类别样本之间的距离,从而提高了模式分类的能力。【结论】在COIL-20数据库,Yale,ExtendedYaleB和CMU-PIE人脸数据集上的实验结果表明:与最近提出的解决DLPP小样本问题的改进方法相比,GEDLPP的识别率优于其他方法。  相似文献   

18.
[目的]综述当前单细胞RNA测序数据分析的关键流程和环节,介绍完成不同分析任务所需的代表性方法及流行的工具.[方法]通过调查文献调研,总结了当前单细胞RNA测序数据分析的流程和代表性工具.[结果]许多针对单细胞RNA测序数据的分析流程和工具被陆续开发出来,用于从海量数据中发掘生物学知识,进而揭示复杂疾病或表型背后潜在的分子机制.[结论]单细胞RNA测序在生命科学研究中扮演了极为重要的角色,良好的数据分析策略是决定能否有效揭示单细胞表达谱数据背后蕴含生物学信息的关键环节.目前单细胞RNA测序数据分析步骤和工具方法繁多,研究者应根据实际场景选择合适准确的分析方法与工具.  相似文献   

19.
基于非负矩阵分解模型, 提出一种新的数据补全算法. 该算法通过循环遍历确定最佳构造矩阵和rank值, 解决了单细胞转录组测序(RNA-seq)数据中存在缺失值的问题,  避免了由于单细胞测序深度不足对细胞分型分析的影响. 在慢性粒细胞白血病单细胞测序数据上的实验结果表明, 由补全算法恢复缺失值后的细胞分型更清晰, 验证了该算法的有效性.  相似文献   

20.
【目的】由于AdaBoost算法弱分类器对各待测样本其投票权重是固定不变的,这会导致使用该算法进行分类时准确性不高,于是针对该问题提出了一种结合静态权重与动态权重的学习算法AdaBoost_DW。【方法】该算法保留了AdaBoost算法训练阶段产生的全部弱分类器,在预测阶段加入了能度量待测样本与各个弱分类器适应性的动态权重,通过双权重共同决定该弱分类器的投票权重。【结果】实验结果表明,AdaBoost_DW算法的分类精度绝大多数情况下高于原AdaBoost算法。【结论】证明了动态权重的加入能够提高原AdaBoost算法在各数据集上的分类准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号