首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在图书分类实践中,经常出现分类不一致甚至分类错误等问题.这些问题主要是由于图书分类法版本不同、复分表使用不一致、主题分析不准确等原因造成的.为此,应进一步制定本馆分类细则,规范编目流程,提高编目人员的素质等有效措施.  相似文献   

2.
k-近邻(k NN)分类算法因具有不对数据分布做任何假设、操作简单且泛化性能较强的特点,在人脸识别、文本分类、情感分析等领域被广泛使用.k NN分类算法不需要训练过程,其简单存储训练实例并根据测试实例与存储的训练实例进行相似度比较来预测分类.由于k NN分类算法需要计算测试实例与所有训练实例之间的相似度,故难以高效地处理大规模数据.为此提出将寻找近邻的过程转化为一个优化问题,并给出了原始优化问题与使用数据划分优化问题的最优解下目标函数差异的估计.通过对此估计的理论分析表明,聚类划分可以有效的减小此差异,进而保证基于聚类的k-近邻分类(DC-k NN)算法具有较强的泛化性能.在公开数据集的实验结果显示,DC-k NN分类算法在很大程度上为测试实例提供了与原始k NN分类算法相同的k个近邻进而获得较高的分类精度.  相似文献   

3.
当对三支决策边界域进一步划分时,边界域知识存在划分信息不足,从而导致分类精度不高,针对上述问题提出一种新的基于三支决策的二阶段分类模型(TWD-TP).第一阶段根据贝叶斯规则构建三支决策中样本的条件概率,通过求解最优化损失函数得到所需阈值,然后按照三支决策规则对数据集进行划分.三支决策是基于最小风险贝叶斯决策理论的划分,在其正域、负域中包含一定的误分类样本;在第二阶段通过类标签索引分别将正域、负域中误分样本作为增量信息引入延迟决策域,形成重构边界域,最后对重构边界域进行划分.实验结果表明:所提出的TWD-TP模型不仅能在三支决策划分中筛选出高误分类特征的样本,同时其重构边界域中不能被划分的样本得到正确划分,分类精度进一步提高.  相似文献   

4.
基于分类面拼接的快速模块化支持向量机研究   总被引:1,自引:0,他引:1  
针对大多数现有的机器学习算法处理大规模问题时需要的训练时间很长和存储空间很大的难点,提出了基于分类面拼接的快速模块化支持向量机算法(psfm-SVMs).在训练阶段,psfm-SVMs采用一簇平行超平面对大规模问题实施软划分,然后针对每个子问题并行训练支持向量机.在测试阶段,测试样本坐落于哪个子问题所在空间中,就由该子问题训练的支持向量机给出判别结果.在4个大规模问题上的实验表明:与采取硬划分的快速模块化支持向量机(fm-SVMs)相比,软划分能够使psfm-SVMs得到更加光滑的分类面,因而psfm-SVMs的泛化能力较高.在不增加训练时间的条件下,psfm-SVMs减少了由于训练集分割导致的分类器泛化能力下降.  相似文献   

5.
采用标签传播算法进行社区发现时间效率高,无需人工参数,但容易产生精度限制的问题.研究了启发式的标签传播算法,快速地进行社区的初始划分,大量减少了初始标签的个数,进行标签迭代传播来修正初始划分得到最终的社区.理论分析和实验证明这种方法在不增加时间复杂度的情况下,提高了准确率,并有效消除了精度限制的现象.  相似文献   

6.
针对传统社区传播算法存在局部震荡、划分结果不稳定、划分结果分辨率高等弱点,提出了非随机的标签传播社区划分算法,通过去除传统算法的随机性进而克服其弱点.该算法主要进行了3个方面的改进:按特定顺序更新节点的标签;计算标签数量时,不仅统计邻居节点,而且统计待更新节点本身;通过贡献函数避免多个最大值时的随机选择.实验证明,该算法不仅保证了算法的划分正确性,而且大幅度减少了计算过程中的随机选择动作.  相似文献   

7.
针对一类具有切换结构的混杂系统,提出一种基于仿射传播聚类的模型辨识方法。将模型辨识问题等价成对系统数据的分类和分类数据的回归问题。通过仿射传播聚类算法对样本数据进行聚类划分,并分别采用最小二乘支持向量机算法对子样本分别建立模型。仿真结果验证了该方法的有效性和实用性。  相似文献   

8.
基于流动单元分类的非均质砂岩储集层渗透率预测   总被引:2,自引:0,他引:2  
 综合岩心分析测试和测井资料,对松辽盆地新站油田D404区块葡萄花油层进行流动单元划分,建立中低孔、中低渗非均质砂岩的渗透率预测模型.首先,将葡萄花油层划分为4个特征明显的流动单元,分类后的孔隙度与渗透率关系明显改善;其次,筛选最能表征储集层储集性能的补偿密度、深感应电阻率和中感应电阻率为变量,建立了流动单元指数FZI的测井响应多元回归方程,为应用测井曲线划分流动单元奠定基础;第三,应用与孔隙度关系最密切的补偿密度测井预测孔隙度;最后,应用基于流动单元分类的孔隙度与渗透率关系,预测非均质储集层渗透率,精度明显提高.研究结果为中低孔中低渗砂岩储集层解决非均质问题提供有效途径.  相似文献   

9.
本文论述了河南省植被分类的原则、植被分类的单位和系统.根据植被分类的原则和单位,将河南省植被类型划分为8个植被型组、21个植被型、63个群系组、173个群系.  相似文献   

10.
韩磊  姚璐 《北京理工大学学报》2020,40(4):351-361,381
雷达高分辨距离像自动目标识别是近年来雷达目标识别广受关注的一个研究领域. 基于国内外HRRP自动目标识别方法的研究现状,指出目前研究工作中亟待解决的两个问题:非合作目标的识别与分类超平面的获取;针对待解决问题提出目前研究工作中的3个重点:信噪比失配问题的研究,少量不完备样本的研究以及分类超平面获取方法的研究;对每个研究重点的研究思路进行详细划分,包括移除噪声成分、特征提取以及支持向量等,并归纳每种思路的研究现状;最后,对3个重点的研究现状进行总结评述并指出未来的发展方向.   相似文献   

11.
在二叉树结构支持向量机(SVM)多分类算法的基础上,针对二叉树算法中点和叶盲目划分的问题,提出了一种新的二叉树SVM多分类算法.该算法通过标记划分的方法,一方面解决了盲目划分的问题,另一方面大大减少了子分类器的数目,大幅度提高了算法的速度.实验结果表明,该算法具有一定的优越性.  相似文献   

12.
如何划分煤矿瓦斯等级、判断煤矿不安全程度和确定煤矿所需要的最佳通风量,对煤矿安全生产具有重要意义.本文通过建立3种不同的模型,运用Matlab和Lingo编程计算,解决了矿井分类、矿井不安全程度和矿井所需最佳通风量等问题.  相似文献   

13.
如何划分煤矿瓦斯等级、判断煤矿不安全程度和确定煤矿所需要的最佳通风量,对煤矿安全生产具有重要意义.本文通过建立3种不同的模型,运用Matlab和Lingo编程计算,解决了矿井分类、矿井不安全程度和矿井所需最佳通风量等问题.  相似文献   

14.
文章针对传统K-近邻分类方法学习效率低下的问题,提出一种基于并行计算的加速K-近邻分类方法(K-nearest neighbor classification method based on parallel computing,PKNN),即并行K-近邻分类.该方法首先将所需要分类的样本划分为不同的工作子集,然后在每个子集上进行并行的K-近邻分类.由于划分后每个工作子集的规模均远小于整个数据集的规模,因此降低了分类算法的复杂度,可有效处理大规模数据的分类问题.实验结果表明,PK-NN方法能提高分类效率.  相似文献   

15.
【目的】针对标准协同训练中视图分割不充分冗余导致两个分类器误差累积加大,且两个分类器对同一个未标记样本分类不一致的问题,提出了结合信息增益率和K-means聚类的协同训练算法。【方法】该算法先根据有标记样本计算出数据中每一个特征的信息增益率,将信息增益率高的特征平均划分到两个视图,再在每次分类过程中应用K-means聚类确定标记不一致样本点的最终类别。【结果】通过在9个UCI数据集上的3组实验表明,与对比算法相比,所提算法中两视图分类器的平均正确率差值降低了2.9%,有效均衡了分类器性能,同时在分类准确率和算法稳定性上也有较大提升。【结论】利用信息增益率将关键特征均衡划分到两个视图,有效解决了视图分割不充分冗余问题;K-means聚类重新分类标记不一致的样本,降低了样本被误分类的概率。  相似文献   

16.
聚类分析方法在城市等级结构划分中的应用   总被引:4,自引:0,他引:4  
城市规模等级结构的划分是一个多指标的分类问题,采用聚类分析的多元统计方法,对长江三角洲内15个城市进行了规模等级的划分,克服了以往单一指标分类的不足,得到了更科学、客观、合理的结果,  相似文献   

17.
三肇凹陷葡萄花油层已开发区块综合评价方法研究   总被引:1,自引:0,他引:1  
三肇凹陷葡萄花油层地质条件复杂、区块较多。本文在在评价单元划分的基础上,结合研究区的具体地质特征和开发动态特征,采用聚类分析方法,结合各参数的地质意义和开发意义,优选出6个地质参数和4个开发参数。在单因素评价的基础上,针对单因素分类评价存在的分类结果不唯一问题,进行了多因素综合定量评价,并建立分类标准,根据分类标准可以将三肇凹陷葡萄花油层已开发区块划分为三类。Ⅰ类区块在地质上和开发上好于Ⅱ类区块,Ⅱ类区块优于Ⅲ类区块,分类评价结果与实际地质特征和开发特征相符合。  相似文献   

18.
以福建漳浦的低丘台地平原区为研究区,依据中国土壤系统分类,确定了18个典型土壤剖面的诊断层和诊断特性,对土壤高层分类单元进行分类.按照中国土壤系统分类土系划分的技术规范,确定了土系划分的原则和依据,并对样区土壤进行土系划分.同时还对土壤的发生学分类与系统分类的参比进行探讨.  相似文献   

19.
针对单细胞转录组数据上细胞分类准确率较低的问题, 提出一种新的细胞集成分类算法. 该方法能充分利用不同分类模型的优点, 降低单细胞数据的分类误差. 分别在慢性粒细胞白血病单细胞测序数据和三阴性乳腺癌单细胞测序数据两个不同数据集上进行实验验证, 实验结果表明, 由集成算法划分的细胞分类更清晰准确, 验证了该算法的有效性.  相似文献   

20.
为解决大规模漏洞分类问题,提出一种基于卷积神经网络(convolutional neural network,CNN)的漏洞自动分类方法,借鉴深度学习的技术思想自动获取漏洞描述的相关局部特征,通过batchnorm规范化数据解决文本训练不稳定问题,进而实现漏洞类型的有效划分.实验表明,与传统方法相比,该方法在漏洞自动分类效率上能够得到显著的提高.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号