首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 280 毫秒
1.
改进支持向量机对污水处理厂运行状况的故障诊断   总被引:1,自引:0,他引:1  
针对污水处理厂运行时故障数据不平衡性和代价敏感等特点,构造风险泛函RWLOO(α)来改进支持向量机(Support vector machine,SVM);并用遗传算法(GA)对风险泛函求全局最优.在GA对RWLOO(α)寻优过程中,SVM的几个参数以及核函数同时进行最优化.结果表明:用改进的SVM对污水处理厂的故障数据进行分类时,比未经改进的SVM错分类率低16.5%.  相似文献   

2.
微钙化簇是乳腺癌一个重要的早期发现,现有的检测技术为了达到高敏感性要求,产生很多假阳性数据.根据微钙化簇特点,提出一种整体和局部相组合的分类识别策略,并根据真假阳性样本错分代价的不同,使用代价敏感SVM方法进行分类学习.在构造分类器模型过程中利用粒子群进行分类器的参数优化及特征集合的选择,以提升分类学习的泛化能力.该算法在保证高敏感性的同时,降低了过多的假阳性数据,并删除了冗余和不相关的特征.实验结果表明,基于粒子群优化的代价敏感SVM组合分类算法提高了传统方法的识别能力.  相似文献   

3.
研究了基于支持向量机(Support Vector Machine,SVM)方法下的生物医学事件触发词识别的问题.利用SVM对事件抽取的过程进行分类,建立相应的模型来对生物医学事件中的触发词进行识别,得到了相应的实验结果,并验证了此方法的可行性.  相似文献   

4.
GA-SVM对上证综指走势的预测研究   总被引:1,自引:0,他引:1  
将支持向量机和遗传算法结合,建立了一种智能数据挖掘技术(GA-SVM),并用于对上证综指市场走势进行了探索.在这个混合的数据挖掘方法中,GA用于RBF参数的设定以及特征集的选择,从而智能的找到SVM的最佳参数,减少SVM特征值的复杂度,提高了SVM算法速度.SVM用于判断未来股票市场的走势,并与统计模型、时间序列模型方法、神经网络进行了对比.实验证明,GA-SVM优于其他几种方法,这种方法对于股票上涨或下跌的预测研究是有效的.  相似文献   

5.
提出一种新的基于半监督的SVM-KNN分类方法,当可用的训练样本较少时,使用SVM进行分类,不能得到准确的分类边界,本文采用半监督学习策略从大量未标记样本中提取边界向量来改善SVM.KNN分类器的引进不仅扩充了SVM的训练样本数目,而且优化了迭代过程中训练样本的标记质量,可不断修复SVM的分类边界.实验结果表明,所提出的方法能提高SVM算法的分类精度,通过调整参数能够获得更好的分类效果,同时也减小了标记大量未标记样本的代价.  相似文献   

6.
提出了基于K-means的二阶段多类SVM分类方法.该方法分为二个阶段:第一阶段采用K-means聚类,通过抽样精度来提高聚类准确度;第二阶段采用LIBSVM进行分类.通过使用LIBSVM提供的语料进行实验,结果显示比直接使用LIBSVM进行分类准确度提高了9.35%.  相似文献   

7.
为了实现哈萨克语文本分类,根据哈萨克语语法规则,给出了哈萨克语文本词干的提取方法;结合DFR特征选择方法和VSM文本表示模型实现哈萨克语文本的预处理,提出了一种SVM和修正KNN协同的文本分类算法,分别在自行构建的语料集和整理的《新疆日报》哈萨克语数据集上进行大量文本分类仿真实验.结果表明,该方法在哈萨克语文本分类上具有良好的分类性能,并比SVM,KNN的测试性能优越.  相似文献   

8.
提出了一种在主元子空间中的SVM性别分类算法,它首先通过主元分析对图像输入空间进行降维,形成一个主元子空间,然后在该子空间中以SVM进行隐性升维再构建最优分界面,文中对算法在不同参数下的性能进行了比较,并将本算法和其他方法进行了比较,实验结果表明,在选择了合适参数的情况下能达到94.87%的准确率,并能获得比其他方法更好的性能。  相似文献   

9.
应用支持向量机的空中交通流量组合预测模型   总被引:7,自引:0,他引:7  
为了提高空中交通流量预测的准确性,研究了将支持向量机(support vector machine, SVM)应用于空中交通流量预测的方法,建立了基于SVM的自回归预测模型,讨论了模型参数确定等关键问题.在SVM预测模型基础上,将SVM与多项式和鲁棒自回归预测模型结合,提出组合预测模型.利用北京周边空域实测流量数据进行的对比实验结果表明: SVM预测模型的预测误差小于5%, 组合预测模型的预测误差小于2%, 均优于多项式和鲁棒自回归预测模型;组合预测模型的预测精度和稳定性整体上又优于SVM预测模型.  相似文献   

10.
若干评价准则对不平衡数据学习的影响   总被引:3,自引:0,他引:3  
为解决绝大部分传统的以精度准则为优化目标而获得的分类器不适于不平衡数据学习(IDL)的问题,文中通过在支持向量机(SVM)模型上进行"元学习",研究了精度、平衡精度、几何平均、F1得分、信息增益、AUC(ROC曲线下方图面积)以及文中新提出的GAF和GBF等评价准则对IDL的影响.在16个来自UCI的不平衡数据集上进行了仿真实验.对实验结果的统计分析表明:不同准则对分类器性能的影响有显著差异;即便是对于先进的学习方法支持向量机(SVM)而言,若以精度准则最大化选择分类器,那么得到的SVM分类器也容易偏向预测多类;通过在其他准则上优化,能输出纠偏了的SVM分类器,它们的整体性能更好,尤其是在预测少类能力方面;在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能.  相似文献   

11.
刘祥楼 《科学技术与工程》2012,12(11):2590-2593
摘要:说话人识别混合方法是目前研究的热点,基于虚拟仪器技术并融合说话人识别技术,提出矢量量化和支持向量机方法结合,依托MATLAB实现运算,由LabVIEW以多任务管理和调用MATLAB来实现说话人并行识别处理。经自建小样本语料库仿真实验,结果表明:系统识别率98.54%、误识率5.28%、识别时间0.25秒,较单一矢量量化和支持向量机方法识别率分别提高了3.66%和1.16%,误识率分别降低了6.01%和4.43%;随着样本数的增多,矢量量化方法识别率呈上升趋势,而支持向量机方法识别率呈下降趋势。由此可见:两种方法优势互补实现并行识别可提高系统主体性能。  相似文献   

12.
考察了2种常用的基于统计方法的停用词选取方法,结合语言学知识,提出了一种统计和语言学结合的停用词选取的方法,以支持向量机作为分类器在复旦语料上做了实验,结果表明该方法在保证文本分类的准确率的基础上,可以大大地降低特征词的维数.  相似文献   

13.
针对SVM算法的核函数及参数选择不科学会导致检测的准确率比较差的问题,提出了一种融合粒子群搜索的灰狼优化算法,利用PSOGWO算法优化SVM的参数,确定SVM分类器的最优检测模型,并基于NSL KDD数据集进行对比实验。结果表明:基于PSOGWO SVM的入侵检测方法实现了SVM的参数最优化,而且在检测率、收敛速度、模型平衡性等方面有明显提升,该方法在网络入侵检测方面具有更好的性能。  相似文献   

14.
针对网购评论,抽取评论语组成基本语料,构建客户网购评论情感词汇本体,对热点评论应用k-近邻和SVM 2种算法来分析评论文本热点事件,实验证实SVM算法较k-近邻算法在评论文本热点发现上具有较高的性能,为网购评语热点研究提供了实例参考.  相似文献   

15.
一种基于SVM和规则消除组合型歧义的算法   总被引:2,自引:0,他引:2  
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.  相似文献   

16.
中文嵌套命名实体关系抽取研究   总被引:1,自引:0,他引:1  
为了解决嵌套命名实体关系抽取研究缺乏相关语料库这一问题, 在现有中文命名实体语料库的基础上, 将人工标注与机器学习相结合来抽取其语义关系。人工标注一个中文嵌套命名实体关系语料库, 然后分别采用支持向量机和卷积神经网络等方法, 进行中文嵌套实体关系抽取实验。实验结果表明, 在人工标注实体的中文嵌套命名实体语料上, 嵌套实体关系抽取的性能非常好, F1指数达到95%以上, 而在自动识别实体上的抽取性能尚不理想。  相似文献   

17.
建立以吸水率、干密度、波阻抗、动泊松比、动弹性模量为输入,抗压强度为输出的支持向量机预测模型.为了提高支持向量机预测精度,引入了粒子群算法对支持向量机的参数进行优化,克服支持向量机参数人工选取的不足.通过对鞍千矿和弓长岭矿的矿岩样本数据分析,该模型的预测误差最大为8.2%,精度明显高于传统神经网络法.结果表明基于超声波预测强度的方法具有很好效果,可望成为一种岩石强度预测的新方法.  相似文献   

18.
本文以钢铁产品为例,在分析多工序多阶段产品质量预测控制特点的基础上,建立了多控制点递阶SVM预测控制模型,在模型的求解过程中,提出了基于粗集理论和主成分分析法的数据预处理与模型简化,并利用带约束的PSO算法分别优化了SVM的核超参数和相关影响因素的决策范围,实现了多阶段产品质量预测和相关过程参数的全局优化,为生产过程的质量改进提供了科学的决策依据。  相似文献   

19.
Chinese organization name recognition is hard and important in natural language processing. To reduce tagged corpus and use untagged corpus, we presented combing Co-trainins with support vector machines (SVM) and conditional random fields (CRF) to improve recognition results. Based on principles of uncorrelated and compatible, we constructed different classifiers from different views within SVM or CRF alone and combination of these two models. And we modified a heuristic untagged samples selection algorithm to reduce time complexity. Experimental results show that under the same tagged data, Co-training has 10% F-measure higher than using SVM or CRF alone; under the same F-measure, Co-training saves at most 70% of tagged data to achieve the same performance.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号