首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对样本集中的类不平衡性和样本标注代价昂贵问题,提出基于不确定性采样的自训练代价敏感支持向量机.不确定性采样通过支持向量数据描述评价未标注样本的不确定性,对不确定性高的未标注样本进行标注,同时利用自训练方法训练代价敏感支持向量,代价敏感支持向量机利用代价参数和核参数对未标注样本进行预测.实验结果表明:该算法能有效地降低平均期望误分类代价,减少样本集中样本需要标注次数.  相似文献   

2.
孪生支持向量机通过求解2个较小二次规划问题得到一对非平行超平面,从时间和准确率方面提高了分类器的性能.由于此方法使用Hinge损失函数,造成孪生支持向量机对噪声较为敏感以及重采样的不稳定.为此,针对多分类问题,将pinball损失函数与样本权重引入到孪生支持向量机中,采用一对一方法组合二分类器,提出了基于pinball损失的一对一加权孪生支持向量机,较好地解决了孪生支持向量机对噪声的敏感性以及重采样的不稳定性.另外,对于样本的不同影响,给出了多种求取样本权重的方法.实验中选取标准数据集和人工合成数据集对提出的算法进行了验证,并与一对一孪生支持向量机(OVO-TWSVM)、一对多孪生支持向量机(OVA-TWSVM)以及基于pinball损失的一对一加权孪生支持向量机(Pin-OVO-TWSVM)进行了比较,表明了提出方法的有效性.  相似文献   

3.
为了提高蛋白质与金属离子的交互位点(PMIIS)预测的准确率,从解决数据分布不平衡问题出发,提出了1种结合下采样与上采样方法的类不平衡学习算法。同时对多数类样本与少数类样本进行采样,在补充少数类样本信息的同时,减少多数类样本的冗余信息。基于该文类不平衡学习算法与支持向量机(SVM),设计了1种基于序列信息的预测方法。为了客观评价PMIIS的预测性能,构建了领域内较为完备的、含有蛋白质与Zn~(2+)、Ca~(2+)与Fe~(3+)交互位点的标准数据集。在此数据集上的实验结果表明,该文预测方法在蛋白质与Zn~(2+)、Ca~(2+)与Fe~(3+)交互位点预测问题上的平均马氏相关系数(MCC)为0.646,优于TargetS与IonCom。  相似文献   

4.
支持向量机(SVM)是建立在统计学习理论的基础上的一种小样本机器学习方法,它是针对二分类问题而提出的,如何将二分类问题有效地推广至多分类问题是支持向量机研究的重要内容之一.介绍了现有提出的一些支持向量机多分类的方法,并比较其优缺点,在模糊支持向量机的基础上提出具有去噪声的模糊支持向量机的多分类的方法.  相似文献   

5.
基于支持向量机的不平衡数据分类的改进欠采样方法   总被引:3,自引:0,他引:3  
支持向量机作为一种有监督分类算法,具有小样本,非线性等独特优势,但其在处理不平衡数据分类时效果不够理想.欠采样是一类常用的数据重构方法,它被广泛用于解决不平衡数据的分类问题,然而,传统的随机欠采样方法受随机性影响,稳定性较差.提出一种改进的欠采样方法,并应用在支持向量机上进行分类对比实验.实验结果表明,相比传统随机欠采样方法,该方法的稳定性更好,且在许多情况下可以提高支持向量机对不平衡数据的分类性能.  相似文献   

6.
为了有效地利用大数据中的无类别标签样本,将最小二乘支持向量机的思想和方法运用到半监督学习中,利用有类别标签和无类别标签样本构造支持向量机模型,通过Lagrange数乘法将其转化为一个线性规划问题,得到了一种适用于大数据的最小二乘半监督支持向量机.该算法有效地提高了支持向量机的测试准确率,具有较好的推广能力.  相似文献   

7.
一种基于支持向量机的蛋白质结构域边界预测方法   总被引:1,自引:1,他引:0  
提出一种基于支持向量机学习蛋白质结构域的边界预测方法. 在分析多序列比对结果的基础上, 定义了几种能够直接或间接反映蛋白质结构属性及结构域信息的新方法. 结果表明, 蛋白质序列信息预测边界信号的正确识别率达85%以上, 具有较好的泛化能力.  相似文献   

8.
提出基于支持向量机的不平衡样本集分类算法,以支持向量机为基础,利用重采样技术及特征子空间等相关理论,通过分层抽样方法和重采样技术,分别对不平衡数据集的样本底层特征和样本数量进行平衡,在不同数据集上进行实验,实验表明该方法能有效提高不平衡数据分类的准确度.  相似文献   

9.
面向不平衡数据集的一种精化Borderline-SMOTE方法   总被引:2,自引:0,他引:2  
合成少数类过采样技术(SMOTE)是一种被广泛使用的用来处理不平衡问题的过采样方法,SMOTE方法通过在少数类样本和它们的近邻间线性插值来实现过采样.Borderline-SMOTE方法在SMOTE方法的基础上进行了改进,只对少数类的边界样本进行过采样,从而改善样本的类别分布.通过进一步对边界样本加以区分,对不同的边界样本生成不同数目的合成样本,提出了面向不平衡数据集的一种精化Borderline-SMOTE方法(RB-SMOTE).仿真实验采用支持向量机作为分类器对几种过采样方法进行比较,实验中采用了10个不平衡数据集,它们的不平衡率从0.064 7到0.536 0.实验结果表明:RB-SMOTE方法能有效地改善不平衡数据集的类分布的不平衡性.  相似文献   

10.
采用少类样本合成过采样技术(SMOTE)与二叉树多类支持向量机(BTSVM)相结合的入侵检测算法来解决实际应用中经常遇到的类别不平衡的分类问题.该方法首先对不平衡类别的训练集使用BTSVM分类,然后对求出各分类器中的支持向量使用SMOTE方法进行向上采样,最后用不平衡类别的测试集在新的分类模型中进行测试.实验结果表明本算法能够有效地提高不平衡数据集的分类性能.  相似文献   

11.
胡波  覃溪  高远 《科学技术与工程》2012,12(26):6763-6765,6786
提出了一种基于连通区域选择的导航线特征点确定算法。首先在传统农业图像分割的基础上选取面积最大的连通区域,然后通过开操作去除连通区域边界的毛刺,再逐行提取图像的特征点。对25幅图像分别按传统方法,未进行开操作的连通区域选择法,进行开操作的连通区域选择法进行导航线特征点提取,统计分析结果表明与传统方法比较进行开操作的连通区域选择法的特征点误差显著降低。  相似文献   

12.
基于产品开发域的产品开发方法   总被引:1,自引:1,他引:1  
产品开发既是企业经营管理的核心,也是决定企业兴衰成败的关键,引起了越来越多的企业的重视。同时产品开发是一个集成和交互的过程,作者从产品开发所涉及到的产品、组织和流程的角度出发,指出产品开发中存在三个域,即:产品域、组织域和流程域。并指出产品域是三个域的核心,建立了三个域之间的交互关系。在此基础上,提出了产品域中产品零部件的分类方法,并根据三个域之间的交互关系,建立了相应的组织域和流程域,然后指出了产品域中产品零部件管理的发展方向,还给出了此方法在一家摩托车制造厂的应用实例。  相似文献   

13.
鉴于现有基于单词的领域特征学习方法在领域识别上的精度较低,为提高领域判别和提供准确的翻译,提出一种单词级别的领域特征敏感学习机制,包括两方面:1)编码器端的上下文特征编码,为了扩展单词级别的领域特征学习范围,引入卷积神经网络,并行提取不同大小窗口的词串作为单词的上下文特征;2)强化的领域特征学习,设计基于多层感知机的领域判别器模块,增强从单词上下文特征中获取更准确领域比例的学习能力,提升单词的领域判别准确率。在多领域UM-Corpus英–汉和OPUS英–法翻译任务中的实验结果显示,所提方法平均BLEU值分别超过强基线模型0.82和1.06,单词的领域判别准确率比基线模型分别提升10.07%和18.06%。对实验结果的进一步分析表明,所提翻译模型性能的提升得益于所提出的单词领域特征敏感的学习机制。  相似文献   

14.
近年来随着深度域地震资料的普及,为更好地利用这些地震资料来解决地下地质问题,提出了基于褶积理论的深度域地震资料反演。基于褶积理论的地震资料反演,子波与低频模型对反演结果具有十分重要的影响。通过制作人工合成记录与数值模拟研究,得到了深度域子波与时间域子波的关系,为基于褶积理论的深度域反演奠定了基础。将深度域反演应用于南海西部某油田,通过与该区的时间域地震资料反演对比,发现两种反演方法子波与低频模型都有差异。当时间域地震资料的采样间隔约为深度域地震资料采样间隔与层速度之比的两倍时,深度域地震资料的反演结果将优于时间域地震资料反演结果。  相似文献   

15.
证明了整环R是(*,v)-Dedekind整环当且仅当R[X]N*是拟Dedekind整环当且仅当R[X]N*是拟主理想整环.特别地,取星型算子*=v时,证明了整环R是(t,v)-Dedekind整环当且仅当R[X]Nv是拟Dedekind整环当且仅当R[X]Nv是拟主理想整环.同时,举例说明了(t,v)-Dedekind整环与弱分解整环之间的关系,并给出了当整环R是弱分解整环时,R是(t,v)-Dedekind整环当且仅当R是拟Dedekind整环当且仅当R是拟主理想整环.  相似文献   

16.
17.
正交频分复用系统中脉冲成型信道估计算法   总被引:1,自引:1,他引:0  
提出一种脉冲成型的信道估计算法,该算法将频域的信道信息转换为时域信道信息,通过多径信息和理论推导的脉冲信号就町以合成几乎没有失真的信道时域特性,并能消除大部分的噪声干扰,然后将信道的时域特性变换到频域,得到信道的频域特性.理论分析和仿真结果表明:该算法有良好的抗噪声性能和低的误码平层,同时对系统的定时精度不敏感.  相似文献   

18.
以SQL Server为平台,通过Windows身份验证方式注册SQL Server服务器、搭建C/S模式局域网,是一种比通过SQL Sarver身份验证方式注册SQL Server服务器,搭建的C/S模式的局域网更为复杂但更安全的方式.该过程以配置服务器并提升为域控制器;在域控制器的Active Directory中新建域用户帐户并授权,SQL Server企业管理器中新建域用户登录帐号;非域控制器主机加入域控制器指定域并以域用户身份登录Windows系统、登录指定域,以Windows身份验证方式访问域控制器上的SQL Server数据库这些步骤进行.  相似文献   

19.
针对T-S模糊不确定系统,采用模糊Lyapunov函数方法和单一Lyapunov函数方法建立了模糊不确定系统的鲁棒稳定的充分判据和系统可保性能设计方法.在系统初始状态未知,但属于一个有界闭区域时,提出了系统的区域可保性能的概念.针对两类有界闭区域:凸包区域、椭圆型区域,给出了系统的区域可保性能的计算公式.通过数字例子说明了所给出的设计方法的有效性.  相似文献   

20.
基于语言特性的中文领域术语抽取算法   总被引:2,自引:0,他引:2  
提出一种基于语言特性的中文领域术语自动抽取算法.集成领域耦合性、领域相关性和领域一致性3种语言特性建立统计模型进行中文领域术语的自动抽取.提出基于困惑度衰减比率的自动评价方法,使用该评价方法对术语抽取算法进行了比较评估.实验结果表明,该算法与基于互信息和似然度的方法相比,在准确率和召回率方面都有较大提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号