首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy, mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的相关度,使用每项相关度占其相关度之和的比例设计了标记权重,由此构建了特征和标记集间的相关度,初选与标记集相关度高的特征;其次,计算对象在特征上的距离,构建了新的特征权值更新公式,基于标记权重改进多标记ReliefF模型.然后,基于互信息和标记权重构建了最大相关性,设计了最小冗余性及其新的最大相关最小冗余评价准则,并将其应用于多标记特征选择,进一步剔除冗余特征;最后,设计了一种基于ReliefF和最大相关最小冗余的多标记特征选择算法,有效提高了多标记分类性能.在8个多标记数据集上测试所提算法的平均分类精度、覆盖率、汉明损失、1错误率和排序损失,实验结果证明了该算法的有效性.  相似文献   

2.
最大相关最小冗余限定性贝叶斯网络分类器学习算法   总被引:2,自引:1,他引:1  
朴素贝叶斯分类器 (naive bayes) 是一种简单而有效的基于贝叶斯思想的分类方法,但它的属性条件独立性假设并不符合实际,影响了它的分类性能。BAN (bayesian network augmented naive bayes) 分类器扩展了朴素贝叶斯分类器,使其表示属性之间依赖关系的能力增强,但是其学习算法需要大量的高维计算,在小采样数据集上,影响BAN分类器的分类性能。基于改进的最大相关最小冗余特征选择技术,提出限定性贝叶斯网络分类器学习算法 (k-BAN)。本算法使用改进的最大相关最小冗余特征选择技术,通过选择属性结点的连接关系集合建立属性之间的依赖性关系。将该分类方法与NB,TAN和BAN分类器进行实验比较。实验结果表明,在小采样数据集上,本算法获得的限定性贝叶斯网络分类器具有更高的分类准确性。  相似文献   

3.
利用K均值聚类和增量学习算法扩大训练样本规模,提出一种改进的mRMR SBC.一方面,利用K均值聚类预测测试样本的类标签,将已标记的测试样本添加到训练集中,并在属性选择过程中引入一个调节因子以降低K均值聚类误标记带来的风险.另一方面,从测试样本集中选择有助于提高当前分类器精度的实例,把它加入到训练集中,来增量地修正贝叶斯分类器的参数.实验结果表明,与mRMR SBC相比,所提方法具有较好的分类效果,适于解决高维且含有较少类标签的数据集分类问题.  相似文献   

4.
特征选择是机器学习和数据挖掘中的一个关键问题,它可以实现数据维度的约减,从而提高学习模型的泛化能力.近年来,为了提高特征选择算法的性能,集成思想被应用到特征选择算法中,即将多个基特征选择器进行集成.本文从提高特征选择算法对大规模数据处理能力的角度出发,提出了一种基于最小最大策略的集成特征选择方法.它主要包括三个步骤:第一,将原始数据根据类别信息划分成多个相对较小的平衡数据子集;第二,在每一个数据子集上进行特征选择,得到多个特征选择结果;第三,对多个特征选择结果依据最小—最大策略进行集成,得出最终的特征选择结果.通过实验对比了该集成策略与其它三种集成策略对分类准确率的影响,结果表明最小最大集成策略在大部分情况下能够获得较好的性能,且基于最小最大策略的集成特征选择可以有效处理大规模数据.  相似文献   

5.
针对马尔科夫毯过滤(Markov Blanket Filter,MBF)方法中使用的线性相关系数存在只能度量变量间的线性相关性,而无法度量变量间非线性相关的问题,提出两阶段Filter特征选择方法 MBFSU-ReliefF。该方法对马尔科夫毯过滤方法作了改进,可利用对称不确定性以度量变量间的线性和非线性相关性。实验使用UCI和ASU上的4个数据集分析比较MBFSU-ReliefF、ReliefF、马尔科夫毯过滤和其他多种Filter方法,使用朴素贝叶斯和SVM两种分类器对特征选择方法选取的特征优劣进行评价,实验结果表明,MBFSU-ReliefF方法较其他方法具有较高的分类准确率。  相似文献   

6.
基于地统计学和氨基酸理化性质对氨基酸序列进行特征提取,发展了一种改进的最小冗余最大相关特征选择方法,并引入了私有化预测结合支持向量机进行建模预测,得到了一种新的抗菌肽活性的预测方法。结果表明,地统计学关联特征能更好地表征氨基酸序列,特征选择对于高维回归数据的处理作用明显,同时能有效地增强模型的解释性,私有化预测能进一步提升模型的预测能力。所得新方法具有较好的预测能力及可解释性,在高维回归数据领域具有较为广泛的应用前景。  相似文献   

7.
基于量化封闭项集格提取最小无冗余近似规则   总被引:2,自引:0,他引:2  
为便于规则的提取,提出了具有新的节点结构的量化封闭项集格.最小无冗余近似规则具有最小前件和最大后件,并且没有任何信息丢失;还提出了一个新的算法,可以从量化封闭项集格中直接提取最小无冗余近似规则.  相似文献   

8.
针对突发事件数据的属性冗余、数据缺失等问题,设计了一种基于相关族理论的快速属性约简方法。首先,在第一型覆盖粗糙集模型上提出相关族属性约简方法,并设计了相应的启发式算法。其次,与其他属性约简算法进行对比,验证了该算法的有效性和正确性。最后,运用该算法对恐怖袭击事件数据集进行实例分析,结果表明,该方法显著降低了突发事件发生之后的数据收集难度,从而可以减少应急反应的时间和成本。  相似文献   

9.
(X_1,Y_1),(X_2,Y_2),…,(X_n,Y_n)为来自二维总体(X,Y)的简单随机样本,(X,Y)具有分布函数H(x,y),X(1)=min1≤i≤n{X i},X(n)=max1≤i≤n{X i},Y(1)=min1≤i≤n{Y i},Y=(28)max1≤i≤n{Y i}﹒利用Copula研究了(X(1),Y(n))、(X(1),Y(1))及(X(n),Y(n))的相关结构,并举例说明了其应用﹒事实表明,最大最小顺序统计量的相关结构包括常见的积Copula和FGM等,为构造Copula提供了新思路﹒  相似文献   

10.
于波  杨莘元 《应用科技》2004,31(5):34-36
在各种高分辨测向算法中,TLS—ESPRIT估计精度较高,因不需要谱峰搜索而具有更小的运算量.提出一种利用约束最小冗余线阵的快速TLS—ESPRIT算法,在不降低阵列孔径利用率前提下,进一步减小了运算量,分析表明,该算法不仅降低了运算量,而且在一定条件下,性能优于常规TLS—ESPRIT算法,所得结论通过计算机仿真得到了验证.  相似文献   

11.
最小最大路划分的一个启发式算法   总被引:1,自引:0,他引:1  
首先证明了最小最大路划分问题是困难的,然后利用二分算法给出了特殊情形下的最优算法,最后给出了满足三角不等式的图上的一个启发式算法.  相似文献   

12.
最小度生成树问题是一个NP难问题.给出了求最小度生成树的一个直观近似算法:找到图G的最大度,从其所在的基本圈上删掉1条与其关联的边,如此循环,直到图G的最大度不在任何基本圈上,如还有其它基本圈,删掉圈上的1条边,得到1棵生成树.这种算法得到的生成树的最大度数比最优解的度数至多大1.  相似文献   

13.
采用朴素贝叶斯分类器进行文本分类时,特征选择方法的好坏直接影响到分类器的性能.本文提出一种最大判别(MD)特征选择算法,由训练得到N个类的概率分布后,通过对样本进行测试并得到其特征向量d中每个特征词区分类别的能力,并构造出了一个新的特征向量ε用于分类,使得从中选取的部分特征词具有最大的类别区分能力.仿真结果表明,与cMFD,CSFS和CMFS三种特征选择算法相比,MD特征选择算法能在选取较少特征词情况下,获得更高的分类精度.  相似文献   

14.
利用语音残留冗余的LDPC译码算法   总被引:2,自引:0,他引:2  
为实现压缩语音在有多径衰落和多用户干扰的无线信道中的可靠传输,提出利用语音码流残留冗余的低密度奇偶校验码(LDPC)译码算法。因信源统计规律的时变性及信源编码复杂度和延时的限制,语音编码输出码流中还存在残留冗余,在信道译码时利用这些冗余可有效增强LDPC迭代译码的纠错能力。仿真结果表明:通过利用语音码流中的残留冗余,能有效提高LDPC码的纠错性能,减少平均迭代次数,明显降低译码运算量,改善合成语音质量。特别在信噪比较低时,效果更加显著,平均迭代译码次数下降30%~50%,合成语音平均谱失真下降0.3~0.8 dB。  相似文献   

15.
多传感器融合系统最小代价冗余及优化算法   总被引:7,自引:0,他引:7  
多传感器融合系统具有高度的容错性能。为了解决多传感器融合系统中如何选择冗余传感器并构成最小代价配置的问题,本文研究了(N,N/2+1)冗余结构,并建立了满足系统有效率约束的最小代价优化准则。此外,还给出了求解该组合优化问题的模拟退火算法。仿真计算结果表明,其优化准则和算法十分有效。  相似文献   

16.
典型相关分析(canonical correlation analysis,CCA)是一种寻求同一对象的2组变量之间最大相关性的多元统计方法,通过线性组合各组特征提取出对应的典型相关特征。但在简单地线性组合各组特征时,传统的CCA并未考虑特征的本征属性信息,无法区分主要特征和次要特征。充分运用特征本身的方差信息和提取后的典型相关信息,提出一种利用特征信息的加权典型相关分析(weighted canonical correlation analysis,WCCA)。一方面,利用方差信息对原始特征进行加权处理,使得原始特征的重要性更加具有区分度;另一方面,利用典型相关性对提取后的特征进行加权处理,既进一步增强了特征的主次关系,又保留了小相关性的特征信息。综合这2方面的特征信息,WCCA提取后的特征在分类和识别上更具有表现力。在ORL和AR人脸数据库以及对象识别数据库COIL20上的实验结果验证了该方法的有效性。  相似文献   

17.
为了更好地体现标签信息的重要性,基于传统的最小二乘回归模型,构造了一种包含标签信息的最小二乘回归模型,用于解决多标签特征选择问题。首先给标签逐一增加一个松弛变量ω,使得不同类别的回归目标沿相反方向移动,从而扩大类别之间的距离。然后结合?_(2,1)范数,提出了一种包含标签信息的最小二乘多标签特征选择(Least squares multi-label feature selection with label information,LSMFSLI)模型及算法,证明了该算法的收敛性,并通过实验证明了算法的高效性。  相似文献   

18.
最小费用最大流问题在实际工作中经常会遇到,但传统的求解方法过于繁锁。本文提出的算法,可以在最大流多解算法的基础上,通过简单的动态调整得到一个最小费用最大流。  相似文献   

19.
最大最小蚂蚁系统(Max-min Ant System,MMAS)是一种性能优良的启发式算法,常用于解决组合优化问题.当解决的目标问题规模较大、迭代轮次较多时,最大最小蚁群算法存在运行时间长的缺点.试验以开源串行包ACOTSP为基准,利用GPU多线程并发的优势,采用并行蚂蚁策略将MMAS在CPU-GPU协同异构计算平台上并发实现.算法在GPU上运行时的影响因素,如数据传输、内存层次、库函数调用等,也得到有效分析,并作出针对性优化.试验最终取得了高达13倍的加速,表明并行MMAS策略具有高效性和实用性.  相似文献   

20.
研究路上最大最小图均衡问题的在线情形。对于边权不可分的情形,在路的长度为2,且总权重W已知或最大权重wmax已知的情况下,该问题没有有限的竞争比。对于边权可分的情形,当n≥3时,无论总权重W是否已知,该问题具有相同的竞争比下界,当n=2时,总权重W是否已知将令问题具有不同的竞争比下界。当n=2且W已知时,设计了一个最优算法;当n=2且W未知时,设计了一个竞争比为4/3的最优算法;当n=3时,设计了一个竞争比为3/2的最优算法;当n=4时,设计了一个竞争比为3/2的最优算法;当n≥5时,设计了一个竞争比为2的最优算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号