共查询到19条相似文献,搜索用时 78 毫秒
1.
2.
基于信息最大覆盖率蚁群算法的Rough集属性优化约简 总被引:1,自引:0,他引:1
属性约简是一个NP难问题,这种算法不仅复杂而且非常耗时。因此本文提出了一种基于等价划分的信息一致性的属性约简算法,降低了属性约简计算复杂度,并将信息最大覆盖率和属性重要性作为蚁群优化算法的信息素进行添加式属性约简,既减小了属性约简的空间复杂度,也提高了计算效率。最后通过一个具体的例子,证明了此算法的有效性和可行性。 相似文献
3.
粗糙集理论是一种有效的属性约简方法,但不能直接处理实值数据。针对此问题,本文首先介绍了邻域和覆盖的概念,在此基础上构造了覆盖自约简和覆盖间约简(属性约简)算法;然后通过讨论邻域内各样本之间关系,提出了相斥元的定义,相斥元的存在可能导致决策正域计算错误,从而得到不符合数据表实际情况的属性依赖性,因此给出了分解相斥元的方法;最后在四个实值的基因表达数据库上进行了实验,结果表明该属性约简算法是有效的,并相对于现有其他算法具有较高的分类精度。 相似文献
4.
属性约简是粗糙集理论中一个核心研究问题,在对粗糙集中属性约简相关理论研究的基础上,提出了一种新的基于属性重要性和依赖性相结合的GENRED_GROWTH属性约简算法.并通过CUI机器学习数据集测试实验,验证了该算法的有效性. 相似文献
5.
基于蚁群算法的粗糙集知识约简 总被引:2,自引:0,他引:2
给出了一种新的粗糙集知识约简方法,即结合粗糙集理论的依赖度定义,先给出知识约简转化定理,然后运用一种改进型蚁群算法,采用局部和全局搜索相结合的方法,对知识表达系统进行约简.同时,在适值函数中引入罚函数,从而保证所求的约简在包含最少而非零个属性的基础上有较大的依赖度.通过Matlab计算实例可看出,本文算法对求解知识约简问题快速有效. 相似文献
6.
蚁群优化属性约简算法 总被引:1,自引:0,他引:1
为了获得决策表属性的最小约简,将信息论角度定义的属性重要性作为启发信息引入蚁群算法,提出了一种蚁群优化属性约简算法.该算法将属性核直接引入到蚂蚁构造的每一个解中,降低了问题规模,新定义的状态转移规则和信息素更新规则体现了约简中属性间的无序性特点,有利于在优解邻域内搜索.通过9个典型实例对算法进行了验证,结果与现有算法相比能够更容易找到最小约简,所需时间较短. 相似文献
7.
将基于单隐层前馈神经网络(SLFN)提出的极速学习机(ELM)算法和邻域粗糙集理论进行结合,提出基于邻域粗糙集的极速学习机算法,采用邻域粗糙集对样本集进行属性约简,去掉冗余属性,利用ELM对约简后的数据集进行学习,并对数据样本进行预测。实验表明ELM算法相比具有更高的训练精度和测试精度。 相似文献
8.
9.
为了去除系统中的冗余属性,保持系统的分类能力,研究了连续值分布式数据的属性约简.给出了连续值分布式决策信息系统中邻域粗糙集的定义,讨论了分布式连续值决策信息系统中正域计算的可分解性.以保持分布式决策信息系统的正域不变为前提,探讨了分布式决策信息系统中属性的可约性,提出了分布式连续值决策信息系统的属性约简算法.为了验证该算法的有效性,在7份数据集上进行了3组实验.实验使用提出的算法对分布式数据进行属性约简,进而采用加权集成的方式进行分类测试.实验结果表明,该算法能够有效去除连续值分布式数据中的冗余属性,使得约简后的连续值分布式数据的集成分类能力与约简前相差不大.甚至更高. 相似文献
10.
变精度邻域粗糙集相比于邻域粗糙集具有抗噪容错的能力,但由于重新定义了下近似,正域的划分不再严格,使得属性重要度的可信度降低,在精度改变的情况下无法优先选取最优的属性.针对这一问题,分析变精度邻域粗糙集的下近似,引入邻域内的正确分类率,定义属性质量度,提出一种基于正域的增量和平均正确分类率的增率相结合的属性度量方法.通过和现有的基于属性重要度的属性约简算法做比较,实验结果表明,改进后的属性度量方法对变精度有更好的适应性,在不同变精度阈值下能得到更优的约简结果. 相似文献
11.
传统的肿瘤基因选择算法挑选出的特征基因中存在大量噪声基因和冗余基因,从而对基因算法的准确性和分类精度产生影响.针对这一问题,将K-S检验与邻域粗糙集融合成为一种新的特征选择方法.首先,采用累积分布函数计算正负类样本的累积函数值和K-S检验统计量,对照显著性水平下的样本统计量,从而去除冗余基因和噪声基因;然后,使用邻域粗糙集进行约简,对比条件属性重要度得出最优约简结果;最后,对比K-S检验和两种基于K-S检验的特征选择方法得到的冗余度和分类精度,通过实验验证这种方法不仅能准确挑选出具有显著区分能力的肿瘤基因,且效率高具有可行性. 相似文献
12.
针对不完整决策系统属性约简算法时间复杂度较高问题,基于正域不变条件下,决策系统分类能力保持不变原则,提出不完整决策系统前向顺序特征选择算法.该算法从约简集为空集开始,根据在约简集合中加入各属性后对正域影响程度大小将属性降序排列,采用顺序前向搜索,选择当前最佳特征加入特征约简集合,确定最佳特征子集.将该算法扩展到基于邻域... 相似文献
13.
基于改进蚁群算法的高精度文本特征选择方法 总被引:1,自引:0,他引:1
为了反映特征子集对分类结果的整体影响,去除噪声特征项,提出了一种基于改进蚁群算法的高精度文本特征选择方法。建立了特征选择数学模型,实现了特征选择过程与分类器分类过程间的直接关联;设计了特征优选与特征精选相结合的模型求解方案,降低了模型求解过程中的计算复杂度;提出了基于等效路径增强和局部搜索更新相结合的改进蚁群算法,提高了解的质量和稳定性。实验结果表明,与现有文本特征选择方法相比,该方法能大幅提升分类精度。 相似文献
14.
基于蚁群优化算法的支持向量机参数选择及仿真 总被引:2,自引:0,他引:2
基于支持向量回归机(SVR)模型的拟合精度和泛化能力取决于其相关参数的选取,以蚁群优化算法为基础,给出支持向量回归机参数优化的一种新方法。该方法以最小化k-fold交叉验证误差为目标,对支持向量回归机中的核参数σ和惩罚系数C由蚁群系统中的节点值体现,数值的优选通过蚂蚁对最优路径的选择进行确定。计算机仿真结果表明:与正交法、遗传算法等相比,该方法在参数优化方面有良好的鲁棒性能和较强的全局搜索能力;该方法用于青霉素发酵过程的建模研究,建模精度较高。 相似文献
15.
现有大多数多标记流特征选择算法在进行特征选择时,往往忽略标记间的相关性,易导致算法预测精度的下降。为解决这一问题,提出一种结合邻域信息和标记相关性的在线多标记流特征选择算法;定义自适应邻域关系解决邻域粗糙集的粒度选择问题,将其推广到多标记学习中;利用互信息计算标记间的相关性得到标记权重;通过邻域粗糙集和标记权重评估特征和标记间的相关性,并设计特征在线重要度分析、在线相关性分析和在线冗余度分析3种指标,以实现在线评价动态候选特征。在7组多标记数据集以及5个评价指标上的实验结果表明,所提算法综合性能较优。 相似文献
16.
应用特征选择处理多标签数据分类时"维度灾难"问题已成为重要研究方向,因此提出一种基于邻域维护准则的特征选择算法(NPFS,feature selection algorithm based on neighborhood preservation criterion)。通过近似基于特征子空间和基于标签空间的2个相似度矩阵来构建相似性维护表达式,再通过线性近似扩展相似性维护公式得到邻域关系维护公式,并计算出邻域关系维护得分(NRPS,neighborhood relationship preserving score)来评估特征子集的重要性,结合贪婪方法设计具有NRPS的多标签特征选择算法(NPFS)。仿真结果表明,对比MMIFS算法和MDMR算法,所提出的算法在平均准确率、覆盖率、汉明损失、1-错误率、排名损失5个性能指标上均有改善。 相似文献
17.
郭小芳 《西北师范大学学报(自然科学版)》2010,(6)
通过深入分析蚁群算法中信息素更新系数对算法寻优能力与收敛速度的影响,定义了平均路径相似度(ATS)来表征寻优过程的成熟程度,据此自适应调整信息素更新系数,以提高算法收敛速度,并避免陷入局部最优.经过与典型蚁群算法在多个旅行商问题测试用例上进行比较,表明新算法具有更好的效果. 相似文献
18.
针对连续域蚁群算法寻优能力差、容易产生局部最优的问题,提出了一种基于跨邻域搜索的改进蚁群算法。首先,通过自适应种群划分方式计算可行解和不可行解群体;然后,针对不可行解群体利用自主选择学习算子选择对象进行学习,目的是不断扩大种群规模,避免算法陷入局部极值点,继而对可行解群体采取全局跨邻域搜索的方式,引导蚂蚁向全局最优解靠近,加快收敛速度;最后,基于全局最优解采用局部跨邻域的方式引导蚂蚁在小范围内进行细致搜索,提高收敛精度。通过与其他连续域蚁群优化算法针对CEC2017测试函数在低维和高维情况下的实验对比,证明本文算法具有较好的寻优能力和稳定性,能有效避免陷入局部最优。 相似文献
19.
主动学习是机器学习领域的重要研究方向.现有主动学习方法通常选择不确定性的或具有代表性的样本供专家打标,然后添加到已标记的数据集中供分类器学习,但没能充分利用数据的分布信息,并且在野点采集问题上有待改进.结合邻域粗糙集理论,提出了一种基于邻域粗糙集的主动学习方法(neighhbor rough set active learn-ing,NRS-AL).实验结果表明,在加州大学数据集(university of CaliforniaIrvine,UCI)上,该算法充分利用了数据的分布信息,同时结合样本的不确定性和代表性计算,处理了野点的选择,是一种能有效解决主动学习样本选择问题的算法,在accuracy,受试者工作特征(receiver operating characteristic curve,ROC)曲线下面的面积(area under curve,AUC)指标上优于文献中的主动学习算法. 相似文献