首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基于遗传算法的文本聚类特征选择   总被引:3,自引:0,他引:3  
传统的文本聚类特征选择方法不能发现最优特征集,而遗传算法能获得全局最优解且具有高的寻优效率,因此提出利用遗传算法进行文本聚类的特征选择.把一种特征组合看作一个染色体,对其进行二进制编码,引入文本集密度作为适应度函数进行特征个体适应度的评价.通过选择、交叉和变异的遗传操作,能较为快速地求出最优特征集.对公开的文本分类语料所进行的实验表明,基于遗传算法的特征选择使文本聚类结果的精度较之特征选择前提高了5.9%,而聚类时间减少了15 s.  相似文献   

2.
对基于内容的图像检索中的低层特征的相关检索算法进行了深入研究,对现有颜色和纹理的自然特征中提取出的特征量的检索成功率进行了测试,发现使用单一的特征对图像进行检索查全率不高.为了提高查全率,综合了颜色和纹理特征的检索算法,给颜色特征和纹理特征分配一定的权重,设计了权重设计器,确定了查全率达到最高值时颜色和纹理特征的权重分配,提高了检索效率,识别效果很好.  相似文献   

3.
在入侵检测系统中,分类器所选取的特征对系统的性能有很大的影响,大量冗余和不相关特征的存在会降低系统的正确性和实时性,因此如何选取出最优特征组合成为研究的热点问题。在研究当前各种特征选择方法的基础上,提出了一种基于遗传算法的特征组合选择方法。使用遗传算法搜索特征空间,依据Fisher准则计算各种特征组合的分类能力,根据计算结果对特征组合进行选择、交叉、变异,通过多次反复迭代最终选取出最优的特征组合。在实验中分别使用全部特征和选取出的最优特征组合的进行分类验证,最终证明选取出的最优特征组合能够使入侵检测系统在保持高检测率和低误报率的同时具有较高的检测效率,提高了系统的整体性能。  相似文献   

4.
针对图像检索中基于部位的加权聚合(PWA)方法存在的视觉突发问题,提出一种幂归一化的深度卷积特征加权聚合方法。首先简化了原PWA方法中用于确定空间权重的归一化和幂变换操作,直接将所选择的有区分性的通道特征图作为空间权重矩阵,然后引入新的幂变换函数并选取合适的参数对加权聚合后的通道响应进行归一化处理,最后通过PCA降维和白化处理形成图像的全局特征表示形式。在4个标准数据库上的图像检索实验结果表明,该方法能有效调节PWA聚合特征响应的突发度并提高图像检索的准确率。  相似文献   

5.
提出了一种双向二维PCA((2D)2PCA)及改进遗传算法(GA)相结合的人脸识别方法.该方法首先利用(2D)2PCA分别从图像的行、列方向进行特征提取,然后通过遗传算法对提取的特征空间以并行的方式进行优化,得到最优行、列特征空间,最后根据最优特征空间进行分类.在ORL人脸库上的实验结果表明,该方法较之传统的方法具有更高的识别率及识别速度,在各种鉴别特征维数下更具鲁棒性,是有效的人脸识别方法.  相似文献   

6.
基于遗传算法的遥感图像纹理特征选择   总被引:3,自引:0,他引:3  
本文基于Landsat 7 ETM 全色图像,以浙江省临安市大峡谷镇为研究区,进行基于遗传算法的遥感图像纹理特征选择的研究.首先利用灰度共生矩阵法和灰度-梯度共生矩阵法对研究区遥感图像进行纹理特征提取,共得到23个纹理特征,然后利用遗传算法对这23个纹理特征进行纹理特征选择,最后得到一组最优纹理特征集.实验结果表明,遗传算法因其自适应性、并行性、能较好地处理大规模复杂数据,且特别适合于解决多目标优化问题等诸多特性,所以是解决特征选择问题的理想方案.  相似文献   

7.
特性选择是文本分类、机器学习以及模式识别领域的重要问题之一.特征选择能在保证数据完整性的情况下减少高维数据的特征维数,同时提高分类的精度.以往提出的基于同义词词林的特征选择方法虽然能有效避免提取出的特征值在概念上的重复性,但并未考虑到权值最优的特征向量构成的子集可能并非是最优的.为了解决此问题,结合同义词和遗传算法,提出了一种新的基于同义词词林的文本特征选择方法.该方法首先对特征词进行同义词过滤、合并,在降低特征向量维度的同时避免了同义词带来的影响.然后采用改进的遗传算法选出具有较好适应度值的特征向量.实验结果表明,这种方法较之以往提出的方法,在保证特征选择准确率的基础上能明显地减小特征向量的维度.  相似文献   

8.
针对文本特征选择中原始特征空间维数过高,提出一种基于类别相关性及遗传算法的文本特征选择方法.有效地降低了特征空间的维数,提高了分类准确率.实验验证了该方法的有效性.  相似文献   

9.
提出一种基于属性和距离加权的K近邻特征选择方法.该方法在计算样本类别时既考虑每个特征的重要程度,又考虑近邻样本的距离,使用遗传算法搜索最优特征权重向量.将该方法与已有的3种特征选择方法MIFS、DISR和CIFE在6个公开的数据集上进行比较,实验结果表明该方法是有效的,且可以提高分类性能.  相似文献   

10.
流标签是当前多标签学习领域中一个较新颖的挑战性问题,存在标签空间未定、标签数量不断增加甚至趋于无穷等问题.在多标签学习的特征选择中,每当有新的标签到达时标签空间都将发生改变,传统的多标签特征选择算法需重新进行特征选择,所以不适用.针对此问题,采用将流标签进行分组批量处理的方式,并考虑标签之间的相关性,提出一种新的流式多标签特征选择方法,考虑分组后每组标签内部潜在的关联结构和不同标签组之间的标签差异性,赋予每组标签不同的权重来计算每个特征与标签空间的模糊互信息.同时,结合mRMR (Max-Relevance and Min-Redundancy)的特征选择策略进行冗余特征的剔除,从而挑选最优的特征子集.该方法同时适用于固定标签空间和流式标签空间中的特征选择问题.最后,选取八个多标签基准数据集,采用四种评价指标与已有相关的多标签特征选择方法进行对比实验,实验结果证明了提出方法的有效性和高效性.  相似文献   

11.
特征选择作为一种常见的降维方法,一直以来都是机器学习和数据挖掘领域的热点话题.针对传统特征选择算法没有充分考虑特征全局冗余性,导致选择的特征子集对分类识别精度不够高的问题,提出基于复杂网络节点重要度评估和遗传算法的特征选择算法,将每个特征视为网络节点,根据互信息建立边,将特征选择问题转化为节点重要度评估问题,利用遗传算法选择最优特征子集.实验结果表明此算法能够找到较为优秀的特征子集,有效降维并提高分类精度.  相似文献   

12.
基于GA-BP神经网络的隧道初期支护钢拱架内力预测   总被引:1,自引:0,他引:1  
针对误差反向传播(BP)神经网络易陷入局部极小值的问题,将遗传算法(GA)与BP神经网络相结合,先以遗传算法全局最优的特性对初始化的BP网络的权重和阈值进行优化,再将优化的权重和阈值作为初值带入BP网络训练得到最优解.运用此改进的BP神经网络对竹盖山隧道初期支护钢拱架内力进行预测,取得了良好的效果,精度高、收敛快,为指导和控制工程施工提供了有效的依据.  相似文献   

13.
为提高土壤养分近红外光谱预测模型的鲁棒性和预测精度,提出一种基于改进遗传算法的近红外区间光谱特征波长变量选择方法.利用土壤速效磷近红外光谱全光谱波长变量纯度梯度的正负变化次数将全光谱划分为多个波长间隔,以偏最小二乘回归模型(PLS-R)输出的变量投影重要性系数(V_(VIP))大于1作为提取准则,提取对土壤养分预测目标量解释性较强的波长间隔,并合并成一个区间光谱.建立区间光谱特征波长变量(FWV)PLS-R模型,利用改进遗传算法选择PLS-R的均方根误差为最小对应的FWV为最优FWV.试验结果表明:该方法在区间光谱选择最优FWV,能提高回归模型的鲁棒性和预测精度,简化模型结构;改进遗传算法采用一种改进的实数编码差分变异算子,扩大了全局最优解搜索空间,提高了收敛速度.  相似文献   

14.
针对模式识别中特征子集的选择存在组合优化的情况,采用了一类遗传序优化算法,以序优化思想为指导,对传统遗传算法中的参数及操作进行改进.利用有限的计算资源寻求复杂特征选择问题的近似最优解,从而有效地降低了特征维数,加快搜索到最优特征子集的速度,为特征选择问题提供了一种新的处理方法.通过Matlab仿真,对美国加州电力市场的实际数据进行预测.结果表明,月平均误差不超过2.62%,因此该算法在电力负荷预测方面有很强的实用性.  相似文献   

15.
针对闵可夫斯基子空间聚类算法对特征权重分配的问题,提出了一种混合测量子空间聚类算法(iMWK-HD),以实现调节特征权重因子和提高算法性能的目的。利用闵可夫斯基距离与余弦相结合的混合测量来分配特征权重,构造新的目标函数;在聚类迭代过程中,采用智能K-means进行初始化来解决选择正确类数的问题;根据新的目标函数,使用拉格朗日乘子法求解新的隶属度和特征权重更新公式,使类中心更加稳定,从而促进特征空间转换,获取数据集最优聚类结果。采用UCI数据集设计了对比实验,实验结果表明,iMWK-HD算法优于iK-means、iWK-means、iMWK-means这3个现有的聚类算法,所提算法能有效提升聚类精确度和聚类结果的稳定性。  相似文献   

16.
中药数字化是中药质量控制的发展趋势,而中药的质量等级分类是其中的重要环节.针对中药饮片质量等级鉴定自动化问题,将传统特征及遗传算法有机融合用于黄芪饮片质量等级分类.选取甘肃道地药材黄芪饮片,对其图像进行增强、归一化、空间转换等预处理,并融合颜色及纹理特征,将提取的8个颜色及纹理特征作为等级分类的特征向量,进而采用线性分类器通过特征向量的线性组合来对黄芪饮片的质量等级进行分类,通过遗传算法获取8种特征的最优权重系数以及不同等级的最优区间.研究结果表明,算法得到的优化参数具有较高的识别率及可行性.该结论有助于中药直观鉴别的科学定量化以及中药饮片的质量等级鉴定客观化.  相似文献   

17.
为了提高网络入侵检测正确率,利用特征选择和支持向量机(SVM)参数间的相互联系,提出一种特征选择和SVM参数联同步优化的网络入侵检测算法.该算法首先将网络入侵检测正确率作为问题优化的目标函数,网络特征和SVM参数作为约束条件建立数学模型,然后通过遗传算法对数学模型进行求解,找到最优特征子集和SVM参数,最后利用KDD 1999数据集对算法性能进行测试.结果表明,相对于其他入侵检测算法,同步优化算法能够较快选择最优特征与SVM参数,有效提高了网络入侵检测正确率,加快了网络入侵检测速度.  相似文献   

18.
为提高蝙蝠算法进行特征选择的正确率,提出全局混沌蝙蝠优化算法(GCBA).首先,GCBA采用混沌映射方法使种群的初始化能够遍历整个解空间,获取蝙蝠初始的最优位置,使其具有更加丰富的种群,解决了初始化种群随机性的问题.同时,GCBA引入当前粒子的最优解和当前种群的最优解跳出局部最优解,可有效避免算法早熟,有利于提高算法的全局搜索能力.蝙蝠算法(BA)、粒子群算法(PSO)与遗传算法(GA)在10个数据集上的测试结果表明,所提算法具有更高的分类精度和更强的跳出局部最优的能力.  相似文献   

19.
面向加工中心的工艺方案优化技术   总被引:1,自引:1,他引:0  
在全面考虑影响加工效率和质量的多个因素的基础上,使用多种优化方法,选择最优的工艺方案.首先用神经网络为每个加工特征选择合适的加工链,将不同特征的加工链组合成可行的加工方案集合,然后用遗传算法对加工方案排序,以辅助加工时间最少为优化目标,决策出最优的加工方案.将相关特征聚合为一个特征参加排序,大大减少了计算复杂度;最后,在聚类特征内部以刀具空行程最短为目标,规划刀具的移动路径.算法以某厂缸盖为对象进行实例验证.  相似文献   

20.
为解决局部最优问题,将遗忘机制引入传统遗传算法中,提出了一种改进的遗忘遗传算法,给出了一种遗忘算子及其遗忘概率,通过在遗传过程中遗忘某些基因,增加了算法的搜索空间,使算法跳出局部最优,从而最大限度地避免早熟收敛.将该算法用于不同欠费率下的电信客户初始信用评分,找到信用权重的优化解,较好地解决了对高欠费率群体进行信用评分时,信用权重的适应值偏低的问题.实验结果表明所提算法有效可行.与标准遗传算法相比,本文所提算法可以获得更高质量的解.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号