首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
传统的互信息特征选择方法受边缘概率的影响较大, 可能产生稀有词的概率评估分高于常用词的评估分, 从而导致倾向于选择低频词条的现象。为此,在分析了几种传统的特征提取方法基础上, 通过引入分散度及平均词频两个参数, 将互信息方法与特征的词频相关联, 从而使互信息的分类更加准确。实验结果表明, 该方法使分类效果更好。  相似文献   

2.
魏海平 《科学技术与工程》2012,12(12):3002-3004
随着Internet技术的飞速发展,网页上存在着各种各样、类目繁多的信息,因此网页分类技术就显得越来越有意义。本文使用向量空间模型(VSM)来表示网页文本,提出了一种改进X2的文本特征选择方法,最后通过支持向量机方法进行分类。实验结果表明,相对于传统的X2文本分类统计方法,改进后的特征选择方法的分类效果要好于传统的X2统计方法。  相似文献   

3.
根据科技文献的结构特点搭建了一个四层挖掘模式,并结合K-medoids算法提出了一个特征选择方法.该选择方法首先依据科技文献的结构将其分为4个层次,然后通过K-medoids算法聚类对前3层逐层实现特征词提取,紧接着再使用Aprori算法找出4层的最大频繁项集,并作为4层的特征词集合.同时,由于K-medoids算法的精度受初始中心点影响较大,为了改善该算法在特征选择中的效果,论文又对K-medoids算法的初始中心点选择进行优化.实验结果表明,结合优化K-medoids的四层挖掘模式在科技文献分类方面有较高的准确率.  相似文献   

4.
文本分类中特征选择方法的比较和改进   总被引:1,自引:1,他引:1  
考察了文档频率DF、互信息MI、CHI统计、CC统计四种不同的特征选择方法,并结合K近邻算法进行分类精度上的比较.为消除MI对低频词的倚重,提出一种DF与MI结合的特征评价函数,并验证了这种组合特征选择方法的有效性.  相似文献   

5.
特征权值的选择是文本分类技术的基础环节.在详细分析文本分类技术特点的基础上,基于信息熵理论建立了TF_IDF的改进算法模型;并根据实际工程数据,验证了算法模型的有效性.理论分析和实例验证表明该算法弥补了传统TFIDF算法没有考虑词条文本类间分布的不足,能更好的体现特征词条的权重,从而能有效提高分类的精确度.  相似文献   

6.
蚁群优化算法凭借其正反馈机制和强大的搜索能力被广泛地应用于各类优化问题求解上.本文试图将蚁群优化算法应用于特征选择领域并提出了新的量子化信息素蚁群优化(quantized pheromone ant colony optimization, QPACO)特征选择算法.相比于其他基于蚁群优化算法的特征选择算法,QPACO算法中采用了量子化信息素的启发式策略,改变了传统的信息素更新策略,因此避免了在搜索特征时的局部最优问题.实验采用了KNN分类器来指导学习过程,利用源于UCI数据库的多组数据集进行了相关的测试,实验结果表明,QPACO算法在分类精度、精确率、召回率和维度缩减率等方面均具有良好的性能.  相似文献   

7.
特性选择是文本分类、机器学习以及模式识别领域的重要问题之一.特征选择能在保证数据完整性的情况下减少高维数据的特征维数,同时提高分类的精度.以往提出的基于同义词词林的特征选择方法虽然能有效避免提取出的特征值在概念上的重复性,但并未考虑到权值最优的特征向量构成的子集可能并非是最优的.为了解决此问题,结合同义词和遗传算法,提出了一种新的基于同义词词林的文本特征选择方法.该方法首先对特征词进行同义词过滤、合并,在降低特征向量维度的同时避免了同义词带来的影响.然后采用改进的遗传算法选出具有较好适应度值的特征向量.实验结果表明,这种方法较之以往提出的方法,在保证特征选择准确率的基础上能明显地减小特征向量的维度.  相似文献   

8.
特征选择是文本分类的一个重要过程,对分类性能的提升发挥着重要的作用。传统的文档频率(Document Frequency,DF)特征选择指标只是从全局的角度统计包含特征的文档数作为选择的依据,没有考虑特征与类别的相关性。针对该问题,本文从特征和类别的相关性出发,对文档频率分别进行局部和全局的归一化处理,提出了一种归一化文档频率(Normalized Document Frequency,NDF)的特征选择指标,并在不同的特征维度下验证特征选择对文本分类性能的影响。结果表明,应用NDF特征选择指标可以得到更高的分类准确率和Macro-F1值。因此,对文档频率进行归一化处理可以更好地选择出有价值的特征,有效提升文本的分类性能。  相似文献   

9.
针对传统特征选择算法的不足, 提出一种新的特征选择算法. 该算法能综合度量一个特征在类内和类间的重要性, 并在3个不同的数据集上利用2个分类器与5个现有的特征选择方法进行了对比实验. 实验结果表明, 该算法进一步降低了特征向量空间的维度, 并有效提高了分类器的分类性能.  相似文献   

10.
刘洋 《科技信息》2007,(3):54-54
文本分类的主要任务是在预先给定的类别标记集合下,根据文本内容判定它的类别。特征选择是文本分类中的一个重要环节。本文对文档频率(DF)、信息增益(IG)、互信息(MI)、x2统计量(CHI)四种特征选择方法在中文语料上进行了性能比较。实验结果表明IG方法较其它三种方法有一定的优势。  相似文献   

11.
在分析单一、给定的邻域大小设定方法弊端的基础上,提出了基于属性数据标准差的阁值设定方法,并将蚁群优化算法引入到属性约简中,以属性重要度为启发信息,构造了基于邻域粗糙集和蚁群优化的属性约简算法,使用了4个UCI数据集进行约简.实验结果表明,提出的算法在约简的分类精度和约简中属性个数方面具有更好的性能.  相似文献   

12.
基于改进蚁群算法的路径规划方法   总被引:4,自引:0,他引:4  
针对城市道路交通中路径规划的特点,提出了一种基于改进蚁群算法的路径规划方法.该方法通过对交通约束的分析与转换,加强了对实际道路交通网络的描述,提高了路径规划的有效性;在引入方向启发的同时,保留了足够的初始搜索空间,提高了算法的路径规划效率.实验结果表明,该方法在规划效率与有效性上均有明显提高.  相似文献   

13.
基于改进蚁群算法与遗传算法组合的网络入侵检测   总被引:1,自引:1,他引:1  
为提高网络入侵检测的检测效果,提出一种基于改进蚁群算法与遗传算法组合的网络入侵检测方法.该方法采用遗传算法(genetic algorithm,GA)对网络入侵的特征集进行快速选取,为后续特征提取打下基础;对传统蚁群算法(ant colony optimization,ACO)的节点选择策略和信息素更新策略进行改进,提出一种改进的蚁群算法,提高对最优特征的选择效果,采用改进的蚁群算法对特征进一步选择;采用支持向量机(support vector machine,SVM)统计机器学习方法建立各类网络入侵的检测分类器.仿真实验结果表明,新的网络入侵检测方法综合GA和改进蚁群算法的优势,能够获得更好的入侵特征,从检测正确率、误报率和漏报率3个方面综合比较,新的网络入侵检测方法具有更好的网络入侵检测效果,且提高了检测速率.  相似文献   

14.
基于四叉树和改进蚁群算法的全局路径规划   总被引:3,自引:0,他引:3  
为解决机器人在大范围二维平面区域内的路径规划问题,提出一种四叉树和改进蚁群算法相结合的路径规划方法.基于四叉树分解法,对路径规划的二维区域进行环境建模,在环境建模的基础上,采用改进蚁群算法进行高效的路径规划.四叉树在完整地记录环境信息的同时对环境信息进行了高效地压缩,改进蚁群算法可以规划出与障碍物保持一定安全距离的路径,提高了规划出的路径的实用性.仿真实验表明,提出的路径规划方法在执行效率和路径的实用性上取得了良好的平衡,可以高效地对大区域进行路径规划.  相似文献   

15.
通过深入分析蚁群算法中信息素更新系数对算法寻优能力与收敛速度的影响,定义了平均路径相似度(ATS)来表征寻优过程的成熟程度,据此自适应调整信息素更新系数,以提高算法收敛速度,并避免陷入局部最优.经过与典型蚁群算法在多个旅行商问题测试用例上进行比较,表明新算法具有更好的效果.  相似文献   

16.
17.
针对蚁群算法应用于移动机器人路径规划时存在易于陷入局部最优解、收敛速度慢的问题,提出了一种适用于静态障碍环境下基于改进蚁群算法的移动机器人路径规划方法。该方法改进了节点间的状态转移规则,增加了得到最优路径的概率;自适应调整启发函数,提高了算法的搜索效率;基于狼群法则对信息素进行更新,有效避免了算法陷入局部最优解;动态调整了衰减系数,在后期增加了蚂蚁对最优路径的选择概率,加快了算法的收敛速度。仿真实验表明,与其他算法在相同环境下比较,该改进算法在路径规划结果相同的情况下具有较快的收敛速度;且改进算法在不同复杂程度环境中均得到了最优路径,也表明了该算法的有效性和可靠性。该算法具有良好的寻优能力,可以适用于不同复杂环境中的移动机器人路径规划。  相似文献   

18.
针对在结构化栅格工作环境下,基于蚁群算法的路径规划存在停滞和收敛速度慢的问题,提出了一种基于改进蚁群算法的二维码移动机器人路径规划方法.通过限制蚂蚁的搜索方向,即将机器人置于结构化栅格工作环境下,使其只能在水平和垂直方向上移动,进而提高算法的搜索效率.引入自适应期望函数和启发因子,动态调整状态转移概率,避免算法陷入停滞状态,提高算法的收敛速度.针对机器人在转弯过程中耗费时间较长的问题,通过引入转弯影响因子得到扩展路径长度,进而根据扩展路径长度选取最优路径.实验结果表明,提出的方法可以为二维码移动机器人规划出最优路径.  相似文献   

19.
 针对动态复杂环境下的机器人路径规划问题,建立栅格地图模型,研究一种改进蚁群算法与Morphin 算法相结合的动态路径规划方法。改进蚁群算法引入拐点参数评价路径优劣,并对路径进行拐角处理以及变更拐角处信息素更新机制,使规划的全局路径更加平滑;Morphin 算法则在机器人行走时,根据全局路径的局部环境实时规划局部路径,使机器人有效地躲避障碍物。仿真试验结果表明,该方法结合全局规划与局部规划的特点,能够使机器人沿着一条短而平滑的最优路径快速、安全地到达目标点。  相似文献   

20.
蚁群算法作为一种新型的模拟进化算法,具有分布计算和信息正反馈等优点,但蚁群算法与其他进化算法一样存在收敛速度慢,易陷于局部最优等缺陷。针对这一问题,提出一种改进的蚁群算法,结合遗传算法和图论中的最邻近算法,并自适应地初始化信息素和限定信息素的大小范围。将该算法应用于旅行商问题(traveling salesman problem,TSP)求解,与基本蚁群算法比较,数值实验结果表明,这种改进算法能有效抑制算法陷入局部最优的缺陷,从而提高了解的全局搜索能力和解的质量。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号