首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进的PSO和HMM的Web信息抽取算法
引用本文:王川,段德全,王晓东. 基于改进的PSO和HMM的Web信息抽取算法[J]. 河南师范大学学报(自然科学版), 2010, 38(5)
作者姓名:王川  段德全  王晓东
作者单位:河南师范大学计算机与信息技术学院,河南,新乡,453007
基金项目:河南省科技厅基金项目,河南师范大学青年科学基金 
摘    要:针对传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际应用中模型参数极易陷入局部最优的问题,提出了一种基于改进的粒子群优化算法的隐马尔可夫模型参数优化模型,用于Web信息抽取.以似然概率值作为适应度函数,使用改进的粒子群优化算法结合Baum-Welch算法对HMM模型参数进行全局优化,实现了Web页面信息的抽取.实验结果表明,该算法在精确率和时间等指标上与现有算法相比具有更好的性能.

关 键 词:PSO  HMM  Web信息抽取

A Improved PSO and HMM Algorithm for Web Information Extraction
WANG Chuan,DUAN De-quan,WANG Xiao-dong. A Improved PSO and HMM Algorithm for Web Information Extraction[J]. Journal of Henan Normal University(Natural Science), 2010, 38(5)
Authors:WANG Chuan  DUAN De-quan  WANG Xiao-dong
Abstract:The traditional HMM for Web information extraction is sensitive to the initial model parameters and easy to lead to a local optimal model in practice.A parameters optimum model algorithm based on improved PSO for HMM is put forward for Web information extraction.The algorithm makes the fitness values as the results of the likelihood values,and combines improved PSO and Baum-Welch algorithm to optimize HMM parameters globally to extract information in Web pages.Experimental results show that the new algorithm improves the performance in precision and time-consuming over the present algorithm.
Keywords:PSO  HMM
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号