首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于查询日志分析的中文网页关键词抽取方法
引用本文:王晓艳,王珍珍.基于查询日志分析的中文网页关键词抽取方法[J].广西师范大学学报(自然科学版),2015(2):42-48.
作者姓名:王晓艳  王珍珍
作者单位:1. 福建师范大学 协和学院,福建 福州,350117
2. 福建师范大学 经济学院,福建 福州,350108
基金项目:国家社会科学基金资助项目
摘    要:以全文索引为基础的网页搜索引擎检索相关度偏低。针对这一问题,本文提出了一种基于查询日志分析的中文网页关键词抽取方法。该方法利用用户对网页与查询词的相关性判断来选择关键词。为了量化用户的相关性判断,提出了单位篇幅停留时间、逆向点击率、排名补偿因子3个指标,并对其进行综合加权。在查询串分词、同义词识别及多义词消歧、关键短语组配方面,也做了特殊处理。实验结果表明:抽取关键词的准确率较高,综合性能也高于TF.IDF和SVM方法。该方法能得到较满意的关键词抽取效果。

关 键 词:抽取  关键短语组配  同义词识别  多义词消歧

Chinese Page Keyword Extraction Method Based on Query Log Analysis
WANG Xiao-yan,WANG Zhen-zhen.Chinese Page Keyword Extraction Method Based on Query Log Analysis[J].Journal of Guangxi Normal University(Natural Science Edition),2015(2):42-48.
Authors:WANG Xiao-yan  WANG Zhen-zhen
Institution:WANG Xiao-yan;WANG Zhen-zhen;Concord College,Fujian Normal University;School of Economics,Fujian Normal University;
Abstract:
Keywords:query log  keyword extraction  keyphrase matching  synonym recognition  polysemy disam-biguation
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号