首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于密度聚类模式的中文新闻网页关键词提取
引用本文:尹倩,胡学钢,谢飞,吴信东.基于密度聚类模式的中文新闻网页关键词提取[J].广西师范大学学报(自然科学版),2009,27(1).
作者姓名:尹倩  胡学钢  谢飞  吴信东
作者单位:1. 合肥工业大学计算机与信息学院,安徽,合肥,230009
2. 合肥工业大学计算机与信息学院,安徽,合肥,230009;佛蒙特大学,计算机系,伯灵顿,VT50405
摘    要:页没有提供关键词,人工标注关键词代价巨大,并且大多数已有的关键词自动提取算法都需要建立在人工标注的训练集之上,因而难以实用.由于关键词是文章中较重要且主题关联较凝聚的词的集合,因此提出一种基于密度聚类模式的中文新闻网页关键词提取方法,根据词语之间的共现信息,对网页分词后的词语进行聚类,在分析词语关联度的基础上提取出反映新闻主题的关键词.通过大量随机新闻网页实验结果表明,与单纯的TF/IDF(词频和文档频率倒数的乘积)方法相比,此算法召回率平均提高了7.15N,准确率平均提高了7.075%.

关 键 词:关键词提取  词共现  聚类  自然语言处理

Keyword Extraction Method Based on Density Clustering for Chinese News Web Pages
YIN Qian,HU Xue-gang,XlE Fei,WU Xin-dong.Keyword Extraction Method Based on Density Clustering for Chinese News Web Pages[J].Journal of Guangxi Normal University(Natural Science Edition),2009,27(1).
Authors:YIN Qian  HU Xue-gang  XlE Fei  WU Xin-dong
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号