首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于相邻词的中文关键词自动抽取
引用本文:王灿辉,张敏,马少平,黄宇.基于相邻词的中文关键词自动抽取[J].广西师范大学学报(自然科学版),2007,25(2):161-164.
作者姓名:王灿辉  张敏  马少平  黄宇
作者单位:1. 清华大学,信息科学技术学院,北京,100084
2. 北京交通大学,计算机与信息技术学院,北京,100044
基金项目:国家重点基础研究发展计划(973计划) , 国家自然科学基金 , 教育部科学技术研究重点项目
摘    要:文档关键词概括了文档的主题和内容,在信息检索、文本分类、文本聚类等领域有着重要应用.在总结前人研究成果的基础上,提出了一种基于相邻词的中文关键词自动抽取算法.在对50篇学术论文自动抽取关键词的实验中,采用精确匹配的评价获得了38.9%的精度和34.9%的召回率,采用近似匹配的评价获得了70.7%的精度和68.8%的召回率,能够为进一步的研究提供帮助.

关 键 词:相邻词  关键词抽取  信息检索
文章编号:1001-6600(2007)02-0161-04
收稿时间:2006-12-15
修稿时间:2006-12-15

Chinese Keyword Extraction Algorithm Based on Neighbour Words
WANG Can-hui,ZHANG Min,MA Shao-ping,HUANG Yu.Chinese Keyword Extraction Algorithm Based on Neighbour Words[J].Journal of Guangxi Normal University(Natural Science Edition),2007,25(2):161-164.
Authors:WANG Can-hui  ZHANG Min  MA Shao-ping  HUANG Yu
Institution:1. School of Information Science and Technology,Tsinghua University,Beijing 100084,China; 2. College of Computer and Information Technology,Beijing Jiaotong University,Beijing 100044,China
Abstract:
Keywords:neighbour words  keyword extraction  information retrieval
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号