首页 | 本学科首页   官方微博 | 高级检索  
     检索      

后缀树算法在舆情聚类中的应用
引用本文:彭 静,翟 英,冯 爽.后缀树算法在舆情聚类中的应用[J].河北科技大学学报,2012,33(1):65-68.
作者姓名:彭 静  翟 英  冯 爽
作者单位:1. 河北科技大学信息科学与工程学院,河北石家庄,050018
2. 河北经贸大学信息技术学院,河北石家庄,050061
3. 河北科技大学教务处,河北石家庄,050018
基金项目:河北省科技支撑计划项目
摘    要:针对网络舆情分析的需求背景,研究了通过后缀树算法发现文本文档之间的公共短语串,按公共短语串实现文档聚类。网页文档的标题和摘要能代表文档的主要思想,应用后缀树算法实现对标题和摘要自动聚类,从而实现舆情信息自动聚类。

关 键 词:网络舆情  后缀树算法  文本聚类
收稿时间:2011/6/27 0:00:00
修稿时间:2011/11/17 0:00:00

Application of STC algorithm to internet public opinions clustering
PENG Jing,ZHAI Ying and FENG Shuang.Application of STC algorithm to internet public opinions clustering[J].Journal of Hebei University of Science and Technology,2012,33(1):65-68.
Authors:PENG Jing  ZHAI Ying and FENG Shuang
Institution:1.College of Information Science and Engineering,Hebei University of Science and Technology,Shijiazhuang Hebei 050018,China;2.College of Information Technology,Hebei University of Economics and Bussiness,Shijiazhuang Hebei 050061,China;3.Department of Teaching Affairs,Hebei University of Science and Technology,Shijiazhuang Hebei 050018,China)
Abstract:In answer to the requirement of internet opinions analysis,this paper discusses the STC algorithm for text clustering,in order to discover common phrases that can assign documents and form document clusters.Because web document titles and abstracts can express the main ideas,web document clusters are created by STC algorithm,and clusters of internet public opinions information are created by using this method.
Keywords:internet public opinions  STC algorithm  text clustering
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《河北科技大学学报》浏览原始摘要信息
点击此处可从《河北科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号