首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于粗糙集的微博文本特征选择方法
引用本文:杜锐,朱艳辉,邓程,梁韬. 一种基于粗糙集的微博文本特征选择方法[J]. 科学技术与工程, 2013, 13(33)
作者姓名:杜锐  朱艳辉  邓程  梁韬
作者单位:湖南工业大学计算机与通信学院 株洲 412007,湖南工业大学计算机与通信学院 株洲 412007,湖南工业大学计算机与通信学院 株洲 412007,湖南工业大学计算机与通信学院 株洲 412007
基金项目:国家自然科学基金资助项目(61170102),湖南省自然科学基金资助项目(10JJ3002),国家社科基金资助项目(12BYY045),教育部人文社会科学研究青年基金资助项目(09YJCZH019);国家自然科学基金项目(面上项目,重点项目,重大项目)
摘    要:本文对中文微博中主客观分类特征的选取进行了研究,通过词典与统计相结合的方法提取了基础情感词、语气词、程度词等8个候选特征,对提取的候选特征,提出了一种基于粗糙集与概率加权的特征选择算法,通过该算法最终选取了基础情感词、!或!、网络观点词、语气词、形容词、程度词作为分类特征。实验结果表明,本文提出的方法能达到较好的分类效果。

关 键 词:关键词粗糙集 微博 观点句 识别
收稿时间:2013-07-14
修稿时间:2013-07-14

Micro Blog Text Feature Selection Based on Rough Set
durui,Zhuyanhui,Dengcheng and liangtao. Micro Blog Text Feature Selection Based on Rough Set[J]. Science Technology and Engineering, 2013, 13(33)
Authors:durui  Zhuyanhui  Dengcheng  liangtao
Affiliation:Institute of Computer and Communication, Hunan University of Technology,Institute of Computer and Communication, Hunan University of Technology,Institute of Computer and Communication, Hunan University of Technology
Abstract:AbstractIn this paper, the feature selection of subjective and objective classification of Chinese micro blog has been studied. For the features in Chinese micro blog, the combination of lexicon and statistics is used to extract candidate features. By this method, eight candidate features are extracted. And a feature selection algorithm based on rough sets and probability-weighted is proposed. Using the algorithm, six features are selected. The experiment result shows that these features selected by the algorithm achieve good result in subjective and objective classification of Chinese micro blog.
Keywords:KeywordsRough Set Micro Blog Opinion Sentence Recognition
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号