微博中个人与非个人用户分类方法研究 |
| |
引用本文: | 薛云霞,李寿山,阮进.微博中个人与非个人用户分类方法研究[J].山西大学学报(自然科学版),2015(2):192-198. |
| |
作者姓名: | 薛云霞 李寿山 阮进 |
| |
作者单位: | 苏州大学自然语言处理实验室;海军驻河海大学选培办 |
| |
基金项目: | 国家自然科学基金(61375073) |
| |
摘 要: | 分别利用用户名和微博文本对个人与非个人两种用户类型进行判别,并对不同的特征(例如:字特征、词特征等)进行研究分析;其次,在针对用户名和微博文本的两个分类器的基础上,使用贝叶斯融合方法进行分类器融合,充分利用两种文本分类信息同时进行用户类型判断。实验结果表明此方法可以达到较高的识别准确率,并且分类器融合方法明显优于仅利用用户名或者微博文本的分类方法。
|
关 键 词: | 个人用户识别 新浪微博 文本分类 自然语言处理 社交网络 |
本文献已被 CNKI 等数据库收录! |
|