首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于文本和社交语境的微博数据情感分类
引用本文:吴方照,王丙坤,黄永峰.基于文本和社交语境的微博数据情感分类[J].清华大学学报(自然科学版),2014(10):1373-1376,1383.
作者姓名:吴方照  王丙坤  黄永峰
作者单位:清华大学电子工程系
基金项目:国家“八六三”高技术项目(2012AA011004);清华大学自主科研计划项目(20111081023)
摘    要:微博数据的情感分析具有重要的应用价值和研究价值,是网络文本挖掘领域的研究热点。微博消息非常短而且稀疏,同时包含大量的不规则词语,噪声很强,给传统的情感分析方法带来了很大的挑战。受社会科学的相关理论的启发,该文尝试利用微博消息的社交语境来帮助解决情感分析所面临的稀疏性强和噪声大的困难。由于文本向量的维度很高,而具有情感倾向的词只占其中较少的一部分,因此将Lasso方法加进LR(logistic regression)模型中以提高模型的鲁棒性。在真实的英文Twitter数据集上的实验结果表明,加入社交语境和模型的稀疏约束能够有效提高微博数据情感分类的准确率。

关 键 词:情感分类  微博  凸优化  L1正则
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号