首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于知识图谱和LDA模型的社会媒体数据抽取
引用本文:麻友,岳昆,张子辰,王笑一,郭建斌.基于知识图谱和LDA模型的社会媒体数据抽取[J].华东师范大学学报(自然科学版),2018(5).
作者姓名:麻友  岳昆  张子辰  王笑一  郭建斌
作者单位:云南大学信息学院;云南大学民族学与社会学学院
摘    要:社会媒体数据的抽取,是社会舆论集散、新闻信息传播、企业品牌推广、商业营销拓展等研究和应用的基础,准确的抽取结果是数据分析有效性的重要保证.本文针对社会媒体数据的非结构、多主题特征,基于LDA(Latent Dirichlet Allocation)模型挖掘数据中的隐含主题,利用数据特征词序列和知识图谱描述的实体及实体间的关联关系,实现对特定领域数据的抽取.建立在"今日头条"新闻数据和新浪微博数据之上的实验结果表明,本文提出的方法能有效地实现社会媒体数据的抽取.

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号