基于知识图谱和LDA模型的社会媒体数据抽取 |
| |
引用本文: | 麻友,岳昆,张子辰,王笑一,郭建斌.基于知识图谱和LDA模型的社会媒体数据抽取[J].华东师范大学学报(自然科学版),2018(5). |
| |
作者姓名: | 麻友 岳昆 张子辰 王笑一 郭建斌 |
| |
作者单位: | 云南大学信息学院;云南大学民族学与社会学学院 |
| |
摘 要: | 社会媒体数据的抽取,是社会舆论集散、新闻信息传播、企业品牌推广、商业营销拓展等研究和应用的基础,准确的抽取结果是数据分析有效性的重要保证.本文针对社会媒体数据的非结构、多主题特征,基于LDA(Latent Dirichlet Allocation)模型挖掘数据中的隐含主题,利用数据特征词序列和知识图谱描述的实体及实体间的关联关系,实现对特定领域数据的抽取.建立在"今日头条"新闻数据和新浪微博数据之上的实验结果表明,本文提出的方法能有效地实现社会媒体数据的抽取.
|
本文献已被 CNKI 等数据库收录! |
|