首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
网络舆论对人们生活的影响程度与日俱增,通过结合多源数据进行事件发现可以更好地捕捉舆情事件,提高舆情系统的效果。针对在多源文本场景下如何将来自新闻、微博、微信等多通道的数据融合,文章根据事件的定义,提出了事件核心实体的概念,设计了事件核心实体识别方法,并且将事件核心实体应用到事件发现过程,提出了结合实体的事件发现方法 ESP(Entity Single-Pass)。该方法通过引入实体信息,丰富了多源文本中每篇文档的表达,从而提高了多源文本事件发现的效果。实验表明,在微博、新闻等数据上,我们的方法与K-means和SinglePass方法相比,在NMI与RI两项指标上分别提高了0.2和0.3,证明了ESP算法的有效性。  相似文献   

2.
利用微博数据检测突发事件具有重要意义.针对以往检测方法特征不够丰富、准确率不高等问题,提出了一种基于多种特征融合的微博突发事件检测方法.该方法根据情感符号构建情感特征模型,对微博数据进行情感分类,并采用Kleinberg算法对情感特征进行突发期检测;在突发期内根据词频特征、词频增长特征和话题标签特征融合加权提取突发词,...  相似文献   

3.
社交媒体的快速发展导致了虚假新闻的广泛传播,这不仅影响了人们的生活,也损害了社交媒体平台的可信度。因此,中文假新闻检测是一项具有挑战性且意义重大的任务。然而,现有的中国社交媒体平台的假新闻数据集数据量相对较少,该领域的数据收集相对陈旧,不能满足进一步研究的要求。考虑到这一背景,本文提出了一个最新的中文微博假新闻数据集,其中包含从微博收集的26320条假新闻数据。此外,还提出了一种基于数据增强的假新闻检测模型,可以有效解决假新闻数据缺乏的问题,提高模型的泛化能力和鲁棒性。对从微博收集的假新闻数据集进行了大量实验,并成功将模型部署在网页上。实验结果证明了所提出的端到端模型在检测社交媒体平台上的虚假新闻方面的有效性。  相似文献   

4.
自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.  相似文献   

5.
自动摘要是自然语言处理中研究文本主题提取的重要课题.传统的摘要研究侧重于新闻、Web网页和博客等长文本的主题提取.本文关注以微博为代表的短文本的主题摘要,提出基于图结构的微博主题区域划分方法,并采用LDA方法提取微博热点事件的主题信息.最后,通过可视化方式展现主题内容在微博转发中的变化.  相似文献   

6.
为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。  相似文献   

7.
事件触发词识别是事件抽取技术中核心任务之一,在面向微博的突发事件触发词识别中,提出一种基于扩展触发词表和多值分类模型(P-Multi模型)相融合的触发词识别方法,进行事件触发词识别。以多值分类模型以扩展触发词为基础,结合基于模式规则匹配,对文本进行潜在语义分析,进一步挖掘触发词语义信息,将模式匹配和语义分析融合在微博突发事件触发词识别之中。实验结果在触发词识别准确率、召回率上均有所提升,证明了该方法的有效性。  相似文献   

8.
基于句法与主题扩展的中文微博情感倾向性分析模型   总被引:1,自引:0,他引:1  
微博数据具有微博文本长度不一,文本内容主题发散性,夹杂微博专用符号等特性,需要一种融合句法分析、领域知识、表情符号等多因素的综合建模方法对社会、娱乐、安全等多领域微博进行情感分析. 文章提出了一种面向主题的中文微博情感建模方法,该模型涵盖了数据预处理、句法分析、主题扩展、领域知识、情感词上下文极性调整、表情符号等内容,最后以新浪微博采集数据,选取3个领域主题进行了实验,在特定的实验环境下,得到了较高的分析准确率.   相似文献   

9.
食品安全是广受民众关注的热点话题,而微博已经成为食品安全事件曝光的主要媒体平台.以微博语料作为数据源,同时使用微博内容和用户的社交网络行为特征,提出了基于动量模型的食品安全事件发现方法.该方法以事件发现作为描述食品安全事件的基本模型,以检测出微博信息流中与食品安全相关的候选特征词,然后采用动量模型实现候选特征词的动量建模和重复特征词的有效过滤.最后,通过K-means聚类将有效的特征词进行归类合并,以实现食品安全事件的发现.试验结果表明:该方法能够有效发现在微博中传播的食品安全事件,并能过滤掉微博中无关的话题.  相似文献   

10.
随着Internet的大规模普及,互联网成为人们获取新闻的主要来源.如何从动态的海量网络信息中自动发现突发事件的新闻流主题,并跟踪突发事件的相关信息,从技术上实现对新闻专题进行组织和生成,对新闻事件进行探测与跟踪,一直是技术上的一个难题.Web文本挖掘的概念及关键技术,对其在新闻主题检测与主题追踪中的应用进行了一些探索性的工作.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号