首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
新闻事件主题句识别任务是一项基于文本内容进行语义分析的自然语言处理技术。为准确计算新闻事件文本中与新闻主题语义最相关的句子,提出一种基于图的新闻事件主题句抽取方法。首先利用描述事件特征的触发词及命名实体构建候选新闻事件句子抽取模板,然后,计算候选事件句之间的关联关系构建事件关系无向图,最后基于TextRank算法思想将图中任意顶点的权值表征为与其有关联的顶点权值的加权和,并按权值进行排序实现事件主题句抽取。实验结果表明,提出的方法优于基于TFIDF和基于标题的事件主题句抽取方法,F值分别提升了6.26%和2%。  相似文献   

2.
以情感依存元组(EDT)作为中文情感表达的基本结构,把新闻文本主题情感倾向性判别任务分成主题识别、情感倾向性分析和主客观分类三个逐层递进的子任务。在主题识别前先对TF-IDF方法进行改进,再结合基于交叉熵方法提取主题特征词,同时考虑了新闻文章标题的主题表征作用,将标题词纳入主题特征集;然后基于空间向量模型计算句子与主题特征向量的相似度,在此基础上考虑句子位置、长度及句子与标题的相似度,计算句子的主题相关度以抽取主题句;最后建立情感依存元组判别模型计算主题句的情感,采用主、客观分类规则筛选出新闻倾向关键句。本方法在COAE 2014评测中各项指标皆逼近最好成绩,表明基于情感依存元组的分类方法具有较高的分类性能。  相似文献   

3.
针对抽取新闻关键信息需要人工构造或训练生成模板的问题,提出了基于标签和分块特征的新闻关键信息自动抽取方法。该方法首先通过计算新闻网页相关特征来定位新闻正文标签块,然后通过编辑距离定位新闻标题标签块,最后根据正文块和标题块定位新闻发布时间和来源标签块,并通过抽取各块的文本获得目标新闻关键信息。在该方法的基础上提出了针对新闻站点的目标新闻自动抽取框架,并用该框架对10个新闻站点的30个新闻栏目进行了新闻抽取。对抽取到的1 597条新闻随机选择了1 000条进行了实验。实验结果表明,该方法对新闻标题、发布时间、来源、正文均表现出良好的抽取效果,且优于实验对比对象。  相似文献   

4.
在情感计算中,提取情感关键句是简化分类过程、提高分类正确率的关键环节.近年来,人们的社交需求日趋旺盛,表情符相较于文字具有更为丰富的语义信息,在各交流系统中得以广泛应用.为提升情感关键句提取方法的性能,对表情符的情感极性进行深入分析,提出一种基于表情符分析的情感关键句提取方法.首先统计表情符的情感极性,再将其和纯文字句子情感极性进行对比分析,对于句子中词组的情感极性不一致的句子将采用类序列规则挖掘,得出句子的最终情感极性;然后再结合位置信息以及关键词等属性特征,作为衡量该句是否为情感关键句的重要依据;通过对比实验验证了所提方法相较于现有方法在正确率和召回率方面都有较大提高.  相似文献   

5.
为提高信息检索中检索结果的查准率,提出了基于句法分析以及带权路径长度的句子相似度计算方法。该方法首先对用户问句进行了分词、词性标注以及句法分析处理,并根据处理后的结果对该句进行了关键词提取、加权和同义词近义词扩展处理。然后提出了基于带权路径长度计算的方法,并用该方法计算用户问句与检索信息标题句之间的相似度,即问句的带权路径长度与标题句的带权路径长度的相对比值,以此对检索结果进行二次排序,提高检索结果查准率。实验表明,该句子相似度方法能有效地提高信息检索中检索结果的查准率。  相似文献   

6.
提出了面向微博应用的新闻文本自动摘要研究方法.利用互信息对新闻文本中词语和句子之间的语义特征进行计算,根据其关联度对句子进行主题划分,赋予主题句较高的权重,同时从文本中抽取多种组合特征,利用Ranking SVM对句子进行排序,从而得到自动摘要.在NLPCC2015面向微博中文新闻自动摘要评测数据集上进行对比实验,取得了良好效果,证明该方法的有效性.  相似文献   

7.
新闻事件检测是自动检测新闻文本中出现的相关事件,需要大量人力设计模板,而且难以获取句中隐含的语义信息,识别触发词时多存在歧义.为解决以上问题,利用融合依存句法信息的卷积神经网络(Dependency Parsing Convolutional Neural Networks,DPCNN),针对句子级别越南语新闻事件进行检测.该模型在编码过程中融合了词义、位置信息、词性信息和命名实体信息,利用传统卷积编码连续词之间的特征,利用融合依存句法信息的卷积编码非连续词之间的特征,再融合两部分特征作为事件编码,进而实现事件检测.实验结果表明,该方法在越南语新闻事件检测中取得了很好的效果.  相似文献   

8.
多文档自动摘要研究是自然语言处理领域的关键问题之一,为使抽取的摘要更能体现多文档主题,本文在子主题划分的基础上,提出了一种融合句义特征的句子优化选择方法.该方法基于句义结构模型,提取句义结构中的话题、谓词等特征,并融合统计特征构造特征向量计算句子权重,最后采用综合加权选取法和最大边缘相关相结合的方法抽取摘要.选取不同主题的文本集进行实验和评价,在摘要压缩比为15%情况下,系统摘要平均准确率达到66.7%,平均召回率达到65.5%.实验结果表明句义特征的引入可以有效提升多文档摘要的效果.   相似文献   

9.
韩书庚 《科技资讯》2010,(31):174-174
21世纪的信息社会中新闻价值日益重要,其中的标题是新闻内容的精华,"五秒钟效应"就是指的新闻标题有无吸引力直接着受众的兴趣,毫不夸张地说新闻业界的竞争已经地地道道成为新闻标题的竞争。学术界对于新闻标题的辞格研究不少。彭朝丞先生的《新闻标题学》(1996)共归纳出40种新闻标题中出现的辞格。段业辉先生在《新闻语言学》(1999)中分别对消息、通讯和评论三者的标题常出现的辞格得出结论。本文将对消息中的时政、社会和体育类标题的辞格运用进行考察。料源于《人民日报》2009年11月至12月的100条时政消息标题,另外,社会新闻标题和体育新闻标题各100条,来自于冯根良、易令华的《新闻标题荟萃(》2001)。  相似文献   

10.
互联网时代信息量庞大,简洁的标题可以提高信息阅读效率。在课堂场景下,知识点标题生成便于用户整理和记忆课堂内容,提高课堂学习效率。该文将标题生成应用于课堂教学领域,制作了课堂知识点文本—标题数据集;提出了一种改进的TextRank算法——考虑关键字和句子位置的文本排序(textranking considering keywords and sentence positions, TKSP)算法,该算法综合考虑了关键词和句子位置等因素对句子权重的影响,能够更准确地提取文本重点信息。使用以召回率为导向的摘要评价(recall-oriented understudy for gisting evaluation, ROUGE)方法,TKSP算法在ROUGE-1、 ROUGE-2和ROUGE-L指标上的得分率分别为51.20%、 33.42%和50.48%,将TKSP抽取式算法与统一语言模型(unified language model, UniLM)结合,并融合文本主题信息,提出统一语言模型结合考虑关键字和句子位置的文本排序算法的模型(unified language modeling co...  相似文献   

11.
基于新冠疫情时代海外侨情危机事件频发,提出一种基于自动化信息要素抽取的新闻事件类型识别方法,对后疫情时代侨情新闻事件进行智能危机类别划分.首先,利用爬虫技术获取特定时间段的相关侨情事件新闻,进而采用信息抽取模型对语料数据进行信息要素抽取;然后,根据要素集的取值判断每条新闻的危机事件类型;最后,对2020年1月-8月的侨情新闻数据进行实证研究.结果表明:该方法不但能提升侨情分析的效率,还能进行多维度的危机状况信息可视化,有助于制定危机事件应对策略.  相似文献   

12.
Keyword extraction is an important research topic of information retrieval. This paper gave the specification of keywords in Chinese news documents based on analyzing linguistic characteristics of news documents and then proposed a new keyword extraction method based on tf/idf with multi-strategies. The approach selected candidate keywords of uni-, hi- and tri-grams, and then defines the features according to their morphological characters and context information. Moreover, the paper proposed several strategies to amend the incomplete words gotten from the word segmentation and found unknown potential keywords in news documents. Experimental results show that our proposed method can significantly outperform the baseline method. We also applied it to retrospective event detection. Experimental results show that the accuracy and efficiency of news retrospective event detection can be significantly improved.  相似文献   

13.
1995年中国新闻界开始将新闻搬上互联网,由此,网络新闻受到了大众的关注。网络新闻传播在很大程度上要依靠标题的不断导引和提示,因此网络新闻标题在网络传播中的作用极为突出。与此同时,网络新闻标题也出现了诸多不好的现象,如“标题党”现象突出。本文主要通过对网络新闻标题的分析,探讨出现“标题党”现象的原因及其相应的解决办法。  相似文献   

14.
Since the emergence of newspaper,the headline has been the necessity of a news report.The Newspaper headline which takes the crucial part in a news report has been given the responsibility to capture readers,especially in the environment of highly intense competition of this industry.Even with the application of high technology in the news industry,the significance of the headline is enormously strengthened rather than weakened.On the one hand,the mission of the headline determines its significance.And on the other,its characteristics help to achieve the responsibility.Therefore the particular language adopted in the headline,namely "headlinese",must contain certain features which could appeal readers' attention.This paper will focus on the characteristics of the English newspaper headline and find out how it captures readers.  相似文献   

15.
新闻标题常被称做“新闻报道的眼睛”,要求简洁、准确、生动、别致。网络英语体育新闻标题在时态、句子结构、词汇、修辞等方面都具有自己的特色。  相似文献   

16.
形象类辞格在新闻标题制作中的应用   总被引:2,自引:0,他引:2  
在广播电视越来越视听化、网络媒体越来越广泛化的形式下,报纸要更好地改善自己的生存环境,就必须在标题制作上狠下功夫。如果说标题是文章的眼睛,那么,这双眼睛是否明亮,是否“勾人”是决定新闻阅读率的一个决定性方面。如能在形象类辞格的应用上做足文章,那么,将标题的魅力充分展现出来,使标题真正成为“画龙点睛”的神来之笔并不是件难事。形象类辞格在新闻标题制作中的应用,既可以更充分地体现新闻的新闻价值,又可以更好的展现新闻的美学价值,但应用时要求作者有广阔的思维素质,要忠于事实,忠于新闻价值,同时特别注意辨析比喻与比拟、借喻和借代、移就和拟人等几对邻近的形象类辞格。  相似文献   

17.
新闻策划是近些年来新闻界的热门话题。文章认为 ,新闻策划的意义在于 :能加强报道的计划性 ;能提高报道的质量 ,加大报道的力度 ;能充分利用新闻资源增加独家新闻 ;能加强传者、受者与事件三者的纽结力。新闻报道策划可以从多层次入手 ,如战役性策划、议题性策划、主题性策划和介入性策划等等。  相似文献   

18.
基于核心依存图(kernel dependency graph,KDG)的事件抽取主要通过语义结构进行匹配。在已构建的越-英-汉南海新闻框架网络基础上,主要对KDG语义分析模式、基于核心依存图的新闻事件抽取分析以及核心依存图生成和新闻事件信息抽取进行研究。研究重点包括典型KDG、零形式框架元素和框架元素融合等特殊KDG的分析模式,面向事件信息抽取的KDG的表示模式和标注例句自动生成KDG的过程。研究结果表明,基于KDG的事件信息抽取方法直观明了、语言学理据充分,具有一定的可行性,对新闻文本中的语义线索发现较为适合。目前已经可以从已完成框架语义标注的例句中自动生成KDG并抽取出相应的事件模型。  相似文献   

19.
知网的话题更新与跟踪算法研究   总被引:1,自引:0,他引:1  
话题跟踪是一项面向新闻报道信息流进行已知话题跟踪的信息处理技术,本文在现有的向量空间描述文档的基础上,实现了一个基于话题更新的话题跟踪算法,提出了基于知网的近义动词分析的跟踪算法及基于知网的近义动词分析和话题更新的话题跟踪算法.实验表明话题更新和同义词近义词的消除提高了话题跟踪算法的性能.  相似文献   

20.
为了解决对新闻文档人工分类繁琐的问题,本文采用文本挖掘方法对新闻专题进行组织和生成,对新闻事件进行探测与跟踪,然后进行相关新闻专题的归纳。本文还特别对生成的新闻事件如何进行组织和管理,以及得到专题事件的来龙去脉,做了较为详尽的描述,同时对新闻事件的检索方法做出 一些探索性的工作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号