首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
2.
利用微博数据检测突发事件具有重要意义.针对以往检测方法特征不够丰富、准确率不高等问题,提出了一种基于多种特征融合的微博突发事件检测方法.该方法根据情感符号构建情感特征模型,对微博数据进行情感分类,并采用Kleinberg算法对情感特征进行突发期检测;在突发期内根据词频特征、词频增长特征和话题标签特征融合加权提取突发词,...  相似文献   

3.
提出了一种基于特征项扩展的中文文本分类方法.该方法首先对文档的特征词进行分析,然后利用HowNet抽取最能代表主题的特征义原,接着根据这些义原对特征项进行扩展,并赋予扩展的特征项适当权值来说明其描述能力.最后利用扩展的特征项集提取特征进行分类.该文重点研究了如何抽取特征义原,如何给扩展项设定一个合适的权值.实验证明,该文方法能增加有效的特征项的数目,使分类正确率和稳定性均得到提高.  相似文献   

4.
分析了微博短文本的专有特征,介绍了微博短文本的预处理流程.以新浪微博为网络舆情数据获取平台,简述了微博文本分类处理实现过程,基于Hadoop进行了网络舆情微博分类设计,为网络舆情监控任务的完成做数据依据.  相似文献   

5.
基于文本语义和表情倾向的微博情感分析方法   总被引:1,自引:0,他引:1  
针对基于机器学习的中文微博情感分析方法存在处理过程复杂、判断准确率低等问题,该文提出了一种新的情感分析方法。将微博爬虫和Web应用程序编程接口(API)相结合,对动态微博数据进行收集和预处理。基于NTUSD和How Net中文情感词典的微博情感词的抽取和分类,计算词语语义相似度和倾向性。综合考虑表情、文本情感倾向的加权和正面情感增强等因素。实验结果表明:表情情感倾向对微博情感倾向起着重要作用;在表情和文本情感倾向比值固定的情况下,调整因素和中性区间的选择会对情感倾向判断准确率产生影响;通过与基于How Net语义相似度的计算模型比较,该文方法使得情感倾向判断准确率提高约5%。  相似文献   

6.
针对微博短文本提出一种将微博主题与微博情感进行协同分析的方法,利用云南省主流微博媒体数据,研究重大突发公共卫生事件情境下的民众情感极性特征,有助于舆情监测和舆论引导。利用高频词分析研究时间窗口内微博热点主题词,然后训练基于SnowNLP的情感分类模型预测微博情感极性,综合微博信息影响力强度利用隐含狄利克雷分布(LDA)主题模型建模,结合每日疫情实时通报,分析微博情感随时间序列变化趋势。研究发现新冠肺炎疫情爆发以来,多数微博呈现极端正面情感,且微博情感分类结果具有一定的时间聚集性,舆情情感会随公众聚焦事件出现反转,须加以有效引导。  相似文献   

7.
文本特征选择是自然语言处理中的关键问题。针对文本特征的高维性和稀疏性问题,在过滤式特征选择算法文档-逆文档评率(term frequency-inverse document frequency, TF-IDF)的基础上,提出了用遗传算法对文本特征进行优化选择,使其最大程度地贴合后续的文本分类算法,在保证文本分类精确度的同时,降低特征维度以缩减预测时间。实验显示,该算法与单一的过滤式文本特征选择算法相比,能够有效减少所选文本特征数量(即降低特征维度),能有效提高文本的分类能力。  相似文献   

8.
面向微博短文本的细粒度情感特征抽取方法   总被引:1,自引:0,他引:1  
结合TF-IDF方法与方差统计方法, 提出一种实现多分类特征抽取的计算方法。采用先极性判断, 后细粒度情感判断的处理方法, 构建细粒度情感分析与判断流程, 并将其应用于微博短文本的细粒度情感判断。通过NLP&CC2013评测所提供的训练语料对该方法有效性进行验证, 结果表明该方法具有较好的抽取效果。  相似文献   

9.
基于微博文本数据分析的社会群体情感可视计算方法研究   总被引:1,自引:0,他引:1  
针对已有的情感分析研究多侧重在情感的倾向性方面, 缺乏对各类情感的详细描述, 不能形象直观地反映社会群体的情感变化的问题, 提出一种基于依存句法和人工标注相结合的情感分析方法。该方法采用三维立体的人脸表情进行情感分析, 形象地呈现社会群体的情感变化。对于不同的社会事件, 以可视化方式来展现不同地区微博群体的情感。实验结果表明, 该模型可以有效地描述人群情感, 研究结果为基于大数据的网络舆情分析提供了一种新思路。  相似文献   

10.
研究了中文网页体裁分类的特征项选取问题及权重计算方法,探讨不同特征空间对体裁类别的判别能力问题,给出了一种评价方法。据此,提出一种特征项的权值调整策略,实验结果验证了该方法的有效性。  相似文献   

11.
中文文本挖掘的特征导航机制   总被引:9,自引:0,他引:9  
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系·鉴于中文文本的特点,提出了基于因子分析的文本特征抽取机制·通过识别文本中潜在的概念结构来抽取特征项,而且有助于改善向量空间模型中各个分量间的斜交现象·同时给出了基于概念的信息导航机制,按概念层次和上下文环境展现用户所关心的内容  相似文献   

12.
体裁分析模式是语篇分析发展的较高阶段。它可帮助人们理解和认识语篇建构的内在规律,深入透彻地领悟作者的写作意图,挖掘和揭示语篇的交际目的及其社会功能,有助于语言交际,同时对外语教学也有直接的指导意义。  相似文献   

13.
体裁分析模式是语篇分析发展的较高阶段。它可帮助人们理解和认识语篇建构的内在规律,深入透彻地领悟作者的写作意图,挖掘和揭示语篇的交际目的及其社会功能,有助于语言交际,同时对外语教学也有直接的指导意义。  相似文献   

14.
类型研究在文学、电影等领域有广泛的影响,但在电视领域它兴起较晚。类型研究是建立在文化产品生产者和接受者共有的文化习俗的基础上,尝试着在广泛的文本和意义之间建构起某种秩序的文化实践,它将独立的文本划分到不同的类别之中,而每一个特定的类别,都有其独特的程式、特点和形式。类型理论以程式和创新为核心概念,并且可以分为审美、仪式、意识形态三个层面。  相似文献   

15.
文本分类中特征选择方法的比较和改进   总被引:1,自引:1,他引:1  
考察了文档频率DF、互信息MI、CHI统计、CC统计四种不同的特征选择方法,并结合K近邻算法进行分类精度上的比较.为消除MI对低频词的倚重,提出一种DF与MI结合的特征评价函数,并验证了这种组合特征选择方法的有效性.  相似文献   

16.
本文以由英语母语国家主办的高质量英语学术刊物上的英语学术论文的摘要为语料,审视了真实语料中的英文摘要的内容特点和语域特征,然后运用体裁分析手段深究摘要的这些特点存在的原因,并进一步归纳出英文摘要写作的语步,表示成图示。最后就如何写好英文摘要提出了确实可行的指导性步骤。本文也为如何应用体裁分析指导写作教学做了模范。然而,本研究的语料库较小,可能会导致研究结果的偏颇,某些研究结果在今后的研究中还需做进一步的验证。  相似文献   

17.
在信息检索或资源推荐系统当中,用户查询和返回结果之间的匹配程度反映了用户满意程度.体裁可以作为除内容以外的另一种方式来提高用户检索体验.本文给出信息空间中体裁的基本概念,使用向量来定义体裁,并在此基础上给出体裁互文性的内在定义,用距离度量体裁互文性.此外根据语篇在信息处理过程中的共现概率,建立体裁互文性的外在定义,研究体裁互文性两种定义下的度量,证明体裁互文性两种定义的统一和量化计算的一致.  相似文献   

18.
文本挖掘研究进展   总被引:12,自引:0,他引:12  
数据挖掘是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要.由于存储信息最多的自然形式就是文本,因此文本挖掘具有重要的意义.结合笔者研究工作,主要介绍了文本挖掘的研究内容,挖掘过程,挖掘算法及应用前景.  相似文献   

19.
法律英语作为一门交叉学科既有英语语言的基本特征又有法律学科的独特特点。从法律英语用词的庄严性和保守性、用词的重复特点、外来词的借用、普通词的术语化、法律术语的对义性、正式语体和书面语体的使用、被动语态的使用等方面探讨和分析了法律英语文本的语言和语体特征,以期为从事法律、翻译和教学工作的学习者和研究者提供参考。  相似文献   

20.
探讨了体裁的概念和体裁分析的特点,并运用体裁分析的方法对30封中文求职信进行具体的分析,总结了该体裁的宏观结构以及它在功能、释义、语言三个层面上的一些特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号