首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 672 毫秒
1.
观点检索是自然语言处理领域中的一个热点研究课题。现有的观点检索模型在检索过程中往往无法根据上下文将词汇进行知识、概念层面的抽象,这种稀疏空间下的检索方式影响了观点检索模型的性能。文章提出一种基于文本概念化的观点检索方法,通过知识图谱计算概念空间下不同文本之间的相似度以改善特征空间的稀疏问题。这一方法首先利用知识图谱分别将用户查询和文本概念化到概念空间,同时在概念空间计算查询与文本的主题相似度,接着基于词典计算文档的观点得分,最后将相关度得分与文本的观点得分二次组合成相关观点得分并用于观点检索。实验表明,在两个数据集上,本文方法相比基准工作在MAP评价指标上分别提升了4.2%和12.6%。  相似文献   

2.
首先, 基于点互信息与信息检索(PMI IR)算法, 提出一种Laplace平滑情感判定(LS-SO)算法, 对情感词典与表情符号情感词典进行自动扩充, 得到了具有一定规模、 高质量的情感词典, 包括基础情感词典、 目标情感词典、 网络用语情感词典、 表情符号情感词典、 否定词词典、 疑问词词典、 程度副词词典和连词词典. 其次, 通过细化文本语义分析规则计算文本情感值. 实验结果验证了该方法的有效性.  相似文献   

3.
从海量微博数据中分析公众对某一社会事件的情感倾向具有重要研究意义,而海量微博文本稀疏规模庞大,导致传统方法处理这一任务时面临诸多挑战.提出一种基于主题聚类的海量微博情感分析方法.首先基于高质量微博数据挖掘频繁项集,设定语义相关阈值,筛选重要频繁项集进行谱聚类,得到主题关键词.基于主题关键词对海量微博数据依据语义相关度归类,最后结合情感词典对每类中的微博检索主题关键词前后修饰距离内情感词及否定词,结合表情符号计算微博情感值.在百万规模中文微博上进行实验,证明该方法能准确按主题归类且能有效在该主题上进行情感分类.  相似文献   

4.
TREC2004 Robust任务有一项新要求,就是要把检索主题按照从易到难的顺序排列.针对新的要求,提出了基于单词歧义性大小的检索主题难易度模型.根据WordNet和它附带的Brown语料库构造了单词义项分布词典,再把检索主题中的单词按歧义性大小分为7类,通过计算平均单词容易度来度量检索主题的难度.实验结果表明,该模型有一定的预测能力.最后用此模型预测了TREC2004 Robust任务的250个检索主题的难易度.  相似文献   

5.
目前的神经网络一般只将词粒度层面的词向量作为输入,忽略了语义层面的全局语义特征.针对此问题,提出了一种基于局部特征和全局特征融合的情感分类方法,以解决评论特征稀疏和主题聚焦性差的问题.对于局部特征,选择基于情感词典和BiLSTM神经网络模型提取基于词向量的文本特征.对于文本集的全局主题特征,采用神经主题模型提取文本主题特征,并将其作为全局特征来表示短文本信息.最终将基于局部加权词向量的文本特征和基于神经主题模型的文本主题特征进行拼接,并通过Softmax层输出,完成文本情感分类.结果表明:融合全局主题语义和局部加权词向量可以更加丰富神经网络的特征,从而有效地提高情感分类的准确率.  相似文献   

6.
通过分析微博的结构特点,提出了一种基于语义分析的中文微博情感分类方法。首先构建了表情符号情感词典和网络用语情感词典;然后结合词典资源对微博文本进行依存句法分析并且构建情感表达式树;最后根据制定的规则计算微博文本的情感强度,依据强度值判断微博的情感倾向类别。实验结果验证了该方法的有效性,也表明所构建的表情符号情感词典和网络用语情感词典能够有效增强情感分类器的性能。  相似文献   

7.
学生的情感教育一直是教育界的研究热点和难点,由于学生个人情感的隐秘性,教师很难获取学生的情感状况.研究通过学生大量使用的社会交互网站中的文本信息分析学生的情感状态,核心是针对学生常用情感词构建情感词典,根据学生大量使用新词、伪词的特点,结合新浪微博提供的情感符号,以现有情感词典为基础,在动态更新的新浪微博大数据中应用文本相似度计算方法,扩充情感词典,构建符合学生语言特点和新浪微博风格的学生情感词典.词典包括情感极性和强度,为基于学生微博文本的情感感知和进一步的情感教育奠定基础.  相似文献   

8.
赵源 《科技信息》2010,(35):58-58,49
本文在中文分词技术的基础上,提出了一种基于中文文本主题提取的分词方法,以概念语义网络的思想构造主题词典,描述词间概念语义关系,采用改进的最大匹配算法对文本进行切词,既提高了分词的准确性,又能识别文中的未登录词,并同步完成主题词的规范工作。从而在概念层次上理解用户的需求,实现概念检索,提高查准率。  相似文献   

9.
对微博文本的多元情感分类问题进行了研究.针对现有的多元情感词典不能很好地覆盖微博文本中情感词的不足,结合特定的情感符号和基于卡方统计量的度量方法,实现对现有的多元情感词典的扩充;针对情感词典无法有效考察文本的上下文语境信息的问题,引入word2vec模型实现情感词和其所在微博语句的向量化表达.在此基础上,利用KNN分类器实现微博句子级的多元情感分类.实验结果表明,扩充情感词典及引入word2vec模型均有助于提升微博文本多元情感分类的效果.  相似文献   

10.
提出一种结合LDA及语义相似度的商品评论情感分类方法。该方法首先使用LDA对商品语料库建模,获取文档-主题矩阵;人工选择k对褒义词、贬义词,基于HowNet语义相似度计算主题(评价对象+观点内容)与各个褒义词和贬义词的相似度,达到对观点词极性判断,计算文本观点词情感极性的加权和作为文本的情感极性。实验表明,与基于向量空间的SVM分类方法相比,该情感分类方法在分类指标上表现更好。  相似文献   

11.
小波与信号     
小波分析被认为是Fourier分析的重大突破,它已成为当今从应用数学到信号处理等众多领域的研究热点。本文介绍了小波分析产生的背景和基本知识,论述了小波分年与信号分析之间的密切联系。  相似文献   

12.
使用因子分析的方法对山西的工业行业结构进行了分析,其中,利用R-型因子分析将6个变量综合成了3个因子(即总量因子、经济效益因子、销售因子),利用Q-型因子分析对山西省的36个工业行业进行了分类分析。  相似文献   

13.
对2002年以来顺序注射分析在环境分析和生物分析方面的应用进行了较为详细的综述.展望了顺序注射分析的未来.  相似文献   

14.
本文对环太平洋地区53个与斑岩钼、铜矿床有成因联系的侵入岩体的控矿专属性进行了研究。对矿化类型与岩石化学组分之间的关系进行了统计分析和对比,从而阐明了矿化类型与岩浆演化之间的关系。作者在传统的岩石化学研究方法基础上,进一步应用R型聚类分析和因子分析等多元统计方法提取有用信息。并从应用角度,运用模糊集合论中隶属函数的概念,研究已知控矿岩体矿化类型的划分,建立评价矿化岩体矿化类型的数学模型。  相似文献   

15.
本文在近年高考数学试题分析与其中一年的试卷抽样分析的基础上,剖析了天津市中学数学教学的某些薄弱环节,提出一些改革的建议。  相似文献   

16.
评述了电位溶出分析和计时电位溶出分析以及在其基础上发展产生的新方法的主要特征及其应用。  相似文献   

17.
采用主成分分析、聚类分析和因子分析方法,对山西省工业中34个产业2003年的数据进行分析,得出了反映各产业经济效益、产业规模情况的各项综合经济指标,并对各个产业进行排序,得到山西省的工业中各个产业发展情况和各产业发展层次的分布情况,为制定山西省整体的经济发展战略提供一定理论依据。  相似文献   

18.
本文用主分量分析(PCA)、相互平均法(RA)及去趋势对应分析(DCA)方法对取自广西不同地区的30个常绿阔叶林的样地资料进行排序分析,并将结果与聚类分析的结果相比较。另外还对这三种排序方法进行了讨论。  相似文献   

19.
重庆地区7种生物质的成分分析及热重实验   总被引:5,自引:0,他引:5       下载免费PDF全文
对重庆地区的玉米秆、玉米芯、高梁秆、稻秸、麦秸、黄桷树、竹子等7种生物质进行了工业成分分析与干基化学组成分析,并用热重分析仪对7种生物质的热解特性进行了热重实验.通过对热失重曲线分析,研究了生物质种类、加热速率、样品粒径、压力对生物质热解特性的影响,得到了最大热解速率对应温度及反应活化能、频率因子等热解反应动力学参数,  相似文献   

20.
符号是数学思维的载体,符号化思想是重要的数学思想方法.研究微积分教学中的符号化思想,揭示其内在规律性,是微积分教学研究的需要,也有方法论意义.研究发现,要剖析微积分教学中的符号化思想,应该从其语义、结构和辩证法等三个方面展开.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号