首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
探讨了中文网页倾向性分类的原理和实现方法,利用文本自动分类技术结合Web页面中的结构信息,提出了LSI-KNN-Naive Bayes的褒贬分类模型.并在部分网页数据集上,对上述理论进行了实验验证,取得了较好的成效.  相似文献   

2.
对于分段函数的卷积用解析法计算时往往不容易确定分界点。本文给出两种基于图解过程的计算方法,可以比较容易的确定出分界点和积分限。  相似文献   

3.
失业是市场经济发展的必然产物,在许多国家。失业率居高不下已引发出许多政治、经济、社会等问题,所以研究失业率、建立失业警戒线已成为世界各国政府普遍关注的问题。阐明了失业警戒线的确定应包括两个方面。即警戒线本身的确定和警戒区间分界点的确定。在当前,宜采取定性方法采确定失业警戒线。而通过建立教学模型进行模拟的方法将是未来研究的方向。  相似文献   

4.
基于文本数据挖掘的硕士论文分类技术   总被引:1,自引:0,他引:1  
针对硕士论文的摘要和关键词等数据进行数据挖掘,实现硕士论文自动分类。为此收集了2 000余个相关数据,在对所研究的数据对象特点进行分析的基础上,确定了分类算法,详细分析了支持向量机分类方法;对收集的研究数据进行了仿真实验,并与其他常用分类器进行比较。实验表明,基于支持向量机的分类方法比其他常用分类器具有较高的准确率。对实验结果中得到的知识进行了分析,得出一系列可供科学研究者和管理者参考的结论。  相似文献   

5.
量程和温度特性是传感器的两个主要指标,SAW压力传感器的量程由基片材料的结构尺寸决定,温度效应一般采用双端对谐振器来消除,目前关于两个谐振器的位置确定还没有一个确定的方法。通过力学分析得出了圆形石英膜片的半径、厚度、和最大载荷的关系;对石英圆形膜片的应力应变关系进行了有限元数值计算,得出了正负应力在圆形石英膜片的分界点,为设计SAW谐振式压力传感器的物理结构和合理的安排谐振器的位置提供了依据。  相似文献   

6.
设计了一种新的指纹二步分类方案,该方案先用基于MKL方法的分类器为待分类指纹确定两个最具可能性的类,再利用经过训练的SPD分类器对第一步的结果进行二分类.用本文的分类方法对标准指纹分类库NISTDB4上的2000枚指纹进行实验得出五分类正确率为95.5%,四分类正确率为96.9%,分类结果优于目前参考的各种分类技术.  相似文献   

7.
实际应用中的大量数据具有不确定属性,而传统的挖掘算法无法直接应用在不确定数据集上.针对不确定数据的分类问题,提出一种基于抽样方法的不确定极限学习机.该算法通过抽样的方法,对不确定数据集中样本的抽样实例进行学习和分类,得到该不确定样本的所属类别的概率,从而实现了传统极限学习机分类算法对不确定数据的分类,并极大降低了不确定对象实例的枚举代价.实验结果表明,该算法在不确定数据的分类问题中具有较好的有效性和高效性.  相似文献   

8.
提出了超长方体与KNN相结合的分类算法.在训练阶段,该算法为训练集中的每一个类别构造多个超长方体,区域分离每一类训练样本.在测试阶段,该算法首先检查测试样本是否被某一个超长方体包围,如是则其类别被识别出,否则用KNN方法确定其类别.实验采用四个真实数据集进行测试.实验结果表明基于超长方体与KNN的分类算法在四个数据集全部优于两个基于多球覆盖的分类方法,是一种有效的分类方法.  相似文献   

9.
基于朴素贝叶斯分类框架,通过添加尾项值对部分严重扭曲的分类结果进行调整,达到提升分类器性能的目的.方法通过增量式自适应学习分类模式,根据历史结果,判断分类器分类质量,进而确定尾项添加区间,对明显产生分类扭曲的区间结果自适应添加尾项补偿,调整分类结果.在Trec05,Trec06,Trec07,Ceas08数据集上的对比实验表明,改进算法在accuracy,Macro F1两个指标上均比朴素贝叶斯分类器和bagging朴素贝叶斯分类器显著提高,且方法简单易行.  相似文献   

10.
提出一种基于隐马尔可夫模型和支持向量机混合模型的音频分类方法,用于语音、音乐、语音+音乐、静音4类音频分类。首先利用4个HMM分类器对音频进行初步分类,确定最可能的两种音频分类结果,再用相应的SVM分类器做最终判决。实验结果表明,隐马尔可夫模型和支持向量机的两级分类器分类性能较好。  相似文献   

11.
传统的情感分析方法不能获取全局特征,以及否定词、转折词和程度副词的出现影响句子极性判断.在深度学习方法基础上提出了基于卷积神经网络和双向门控循环单元网络注意力机制的短文本情感分析方法.将情感积分引入卷积神经网络,利用情感词自身信息,通过双向门控循环网络模型获取全局特征,对影响句子极性的否定词、转折词和程度副词引入注意力机制实现对这类词的重点关注,提取影响句子极性的重要信息.实验结果表明,该模型与现有相关模型相比,有效提高情感分类的准确率.  相似文献   

12.
为了更好地挖掘投资者情绪,解决在股市文本情绪分析过程中,现有情感词典构建方法自动化程度低、行业特异性不足和精确度不足等问题。在构建基本情感词典的基础上,Word2vec对自动添加的高频情感词语进行极性判断与赋值,并将情感词典构建改为优化问题,采用改进模拟退火算法对情感词典的词语分值进行优化,提高股市情感词典性能。实验结果表明:该方法所构建的股市情感词典可以有效识别股市文本情绪,提升文本覆盖率,具有更强的行业特异性,提升情绪分析准确性,可更好用于投资者情绪相关研究。  相似文献   

13.
提出量化情感的概念(评论中的情感值),从用户评论的自然语言文本中得到用户表达的情感值。为了计算评论的量化情感,对评论中的情感词的依存关系进行了研究。给出了情感句的量化情感算法。对量化情感与垃圾评论的关系进行分析,通过直观观察,确定了一系列判别方法。最后本文以量化情感值为指标,建立时间序列对网店的评论选行分析,有效地检测了垃圾评论。实验结果证明在检测网店垃圾评论工作中,所提出的方法有良好的检测结果,优于已有的方法.  相似文献   

14.
基于投资者情绪的认知风险和认知收益   总被引:1,自引:0,他引:1  
将投资者的情绪纳入到证券投资的风险度量,提出了两种基于行为金融的认知风险度量方法,并建立了基于投资者情绪的认知收益模型,研究了认知风险和认知收益之间的关系。研究结果表明:投资者的认知风险和认知收益都与投资者的情绪有关并且两者呈现负相关关系,与标准金融理论中风险和收益的正相关关系相反。  相似文献   

15.
虚假评论识别在电子商务、社交媒体等领域具有重要的应用价值。尽管现有虚假评论识别模型融合了文本的情感信息,但在预训练过程中忽视了对情感信息的提取,导致准确率不高。针对此问题,本文提出一种基于情感信息预处理和双向门控循环单元(Bidirectional Gated Recurrent Unit, Bi-GRU)的虚假评论识别模型(FR-SG),用于提高虚假评论识别的准确率。首先,通过Albert模型获取文本的语义向量;然后,使用词频-逆文本频率(Term Frequency-Inverse Document Frequency, TF-IDF)和K-均值(K-means++)聚类的方法从评论中挖掘情感种子词,基于种子词对文本中的属性词和情感词进行掩码(mask);接着,使用面向情感的目标优化函数,将情感信息嵌入到语义表示中,生成情感向量;最后,将这两组向量的拼接结果输入虚假评论识别网络中,得到文本的分类结果。实验结果表明,相较于Bi-GRU+Attention模型,FR-SG提高了虚假评论识别的准确率。  相似文献   

16.
基于主题情感混合模型的无监督文本情感分析   总被引:4,自引:0,他引:4  
针对有监督、半监督的文本情感分析存在标注样本不容易获取的问题, 通过在LDA模型中融入情感模型, 提出一种无监督的主题情感混合模型(UTSU模型)。UTSU模型对每个句子采样情感标签, 对每个词采样主题标签, 无须对样本进行标注, 就可以得到各个主题的主题情感词, 从而对文档集进行情感分类。情感分类实验对比表明, UTSU模型的分类性能比有监督情感分类方法稍差, 但在无监督的情感分类方法中效果最好, 情感分类综合指标比ASUM模型提高了约2%, 比JST模型提高了约16%。  相似文献   

17.
文本情感分类领域性强,传统情感分类方法在多领域混合数据上效果不佳.为了提升多领域混合情境下文本情感分类的准确率,使用双向编码器表征模型(bidirectional encoder representations from transformers,BERT)得到短文本的初级表征;利用对抗网络提取与领域无关的情感特征;利...  相似文献   

18.
方面级情感分析 (aspect-based sentiment analysis, ABSA) 旨在预测给定文本中特定目标的情感极性. 研究表明, 利用注意力机制对目标及其上下文进行建模, 可以获得更有效的情感分类特征表达. 然而, 目前常用的方法是通过对特定目标使用平均向量来计算该目标上下文的注意权值, 这类方法无法突出文本中个别单词对于整个句子的重要性. 因此, 提出了一种基于内联关系的方面级情感分析方法, 该方法可以对目标和上下文进行建模, 将关注点放在目标的关键词上, 以学习更有效的上下文表示. 首先使用门控循环单元 (gated recurrent unit, GRU) 对方面信息和句中单词进行融合分布式表达; 然后将分布式表达输入到结合注意力机制的长短时记忆网络 (long short-term memory network, LSTM), 通过查询机制来增加内联关系的权重, 最终得到方面级情感分类. 该模型在公开数据集上进行的实验结果表明, 该方法是有效的, 精确度均超过基线模型.  相似文献   

19.
基于新的投资者情绪变量,对中国股市相对强势策略的收益进行深入考察。通过构建的两个投资者情绪测度,可以使得在构建投资组合时,利用投资者情绪信息,进一步把常见的投资组合(赢家输家组合)分解为高情绪和低情绪组合。研究发现,投资者情绪可以更好预测未来的资产收益,随着这种信息的引入,投资组合的赢利性得到进一步的显著提高。论文扩展了国内基于相对强势策略收益的研究。  相似文献   

20.
对于多类别的细粒度情感分类任务,目前主流的少样本学习方法不能取得较好的性能。针对这一问题,提出一种基于联合学习的少样本多类别情感分类方法。采用基于替换词检测任务的少样本学习方式,将回归和分类的替换词检测模板以及标签描述词同时添加至输入语句,从而将细粒度情感分类任务同时建模为分类问题和回归问题。在此基础上,设计了不同的融合方法进行联合学习。实验结果表明,与主流少样本学习方法相比,该方法在F1-Score和正确率上都取得更优的结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号