首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
基于领域知网的中文智能答疑系统   总被引:1,自引:0,他引:1  
为了提高中文智能答疑系统的准确率,文章在中文答疑系统中引入领域知网,实现了领域 关键词的语义理解和词句语义相似度计算。对中文智能答疑系统中领域义原的提取、领域义原树和领域 标注库的建立、词句语义相似度进行了研究。最后建立了一个原型系统,取得较好的实验结果。  相似文献   

2.
针对现有的中文文本情感分析方法不能从句法结构、上下文信息和局部语义特征等方面综合考量文本语义信息的问题,提出一种基于特征融合的中文文本情感分析方法.首先,采用Jieba分词工具对评论文本进行分词和词性标注,并采用词向量训练工具GloVe获取融入词性的预训练词向量;然后,将词向量分别作为引入Self-Attention的BiGRU和TextCNN的输入,使用引入Self-Attention的BiGRU从文本的句法结构和文本的上下文信息两个方面综合提取全局特征,使用TextCNN提取文本的局部语义特征;最后,将全局特征和局部语义特征进行融合,并使用Softmax进行文本情感分类.实验结果表明,本文方法可以有效提高文本情感分析的准确率.  相似文献   

3.
基于知网的语义相关度计算   总被引:24,自引:0,他引:24  
为解决句法分析中的结构性歧义,引入了语义相关度计算.基于语义相似度计算及知网的语义信息,提出了语义相关度计算方法;利用知网的义原纵向与横向关系及实例信息计算不同词性的相关度.在计算义原距离时,考虑了义原之间的解释关系,对义原的距离进行修正.根据相似度的对称性,计算实例的影响因素提高了相关度的准确率.实验结果表明,使用该计算方法得出的语义相关度结果更加合理.  相似文献   

4.
针对传统场景分类方法不能准确地表达高分辨率遥感影像丰富的语义信息问题,提出了一种基于卷积神经网络的高分辨率影像场景分类方法.此方法大致分为3步:第1步,依据不同卷积窗口做卷积运算提取颜色,纹理和形状等低阶特征;第2步,利用池化层将这些低阶特征进行过滤,得到重要特征;第3步,重组提取出来的特征以形成高阶语义特征进行场景分类.在具体实验中利用三个不同尺寸的卷积核对数据集进行分类探究,并且使用了数据增广、正则化和Dropout等手段,提升模型对新样本的适应能力,很好地解决了过拟合问题.该方法在所进行的实验中表现良好,在WHU-RS19数据集上取得了88.47%的准确率,和传统的场景分类方法相比,显著提升了分类精度.  相似文献   

5.
为了使个性化虚拟人更加形象生动,能根据用户输入的文本做出表情动作,运用自然语言处理技术对中文和英文文本进行语义和分类处理,分析出动作和情感信息。采用潜在语义方法从文本中提取出动作语义信息,利用hownet计算词汇相似度,使用K最近邻方法将文本情感信息分为6类:愤怒、厌恶、恐惧、喜悦、悲伤和惊讶。实验结果为:语料文本分类准确率为87.5%,系统能从用户输入的文本中提取出情感、动作信息,使虚拟人做出相应表情变化。  相似文献   

6.
从图像中提取多种特征向量堆叠为一个高维特征向量用于图像语义分割,会导致部分特征向量的分类能力减弱或丢失。针对此问题,提出了一种结合深度卷积神经网络AlexNet和条件随机场的图像语义分割方法。利用预训练好的AlexNet模型提取图像特征,再通过条件随机场对多特征及上下文信息的有效利用来实现图像的语义分割。与利用传统经典特征的方法进行对比,实验结果表明:在利用AlexNet模型提取特征进行图像语义分割时,Conv5层为最有效的特征提取层,在Stanford background和Weizmann horse数据集下的识别准确率分别为81.0%和91.7%,均高于其他2种对比方法,说明AlexNet可以提取更有效的特征,得到更高的语义分割精度。  相似文献   

7.
为弥补特征提取中的语义缺陷,提出了一种利用领域知识规则填补特征与高级语义之间鸿沟的思想,从体育视频中对语义对象进行有效的特征提取,并采用支持向量机元分类器和组合策略对体育视频进行分类的方法.实验表明,该分类方法对大部分体育视频都具有很好的分类效果,平均准确率可达92.23%,优于其他提取特征无语义关联的分类方法.  相似文献   

8.
提出将语义理解与统计学方法相结合的机器学习算法来进行文本情感分类。首先提取文本中的情感词汇作为特征,利用统计学方法得到特征的初始权重,然后通过分析文本语义结构修改特征权重,最后利用Bayesian算法和以Bayesian作为基本分类算法的Boosting算法进行分类。实验表明,基于语义理解的Bayesian分类算法的分类准确率高于仅基于统计学的Bayesian分类算法,基于语义理解的Bayesian-Boosting算法的分类准确率最高,达到了90%。  相似文献   

9.
自然语言处理中,文本情绪分类目前以情感极性分类居多,更加细粒度的情绪分类却很少,并且基本上都为英文文本情绪分类。本文针对中文文本情绪分类,设计并实现了一种双通道多核卷积神经网络中文文本情绪分类方法。在特征提取部分,设计了双通道特征提取方法,采用word2vec预先训练词向量的词袋方式并引入注意力机制,提取的特征向量在关注局部特征信息的基础上加入了文本上下文之间的关系信息,能够涵盖文本全局特征;在卷积部分,设计了多种不同卷积核分别卷积池化后再组合的方式,从而得到更加全面的文本特征。理论分析和实验结果表明,双通道多核卷积神经网络中文文本情绪分类方法分类准确率达86%,比单层卷积神经网络的分类准确率提高了4%,同时解决了单层卷积神经网络特征提取不够全面和多层卷积神经网络特征提取过于抽象的问题。  相似文献   

10.
提出一种基于语境相似度的中文分词一致性检验方法。首先利用词法和句法层面的特征, 设计基于构词、词性和依存句法的分类规则, 再使用预训练词向量, 对不一致字串所在语境的语义信息进行编码, 通过语境间的语义相似度对不一致字串进行分类。在人工构建的36万字分词语料库中进行分词一致性检验, 结果表明该方法能够有效地提高中文分词一致性检验的准确率。进一步地, 使用3 种主流中文分词模型在修正一致性后的分词语料中重新训练和测试, 结果表明该方法可以有效地提高分词语料库的质量, 3种中文分词模型的F1值分别提高1.18%, 1.25%和1.04%。  相似文献   

11.
「きる」的语义特征及语义结构模式   总被引:1,自引:0,他引:1  
日语"切断"事件动词「きる」具有多义性。根据日语语言学者提出的词典释义、添加成分等语义特征提取途径,分析并提取出「きる」的四个基本语义特征;通过探讨影山"动作链的语义结构模式",结果显示:动词「きる」不仅蕴含动作义,同时蕴含变化义和结果状态义,结果状态义是其核心语义。  相似文献   

12.
一种基于义原重合度的词语相似度计算   总被引:1,自引:0,他引:1  
通过分析知网中的义原关系,认为在同一棵树中两个相等距离的义原,公共节点对相似度大小起着决定性作用;距离根节点越远,分类越细致,描述的信息越详细;它们的相似度也就越大.提出了一种基于知网的相似度的计算方法,定义了知网义原间的相似度公式.实验表明,利用本文方法计算词语相似度,所得结果在一定程度上更加与人的直观相符.  相似文献   

13.
试论模糊词义的特点与功能   总被引:1,自引:0,他引:1  
模糊词义的研究是近年来汉语研究的一个热点。它有两个突出特点:即明确性与模糊性的统一,不变性与可变性的统一。模糊词义在语言现实中的主要功能是提高了语言表达的效率。  相似文献   

14.
基于蒙太古语义学(MS)和受控自然语言(CNL)的文献信息系统,兼具传统文献检索分类法的"符号化"和主题法的"规范词"的特点,并带有复杂的语法和语义功能;从而可以大大提高文献信息的检索和利用效率,还能自动生成规范的文献摘要,并完成不同语言之间的自动翻译.尝试实现这种文献信息系统的结构,其中包括构建语词的范畴分类和语句的函数表达式,以及自然语言-形式语言、中文-英文之间的映射(翻译)等;最后设计一个应用程序以验证该系统的若干功能.本研究表明:这种全新概念的信息组织和管理系统是可行的.  相似文献   

15.
【目的】为了降低高光谱遥感数据噪声,提高土地利用分类信息提取精度,探索结合纹理和空间信息的分类方法。【方法】以河南镇平县Hyperion高光谱成像光谱仪获取的高光谱影像为数据源,借鉴决策树分类思想,采用了一种结合光谱、纹理和空间信息的高光谱遥感多特征地类提取方法,先通过提取光谱特征初步提取地类,再分别采用提取纹理特征和基于空间信息的植被提取进行详细地类信息的分层提取,最后,用地面实测样点验证各类土地利用类型的分类精度,比较了用不同方法对不同地类的提取效果。【结果】基于多特征的地类分层提取体系中,采用各波段光谱反射率区分大的地类,再用纹理特征进行光谱差异较小的地类划分,而基于空间信息进行植被的分类。通过结合纹理和空间信息提取方法的总分类精度达86.7%,较最大似然法分类精度提高13.3%。【结论】高光谱与纹理和空间信息相结合的遥感分类方法能有效减小噪声,提高分类精度,可为土地利用分类提取研究提供一定的参考。  相似文献   

16.
[摘要]用传统的遥感图像分类法分类时,沙滩极易与建筑用地、未利用地产生混淆,分类精度不高.本研究以2009年的CBERS-02影像为数据源,在提取和分析主要地物光谱特征的基础上,通过图像分类、谱间关系和多重阈值法对厦门环岛路的沙滩信息提取方法进行了探讨,并基于ENVIIDL进行模型设计,较好地将沙滩与易于混淆的建筑用地信息区分开来,沙滩信息提取的总体精度提高到88.72%.  相似文献   

17.
鉴于问题分类是问题分析的主要任务,提出一种结合本体和焦点的问题分类方法.首先依存分析和语义角色标注对问题进行浅层语义分析,再根据预定义的问题焦点结构和焦点抽取规则,获取问题焦点语义表征;然后标示问题的类别为问题焦点中疑问对象在领域本体中的标识;最后,根据焦点不同则问题不同这一事实,将焦点相同的问题归为一类,从而实现问题分类.使用该方法对计算机故障诊断领域1 905个特指问题分类,取得了93.91%的准确率,验证了领域本体和焦点对问题分类方法的有效性.  相似文献   

18.
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和F值分别达到84%,52%和0.64,验证了该方法的有效性.  相似文献   

19.
针对传统端到端模型在输入文本语义较复杂情况下生成的问题普遍存在语义不完整的情形,提出一种基于语义特征提取的文本编码器架构.首先构建双向长短时记忆网络获得基础的上下文信息,然后采用自注意力机制及双向卷积神经网络模型分别提取语义的全局特征和局部特征,最后设计一种层次结构,融合特征及输入自身信息得到最终的文本表示进行问题生成.在数据集SQuAD上的实验结果表明,基于语义特征提取与层次结构进行问题生成效果显著,结果明显优于已有方法,并且语义特征提取和层次结构在任务的各评价指标上均有提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号