首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 515 毫秒
1.
提出了一种基于改进的长短时记忆神经网络(Arc-LSTM)和词嵌入(Word2Vec)模型相结合的自动匹配方法。首先采用连续词袋(continuous bag of words,CBOW)模型提取中文简历文本特征,从而构建词向量,提出一种基于ArcReLU激活函数和LSTM深度神经网络优化的Arc-LSTM网络,利用该网络构建分类模型,实现文本分类。实验证明,提出的模型能有效地提高分类精度和收敛速度,实现中文简历和职位的精准匹配。  相似文献   

2.
一种融合多种语义特征的中文问题分类方法   总被引:1,自引:0,他引:1  
针对中文问题分类方法中提取语义信息不准确和特征向量维数过高导致处理速度过慢的问题,提出了一种融合多种语义特征的问题分类方法。借助HowNet,兼顾问句的句法和语义信息,选取问题疑问词、核心词的主要义原、命名实体、名词单/复数等四种分类特征,并在义原的提取过程中加入词义消岐技术,对事实疑问句进行分类。在某高校信息检索研究室的中文问题集上进行实验,实验结果证明了该方法的有效性,大类准确率92.82%,小类准确率84.45%,取得了较好的效果。  相似文献   

3.
相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW)。该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合。实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型。  相似文献   

4.
中文情感分析是自然语言处理的重要研究内容,旨在探究中文文本中蕴含的情感倾向.近年来,中文情感分析研究取得了长足进步,但鲜有研究根据语言本身特征和下游任务需求进行探讨.鉴于此,针对中文文本的特殊性以及情感分析的实际需求,在字、词特征的基础上,引入部首特征和情感词性特征,利用双向长短期记忆网络、注意力机制、循环卷积神经网络等模型,提出了融合字、词、部首、词性等多粒度语义特征的中文文本情感分析方法.在融合各类特征的基础上,利用softmax函数进行情感预测.数据集NLPECC(natural language processing and Chinese computing)上的对比实验结果表明,所提方法的F1值均达到84.80%,一定程度上提高了已有方法的性能,较好地完成了中文文本情感分析任务.  相似文献   

5.
针对中文的语料,采用基于条件随机场的方法,在词、词性特征的基础上结合最近名词、句法依赖关系和句子倾向性等特征,分析不同特征对于评价对象抽取的影响.实验结果表明,结合了词、句子倾向性、词性、语法依赖关系、邻近名词等特征的条件随机场方法对于中文句子评价对象的抽取更有效.  相似文献   

6.
基于支持向量机的汉语问句分类   总被引:5,自引:0,他引:5  
目前汉语问句分类一般都依据疑问词及其相关词的组合规则,但由于规则的提取很深地依赖于语言知识,而且很难穷举出所有的特征规则,因此会影响分类的效果.支持向量机(SVM)是建立在统计理论基础上的机器学习方法,对于小样本分类问题有很好的识别效果.文中分析和定义了汉语问句的类型,建立了以SVM为基础的问句分类模型,详细描述了问句分类特征的选取过程,并在句法特征的基础上引入语义特征进行汉语问句分类实验,分类准确率达88.7%,表明结合句法和语义特征以SVM进行汉语问句分类具有很好的效果.  相似文献   

7.
用于中文色情文本过滤的近邻法构造算法   总被引:2,自引:0,他引:2  
从不良信息中最为普及的中文色情文本过滤入手,用近邻法(KNN)算法构造对比了4种特征项选择的方法在中文色情文本中的应用,它们分别是字、词、标点符号和词性等特征.试验表明,中文色情文本不同特征项的选择对中文色情文本的分类效果起到了重要的作用.实验同时表明,所设计的过滤器在保证速度的前提下,很好地完成了基于内容的高精度过滤.  相似文献   

8.
按照兵马俑各部位对碎片进行分类是兵马俑文物碎片拼接的重要步骤,能有效缩减自动拼接算法的搜索空间,提高拼接的准确率。由于人工的碎片分类方法工作量大,通过计算机辅助文物碎片自动分类,可以减少人工分类产生的繁重工作量。该文提出了一种基于多特征和支持向量机(SVM)的文物碎片分类方法。首先,利用尺度不变特征变换(SIFT)算法提取碎片纹理特征,在此基础上构建每幅碎片图像的词袋模型(Bo W)。其次,利用Hu不变矩提取碎片形状特征,最后,将纹理特征和形状特征结合并通过SVM进行训练,得到相应的文物碎片分类模型。实验结果表明,该方法显著提高了碎片分类的准确率。  相似文献   

9.
一种基于SVM和规则消除组合型歧义的算法   总被引:2,自引:0,他引:2  
歧义的处理是影响分词系统切分精度的重要因素,也是中文自动分词系统中较为困难的问题.提出一种基于支持向量机(SVM)和规则(Rules)相结合的算法(SR算法),对中文分词过程中的组合型歧义字段进行排歧.SR算法主要思想是利用支持向量机分类的原理,结合词性搭配的一些规则排除组合型歧义.实验表明,用此算法对几种不同的语料进行排歧测试,排除组合型歧义字段的切分正确率可达83%左右,为解决中文自动分词难题提供了一条新路径.  相似文献   

10.
针对中文网页文本分类中特征降维方法和传统信息增益方法的缺陷和不足做出优化改进,旨在有效提高文本分类效率和精度.首先,采取词性过滤和同义词归并处理对特征项进行初次特征降维,然后提出改进的信息增益方法对特征项进行特征加权运算,最后采用支持向量机(SVM)分类算法对中文网页进行文本分类.理论分析和实验结果都表明本方法比传统方法具有更好的性能和分类效果.  相似文献   

11.
鉴于问题分类是问题分析的主要任务,提出一种结合本体和焦点的问题分类方法.首先依存分析和语义角色标注对问题进行浅层语义分析,再根据预定义的问题焦点结构和焦点抽取规则,获取问题焦点语义表征;然后标示问题的类别为问题焦点中疑问对象在领域本体中的标识;最后,根据焦点不同则问题不同这一事实,将焦点相同的问题归为一类,从而实现问题分类.使用该方法对计算机故障诊断领域1 905个特指问题分类,取得了93.91%的准确率,验证了领域本体和焦点对问题分类方法的有效性.  相似文献   

12.
基于特定问题类别的汉语问答系统查询扩展   总被引:1,自引:0,他引:1  
针对汉语问答系统的特点,提出一种通过统计问答对方式获得各种问题类别的关联词,并根据类别关联词进行查询扩展的方法.在计算问题和答案文本相似度时,实现了一种基于最小匹配距离的计算方法,该方法充分考虑了查询词及查询扩展词在文本中的词频及位置分布信息.实验结果说明在汉语问答系统答案文本检索中,按照问题类别关联词进行查询扩展比未进行查询扩展在性能上有很大的改进.  相似文献   

13.
提出一种基于语义核函数的问题分类算法,该算法基于问题的语法结构构建支持向量机(SVM)核函数.首先,将给定的问题解析为语法树结构,用语法树的子树表示该问题;然后,从词法、语法、语义三个层面提取问题的特征,构成更加丰富的特征空间;接着,基于问题的语法树构建核函数;最后,使用潜在语义索引方法并结合问题的词法、语法以及语义特征,通过语义核函数将特征空间映射到更有效的空间中进行问题分类.TREC数据集上的实验结果表明,通过词法、语法以及语义增强的问题特征空间可以提高分类准确率.  相似文献   

14.
疑问句在语音交际中占有重要地位,检出语音交际中的疑问句对把握语义重心和分析话语结构具有重要作用。在分析疑问语气凸显的声学特征的基础上,提出了一种基于声学特征凸显的汉语疑问句检出方法。该方法用支持向量机(SVM)对小时间粒度的疑问语气凸显进行建模,通过基于加窗机制的后处理方法判决语音是否为疑问句。在面向电话客服应用环境录制模仿的和真实的汉语对话语音库上进行了算法测试。实验表明该方法对汉语疑问句具有较好的检出性能。  相似文献   

15.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

16.
针对基于正则表达式和传统机器学习的分类方法分别存在模式手工提取困难和性能瓶颈的问题, 提出一种基于深度学习的问题帖分类方法, 采用深度文本挖掘模型TextCNN和融合注意力机制的TextRNN构建分类模型. 实验结果表明, 基于深度学习的方法在多数问题目的类别上的分类性能优于已有基准方法, 且使用的Adam优化器优于SGD优化器, 使用Glove预训练的词向量优于使用随机生成的词向量. 该方法以提问目的对帖子进行分类, 可为分析Stack Overflow(SO)上的帖子讨论主题增加新维度.  相似文献   

17.
提出了一种基于支持向量机的中文新词识别算法.该算法结合新词内部模式以及词长等提出了基于词内部模式的改进字符位置似然概率,并综合新词的邻接类别等特征对新词进行识别.经过小说语料测试,实验结果表明:该算法的微F1值为0.583 3,宏F1值为0.775 7,分别比不考虑词内部模式的基准算法提高约63%和30%.  相似文献   

18.
纳米WS_2润滑晶体的制备与量子尺寸效应   总被引:1,自引:1,他引:0  
纳米WS2 润滑晶体是一种性能优良的新型固体润滑材料 .作者介绍了一种用机械 物理固相反应装置制备纳米WS2 润滑晶体的新方法 ;用XRD对WS2 纳米晶体进行了物相分析 ;用ESCALAB MKⅡ型电子能谱仪分析了不同粒径的试样W 4f7/2 ,S 2p3/2 电子结合能的变化 ,并对 5 0nm和 10mm粒径的S W S纳米簇团的S 2p3/2 电子能谱结构进行谱图拟合 .分析结果表明 :XRD图样显示为WS2 相单相 ;在S W S纳米簇团中存在显著的量子尺寸效应 ,该效应强化了硫原子电子壳层间的轨道杂化 ,使纳米级的WS2 润滑晶体形成了 1个没有悬键的、化学性能稳定的中空球体 ,在润滑过程中 ,这种结构可使体系保持较强的化学稳定性 ,能耗降低 .  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号