首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 143 毫秒
1.
作者识别是通过分析未知文本的写作风格推断作者归属的交叉学科。现有的研究多基于字符和词汇特征,而句法关联信息在研究中鲜有涉及。该文提出了基于句法树节点嵌入的作者识别方法,将句法树的节点表示成其所有依存弧对应的嵌入之和,把依存关系信息引入深度学习模型中。然后构建句法注意力网络,并通过该网络得到句法感知向量。该向量同时融合了依存关系、词性以及单词等信息。接着通过句子注意力网络得到句子的表示,最后通过分类器进行分类。在3个英文数据集的实验中,该文方法的性能位列第2或3位。更重要的是,依存句法组合的引入为模型的解释提供了更多的方向。  相似文献   

2.
利用语义、语法等语言知识,对中心词驱动的句法分析模型规则进行分解和修改,结合分词、词性标注进行句法分析,提出一种可同时考虑多个语义依存关系的模型.利用互信息给出基于邻接关系、语义依存关系的2种词相似度定义,提出一种自下而上的分层聚类算法,以解决中心词驱动模型数据稀疏问题,用改进的句法分析模型进行句法分析实验.研究结果表明:模型精确率和召回率分别为88.14%和86.93%,综合指标比Collins头驱动句法分析模型的综合指标提高6.09%.  相似文献   

3.
日语并列关系是日语依存关系的一种.传统的日语依存关系解析不特殊解析并列关系,识别并列关系较为困难.为此提出一种日语并列关系解析方法:基于支持向量机(SVMs)识别并列关键字,如果存在并列关键字,基于SVMs解析句中的并列关系,并将并列关系解析结果用于随后的依存关系解析.用京都大学语料库进行测试,结果表明并列关系解析与依存关系解析均取得较高的正确率.  相似文献   

4.
自然口语中话语标记的研究对言谈互动、话语理解、情感分析、人机对话和口语机器翻译具有重大意义.为实现话语标记的自动识别,该文基于依存语法理论,分析判定话语标记的句法依存关系、语义依存关系、话轮位置以及共现成分的语义与功能信息.针对人工智能深度学习方法缺乏原理和语义上的解释性问题,运用朴素贝叶斯、决策树、大规模线性支持向量机以及贝叶斯网络四种解释性强的机器学习方法,对话语标记进行识别对比实验.研究结果表明,贝叶斯网络识别准确率可达92.3%,验证了该研究结论的可行性和有效性.  相似文献   

5.
文章采用基于依存分析的搭配抽取方法,在对语料进行句法依存分析的基础上抽取搭配,用词语间存在依存关系来定义搭配中的"共现",通过计算两个词的共现频率和互信息来抽取更加合理的搭配。将基于依存句法分析的搭配抽取技术应用于近70年的《人民日报》语言资源监测研究中,实验结果显示,相较于单独的词语监测方法,搭配具有丰富的语境信息,可以更好地反映语言的历时变化和社会生活的变迁。  相似文献   

6.
为有效解决数据的稀疏性问题,并考虑句法预测的内在层次性,提出了一个基于双向长短时记忆(bidirectional long short term memory,BLSTM)神经网络模型的渐步性句法分析模型.该模型将树形概率计算方法应用到对句法标签分类的研究中,利用句法结构和标签之间的层次关系,提出一种从句法结构到句法标签的渐步性句法分析方法,再使用句法分析树来生成句法标签的特征表示,并输入到BLSTM神经网络模型里进行句法标签的分类.在清华大学语义依存语料库上进行实验的结果表明,与链式概率计算方法以及其他依存句法分析器比较,依存准确率提升了0~1个百分点,表明新方法是可行、有效的.  相似文献   

7.
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中"词语依存关系"三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84. 4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。  相似文献   

8.
为了提高车牌字符的识别率,提出了一种基于多特征的字符识别算法。算法首先提取字符的HOG和投影特征参数,把提取出来的特征在SVM中训练。其次,采用多次网格搜索方式,多次训练,寻找SVM的最优参数。最后,把训练好的SVM的模型应用于车牌字符的识别。实验结果表明:字符识别正确率达到99.5%,每个字符的精准率、召回率和F1-score值很高,能很好地识别车牌字符。算法对于字符识别和自动车牌识别系统的应用具有一定的参考价值。  相似文献   

9.
基于改进差分边缘检测法的车牌字符二值化算法   总被引:2,自引:0,他引:2  
针对车牌字符光照和污损的复杂特征,对车牌图象的二值化算法进行了深入的分析和研究,提出了一种基于差分边缘检测算法的改进图象二值化算法.实验结果表明,改进算法能够有效地将字符清晰地从背景中分割出来,分割速度快并且有助于提高字符识别的正确率.  相似文献   

10.
尝试将依存树转化为短语结构树, 并基于规则的方法自动检测出人工标注结果中的错误。将该方法应用于已经过两遍人工校对的北京大学多视图依存树库, 从50275个句法树中发现1529处错误, 正确率为100%。进一步, 所有错误可以分为3个层次: 分词错误、词性与句法角色不符、句法角色错标。该方法可以有效提高依存树库的质量, 并且适用于各类型的依存树库。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号