首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
基于“配价”是汉语词语的一个比较本质的特点,一旦1个词语的配价结构确定下来,它应该和怎样的词进行搭配就比较清楚,从而也可以比较直接地导出句子的结构,为此,结合中心词驱动句法分析模型,提出基于配价结构的词汇化句法分析模型,引入丰富的语义信息如语义依存信息和配价结构等语义搭配信息,并用改进的句法分析模型进行句法分析实验.实验结果表明:模型的精确率和召回率分别为88.65%和87.26%,综合指标F与Collins的中心词驱动句法分析模型的相比提高6.51%.  相似文献   

2.
针对句法分析中细粒度和粗粒度组块识别模型的冲突问题, 为解决句法分析中词语搭配规则多、减少搭配优先级变动的影响, 提出一种结合条件随机场(CRF)和多元规则的层次化句法分析模型. 先利用CRF算法识别细粒度语句的组块标记序列, 然后结合统计和多元规则识别粗粒度组块, 在识别出的组块中层层引入不同优先级的二元、三元规则. 该模型实现了同时进行细粒度和粗粒度组块的识别, 可更好地服务于句法分析. 在Chinese TreeBank8.0(CTB8.0)语料上采用5-折交叉验证, 结果表明, 相比于仅使用二元、 三元规则及使用CRF+二元规则的句法分析, 该模型的正确率分别约提高12%,3%,5%, 验证了该模型有效性和稳定性.  相似文献   

3.
针对句法分析中细粒度和粗粒度组块识别模型的冲突问题, 为解决句法分析中词语搭配规则多、减少搭配优先级变动的影响, 提出一种结合条件随机场(CRF)和多元规则的层次化句法分析模型. 先利用CRF算法识别细粒度语句的组块标记序列, 然后结合统计和多元规则识别粗粒度组块, 在识别出的组块中层层引入不同优先级的二元、三元规则. 该模型实现了同时进行细粒度和粗粒度组块的识别, 可更好地服务于句法分析. 在Chinese TreeBank8.0(CTB8.0)语料上采用5-折交叉验证, 结果表明, 相比于仅使用二元、 三元规则及使用CRF+二元规则的句法分析, 该模型的正确率分别约提高12%,3%,5%, 验证了该模型有效性和稳定性.  相似文献   

4.
Two-stage approach to full Chinese parsing   总被引:3,自引:0,他引:3  
曹海龙  Zhao  Tiejun  Yang  Muyun  Li  Sheng 《高技术通讯(英文版)》2005,11(4):359-363
0IntroductionInthe past decades,great progress has been madeinthe field of Chinese word segmentation,part of speechtagging and partial parsing.Nowfull Chinese parsing,thenext step essential to Chinese understanding,is attractingmore and more attentionintheinternational researchcom-munity[1-3].It is a challenging problemfor two reasons.First,like any natural language,there is much ambiguityin Chinese sentences resultingin huge searchspace.Sec-ond,Chinese has many different linguistic phenome…  相似文献   

5.
综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中"词语依存关系"三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84. 4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。  相似文献   

6.
利用语义、语法等语言知识,建立一种分层句法分析统计模型,并进行句法分析实验.研究结果表明:该模型具有规则和统计相结合的特点,且在层次分析的不同阶段,根据不同的语法、语义、语用特性采用不同的方法和不同的统计模型;该模型结合分词、词性标注进行句法分析,是一个词汇化的句法分析模型,可同时考虑多个语义依存关系;采用该模型,精确率和召回率分别为87.23%和86.15%,其综合指标F与头驱动句法分析模型的相比提高了5.25%.  相似文献   

7.
句子相似度计算是自然语言处理的一项基础任务,其准确性直接影响机器翻译、问题回答等下游任务的性能。传统机器学习方法主要依靠词形、词序及结构等浅层特征计算句子相似度,而深度学习方法能够融入深层语义特征,从而取得了更好效果。深度学习方法如卷积神经网络在提取文本特征时存在提取句子语义特征较浅、长距离依赖信息不足的缺点。因此设计了DCNN (dependency convolutional neural network)模型,该模型利用词语之间的依存关系来解决该不足。DCNN模型首先通过依存句法分析得到句子中词语之间的依存关系,而后根据与当前词存在一跳或者两跳关系的词语形成二元和三元的词语组合,再将这两部分信息作为原句信息的补充,输入到卷积神经网络中,以此来获取词语之间长距离依赖信息。实验结果表明,加入依存句法信息得到的长距离依赖能有效提升模型性能。在MSRP (microsoft research paraphrase corpus)数据集上,模型准确度和F1值分别为80.33%和85.91,在SICK (sentences involving compositional knowledge)数据集上模型的皮尔森相关系数能达到87.5,在MSRvid (microsoft video paraphrase corpus)数据集上模型的皮尔森相关系数能达到92.2。  相似文献   

8.
面向中文问答系统的问句句法分析   总被引:3,自引:0,他引:3  
中文句法分析是汉语研究和信息处理中的一个关键环节,同时也是难点之一.探 讨了中文问句的结构特征,在面向中文问答系统的问句句法分析算法中,运用语料库句法处理技术,并对问句长度短、含疑问词、有疑问结构句式等特点加以利用,初步实验结果达到了预期目标.  相似文献   

9.
Introduction Although the word trigram dominates the statistical language modeling community, it still has some short- comings. For example, the word trigram cannot make use of the rich linguistic structure of the language, nor can it capture long-distanc…  相似文献   

10.
基于依存关系的句法分析统计模型   总被引:3,自引:2,他引:3  
利用语义、语法等语言知识,建立一种基于依存关系的句法分析统计模型,并利用改进的句法分析模型进行句法分析实验.研究结果表明:利用依存关系、互信息对词聚类,能解决模型数据稀疏问题;模型可同时考虑几种语义依存关系;该模型是一个词汇化的句法分析模型,能结合分词、词性标注进行句法分析;概率上下文无关语法中由概率的上下文无关性假设和祖先结点无关性假设引起的问题在该模型中得到有效解决;精确率和召回率分别为86.96%和85.25%,其综合指标F与Collins的头驱动句法分析模型的F相比提高4.75%.  相似文献   

11.
改进的上下文无关文法及其语法分析   总被引:2,自引:0,他引:2  
针对一些语言的实际应用情况,对标准的上下文无关文法作了改进,将标准的上下文无关文法定义中的非终结符集合和终结符集合进行细化,使得单词推导和句子推导可以使用同一个过程,即词法分析和语法分析可以在同一个语法分析过程完成.还给出了改进后文法的分析算法及算法的时间复杂度分析,证明用这种改进的方法进行语言文法定义更直观、简洁。其分析算法的时间复杂度优于标准上下文无关文法的分析算法.  相似文献   

12.
考虑到句法结构与语义结构之间的紧密联系, 尝试将句法信息融入UCCA语义分析模型中来增强语义分析的性能。基于目前性能最好的基于图的 UCCA语义分析模型, 提出并比较4种不同的融入依存句法信息的方法。采用SemEval-2019国际评测语义分析任务的英文数据集进行实验, 在本领域和跨领域两个数据集上的结果均表明, 句法增强的方法能够给显著地提高UCCA分析性能。引入BERT特征后, 句法信息仍然可以提供一定的帮助。  相似文献   

13.
The complex sentence structure of English is a bottleneck to our practical machi ne translation system. The simplification of English subordinate clauses will gr eatly relieves the burden of parsing and other grammatical or semantic analysis of a complex sentence, thus improves the output quality of the MT system. But th ere have not any satisfactory research achievements reported in this field up t o now as we know. In this paper, author's work on a corpus-based approach to English subordinate clause identification is reported. The approach integrate s rule-base d and statistical methods to get the left and right boundaries of the subordinat e clauses. The Penn Treebank corpus is used as the training standard. The precis ion and recall ratios of subordinate clause identification are tested on both cl osed and open corpora. A result of 92.9% precision and 91.26% recall is obtained for the closed test and the open test result is 80.34% precision and 83.93% rec all. This algorithm has been integrated into our machine translation system. The method can also be applied to processing of any other language.  相似文献   

14.
在扩展巴克斯范式(EBNF)Earley分析的基础上, 提出一个语义分析器的自动生成算法, 给出了一个带有语义动作的扩展文法和一个输入, 即可生成其语义分析器. 通过执行语义动作, 就可以进行类型检查、 中间代码生成及优化等相关工作, 使得该算法成为完整的扩展文法分析技术, 并在实际运用中成为可能.  相似文献   

15.
人类用视觉认知手语,是通过不变的结构来描述物体各部分及其关系,实现从整体到部分的拆解或各部分的重新组合.本文通过模拟听障人对手语的认知方式,先计算其视野中的视觉显著区域,再将注意力焦点种子集中于手部提高其有效性,将生成的语义超像素作为部分,再把部分映射为手指骨架或将手掌缩为一个关节点,而得到子手语集.按解剖结构拆解手语图像(状态),初步实现了对一组相似手语的视觉语义-结构化解析.  相似文献   

16.
邹文杰 《科技信息》2008,(20):45-46
线图分析法是分析自然语言的一种经典方法。和其他完全句法分析技术一样,线图分析法的效率不高。基于戏图分析法的语法分析系统大多数是所谓的“玩具”系统。本文基于中山大学软件研究所的WordHelp项目,针对线图分析法的低效率,提出了一种改进的方法。  相似文献   

17.
18.
针对反向代理应用中存在着的网页内嵌URL问题,提出了前置URL控制机制,构建了该机制的总体模型,包括URL定向模块、预分析器、HTML/XML解析器、URL修改模块和COOKIE修改模块各部件.论述了模型的核心技术--动态脚本的HTML解析和XSL/XML联合解析,提出了异地代理的解决方案.在Apache/Linux下实现了该模型原型,对其功能进行了完整测试,包括性能负载测试,测试结果表明该机制能高效地完成预期目标.  相似文献   

19.
为了实现三维建模数据的快速读取和解析,提出了一种解析保存3ds数据的方法并应用到实际三维漫游软件中。作为专业的三维建模软件,3ds Max提供了强大的快速建模功能。但由于需要占用大量CPU和内存资源,因此其实时交互性较差,很难直接应用到实际工程项目中。充分利用3ds Max的快速建模能力,分析3ds Max的建模文件3ds数据格式,以其内部树状数据结构为基础,按照其存储特点及数据之间的关系有效读取,并采用C++高效编码实现,以自定义的列表类、对象类、材质库类合理的组织和保存,为三维场景重建奠定基础。实际应用表明该解析算法实用有效。  相似文献   

20.
在分析现有布局模型及相关求解技术的基础上,提出了三维布局问题的一个复合知识模型──构造性属性关联图(CALG),并深入研究了基于图法则分析的模型生成策略.该复合知识模型的生成过程刻划了三维布局结构的构造原理.CALG具有良好的几何信息,为布局问题的具体求解打下了基础.利用该方法有效地建立了车身内布置设计的初始模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号