首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
选择50个词法和句法特征,进行了大量特征筛选实验,并基于筛选后的特征组合提出了一种融合C4.5和SVM的句义类型识别方法.该方法充分利用C4.5对多重句义的高精度识别和SVM对简单句义、复杂句义的高精度识别的特点,将C4.5与SVM分别识别的结果进行融合处理.给出最终的句义类型识别结果.识别结果表明,在BFS-CTC汉语标注语料库中,选取了4 500个句子,经十折交叉验证,句义类型的识别准确率达到92.1%.  相似文献   

2.
规范的重音标注将对重音研究和语音合成技术产生积极影响。该文通过对大规模语料进行语流中词重音和句重音标注,总结出了重音标注的规则。重音标注包括标注训练、正式标注、语料库建立3个步骤。通过标注训练明确重音概念和标注方法,词重音采取词内对比法,所谓"重"主要指突显度和饱满度;句重音采取呼吸句群单位标注法,注重标注的层级性,不跨句群进行重音知觉对比。重音标注完成后,重音语料库也随之建立起来。这个大规模的重音语料库具备词重音和句重音信息,适用于语音合成领域,能较好地提高合成语音的自然度。  相似文献   

3.
名词标注是语料库加工的重点和难点问题。兼顾形式和意义的句法语义一体化处理策略,是名词深加工的重要原则。把对大多数组合具有普遍解释力的语义特征构建成层级体系,并确立相应的形式识别标准,就可以将名词进行有效的分类与归类。我们对大量名词所做的组合特征标注实践证明,“特征即关系”,名词组合属性的细致标注,对揭示双名直接组合模式与搭配规则能够起到很好的作用。  相似文献   

4.
为了满足汉语(二语)教学中语言点教学与研究的需求,以汉语(二语)教学中语言点的标注问题为研究对象,探讨了在汉语语料库中语言点标注的内容、维度、方法,制订了语言点的标注框架,在近15万句的经典汉语(二语)教材语料中对108个核心语言点进行了试标注,在此基础上检验并修订了语言点的标注框架,获得了102288个句次的包含语言点语义、句法、语用信息的标注语料。  相似文献   

5.
汉语句义结构模型及其验证   总被引:1,自引:1,他引:1  
为解决计算机理解和表达汉语句义的问题,以现代汉语语义学理论为基础,探索和创建了一种计算机可计算、可扩展的汉语句义结构模型,该模型从句义层次上描述构成句子的词、子句、分句在句义中承担的句义任务,句子描述对象的时空特征、谓词的时态以及不同句义成分之间的组合关系等,形成了一种抽象句义的结构化表达形式;同时,提出了一种基于反向提问的句义结构模型验证方法,用疑问词替换语义格迭代构成问句,再对问句进行评价.实验结果表明,对简单句义、复杂句义和多重句义的反向提问正确率达到92.07%,充分说明句义结构模型的合理性.   相似文献   

6.
基于OANC、Power Thesaurus语料库,运用语料检索软件Ant Conc采用数据与数据驱动相结合的方法,研究大学英语高频词汇中核心意义均为中性的近义动词的类联接模式和语义韵现象,实证研究发现具有相似含义和类联接模式的动词也存在不同的语义韵。学习者借助语料库对词汇搭配的语义特征进行分析和总结,可有效避免因词汇搭配失误造成的语义混乱,实现隐性知识与显性知识之间的转化及语用能力的提升。  相似文献   

7.
建立了一种德语语料词性标注方法以及基于词性标注的统计方法.初步实验证明了上述方法对德语语料标注和标注后的语料进行单词、词类、短语结构和句子的统计是正确和有效的.  相似文献   

8.
多文档自动摘要研究是自然语言处理领域的关键问题之一,为使抽取的摘要更能体现多文档主题,本文在子主题划分的基础上,提出了一种融合句义特征的句子优化选择方法.该方法基于句义结构模型,提取句义结构中的话题、谓词等特征,并融合统计特征构造特征向量计算句子权重,最后采用综合加权选取法和最大边缘相关相结合的方法抽取摘要.选取不同主题的文本集进行实验和评价,在摘要压缩比为15%情况下,系统摘要平均准确率达到66.7%,平均召回率达到65.5%.实验结果表明句义特征的引入可以有效提升多文档摘要的效果.   相似文献   

9.
针对现有中文自然语言处理研究多以词或者字符为单位,忽视了中文词的内部层次结构的问题,提出一种新的中文词内部层次结构定义标准.该标准定义了内部结构的节点类型和节点内部关系.在此基础上,进一步提出了中文词内部层次结构的标注规范,并且人工标注了含有带内部层次结构的53 918个中文词的词料库.该研究有望为后续的细粒度中文自然语言处理提供新思路.  相似文献   

10.
综合语义角色标注语料的格式、标签结构、标签内容和用户可信度等多个特征, 实现一种自动的语义角色标注一致性计算方法。实验证明, 该方法对错误标注的召回率高, 并且速度快, 结果稳定, 可以大幅度地提高语义角色标注一致性检查的效率。  相似文献   

11.
汉语计算语义理论及其原则   总被引:3,自引:0,他引:3  
介绍了一些汉语计算语义理论相关的知识和研究成果,谈到了目前面临的问题,最后提出了汉语计算语义理论研究的目标、原则与思路,以作为解决问题的对策.  相似文献   

12.
中文篇章零元素语料库构建   总被引:1,自引:0,他引:1  
针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。  相似文献   

13.
对于汉语这种缺乏严格意义上的形态变化的语言来说,要让计算机自动理解并生成汉语,语义知识的研究就显得至关重要。文章主要介绍了国内面向中文信息处理的语义研究概况,旨在为相关工作人员提供参考资料,奠定研究基础。  相似文献   

14.
提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集RB数据实验结果表明,该方法在计算语义相似度问题上有效。  相似文献   

15.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

16.
鉴于现有中文实体链接基准语料库的缺乏, 在ACE2005中文语料库和中文维基百科的基础上, 通过自动构造和人工标注的方法, 构建一个中文实体链接语料库及其相关的中文知识库。与传统的英文实体链接语料库不同, 构造的中文实体链接语料库是基于实体而非单个实体指称(Mention)。中文实体链接语料库的构建, 将为中文实体链接研究提供一个可用的基准平台。  相似文献   

17.
严格地导出了图像结构信息的表达式,定义了一个由结构参数组成的结构空间T,并用心理测度函数的变换函数族把图像从结构空间T映射到结构信息空间,反映人从图像结构中所接收到的结构信息。还用函数来表达人对某个结构参数刺激的特殊响应。最后指出分析图像结构后可以得出结构信息,而图像人对图像结构了解越清楚,则人所得的结构信息就越大,从而人对图像的结构语义的判断就越正确。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号