首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 375 毫秒
1.
阐述了面向开放领域和受限领域中文问句处理方法的异同,讨论了在受限领域(图书信息领域)中文问句处理的思路.在当前汉语言句法分析技术尚无法达到应用级别水平的前提下,提出了基于语义块识别的中文问句浅层语义分析技术.给出了语义块的定义、规约规则以及问句向量的生成方法,最终实现对中文问句的浅层语义挖掘,以满足实际应用的需要.实验证明,该方法在语料较为稀疏时,具有良好的效果.  相似文献   

2.
中文篇章零元素语料库构建   总被引:1,自引:0,他引:1  
针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。  相似文献   

3.
语音模式发现是从语音流中检测出重复出现的音节、词或短语等语音单元的任务。该文基于分段动态时间规整(segmental dynamic time warping,SDTW)算法,尝试直接在中文语料上进行语音模式发现。Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征在衡量两个语音片段声学相似度上不够鲁棒,特别是针对多说话人语料,语音模式发现的效果大打折扣。该文尝试了基于音素后验概率(posteriorgram)的特征表示方法。实验表明:在多说话人和单说话人的语料上,音素后验特征均可以得到比MFCC更好的效果。该文尝试了用词边界确定分段进行语音模式发现,这种设置可以看作基于SDTW进行模式发现的效果上限。实验表明:在预知词边界的情况下,效率和正确率都得到了明显提升。  相似文献   

4.
针对中文微博句子倾向性分类问题,在充分降低由于情感词典的扩充工作带来系统开销的基础上,抽取了中文微博句子中标点符号、情感词权重、词汇级和句法级等新型平面和结构化特征,探索了有效的特征选择方法.在基准COAE和NLP&CC中文微博语料上进行双向交叉和独立实验,并研究了有效的不平衡性语料的处理方法.实验结果表明:采用该文提出的特征后,中文微博句子倾向性分类的性能得到显著提升.  相似文献   

5.
孟丹 《科技信息》2010,(27):I0119-I0119,I0207
本文根据陆剑明先生的《汉语和汉语研究十五讲》,从语言的认知分析角度探讨了"对"的六种语用限制因素,在北京大学CCL语料库(网络版)和作者内省语料基础上,阐述了什么时候中国人需要使用"对",并将这些场所进行了英汉语言对比。本篇文章从一定程度上帮助留学生理清了"对"的使用场合,并对对外汉语教学界关于"对"的研究提供了一些素材。  相似文献   

6.
基于Python语言,利用公开中文语料库,测试不同算法模型对中文文本分类的效果.选择语料中不同数量的语料种类,首先对文本进行格式化读取、清洗等处理,而后以2:1:1的比例,分为训练集、验证集、测试集,最后依照文本表示、特征提取、分类算法选择、效果评估的步骤,依次在词袋、词嵌入、语言3种模型中选取典型代表进行中文文本分类.在深度学习模型的帮助下,文本分类得到了快速的发展,当前的主流分类方法基本都能满足不同任务的文本分类需求,特别是BERT语言模型可极大地提升文本分类的效果.  相似文献   

7.
针对中文篇章中的零指代问题,提出一种基于中英文可比较语料进行中文零指代识别和消解的方法,并提出英文对等句的概念。利用对等句,重新定义句子间隔,并引入双语词对齐特征。在基准平台基础上,从零指代项识别和零指代项消解两个方面进行研究。在Onto Notes5.0语料上的实验结果表明,与目前性能最好的系统相比,新提出的基于中英对等语料的中文零指代方法取得更好的性能。  相似文献   

8.
从颜色词看英汉语言文化差异   总被引:1,自引:0,他引:1  
英汉语言习惯不同,风俗各异,表示颜色的方法和用词也不尽相同,对同一颜色的理解也有差异。颜色词在英汉对译中的差异:一、有时保留其本色;二、有时会“变色”;三、有时与颜色无关。现以“红、黑、白”三色在英汉语言的涵义不同说明英汉语言文化差异  相似文献   

9.
在汉文化背景下产生的典故携带着自身独特的文化意蕴贯穿了整个文学创作的历史,在长期的使用和发展过程中,它逐渐定型为汉语言中一类特殊的语料群。早期对典故的体认在修辞学的框架中起步,虽时人对其态度褒贬不一,但随历朝用事实践的发展,古代诗话、文论中亦不乏对其运用细则的探讨,主要集中在运用的方法、要求和禁忌方面。进入20世纪,学人继而对典故进行了理论上的研究,涉及到内涵界定、与成语熟语等的关系、典故辞书编纂及其文化蕴含诸方面,并且对文学作品中具体的典故运用实践从不同角度予以了分析、评价,多具美学色彩。  相似文献   

10.
为基于真实语料进行句法分析,构建了大规模的短语结构树库和依存结构树库,并尝试在两种结构的树库之间进行转换.讨论了宾州中文树库(Penn Chinese Treebank,CTB)中短语结构树库和依存结构树库的关系,并基于现代中文依存文法制定了中心子节点过滤表,依据该表将短语结构的CTB转换为依存结构树库.在CTB中随机抽取200句语料,转换正确率达到了99.50%.基于该转换得到的依存结构树库可以进一步进行中文依存关系解析的研究.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号