首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 296 毫秒
1.
带拼音纠错的汉语音字转换技术   总被引:3,自引:0,他引:3  
提出了一种基于统计和规则的混合方法来实现汉语音字转换。利用汉语的语法规则,在统计语言模型中采用了两种基于词和词性的混合语言模型。在实验中,将这两种混合语言模型与基于词的语言模型进行了比较。实验证明,在语言模型中引入词性后,提高了音字转换正确率。考虑了出现拼音错误时的音字转换问题,提出了一种拼音纠错方法来纠正错误。实验证明,当拼音正确率高于85%时,这种带纠错的音字转换方法可以提高音字转换正确率。  相似文献   

2.
以对比的方法就引导短语和引导that从句的given一词的词性意义及其句法功能进行研究,可以看出它的词性范畴及其在句子中的语法功能。语言是社会的产物,它随着社会的发展而发展变化,我们应该在学习和研究纷杂的语言现象中有所发展和深化。  相似文献   

3.
相似词分析是自然语言处理领域的研究热点之一,在文本分类、机器翻译和信息推荐等领域中具有重要的研究价值和应用意义。针对新浪微博短文本的特点,给出一种带词性的连续词袋模型(POS-CBOW)。该模型在连续词袋模型的基础上加入过滤层和词性标注层,对空间词向量进行优化和词性标注,通过空间词向量的余弦相似度和词性相似度来判别词向量的相似性,并利用统计分析模型筛选出最优相似词集合。实验表明,基于POS-CBOW语言模型的相似词分析算法优于传统CBOW语言模型。  相似文献   

4.
同其他语言一样藏语词性的兼类现象普遍存在,这给词性标注工作带来了巨大困难,对兼类词的处理是藏语词性标注的关键所在。文章利用传统和现代藏语语法理论,在分析藏语真实文本的基础上,归纳了藏语兼类词的种类,提出了兼类词的标注原则。并根据词语搭配关系和词的组合结构构建了兼类词的识别规则库,利用该规则库可对兼类词的词性进行较准确的标注。  相似文献   

5.
刘宗保 《皖西学院学报》2023,(3):146-152+156
庐剧语言具有重要的语言学价值,根据已有的庐剧剧本可以挖掘其中的相关词汇、修辞和语法等语言特征。词汇特征主要包括指称与方言词两方面,修辞特征包括析词修辞、语音修辞和混合修辞三类,语法特征则可以从词的用法特征与结构表达特征等两个角度来考察。庐剧语言的相关特征与方言、近代汉语及戏曲语体本身特征有密切关联。相关考察有助于庐剧语言及戏曲语言的语言学研究进一步深入。  相似文献   

6.
判断句是语言中共有的表达判断概念的小句.就名词性谓语类型的判断句而言, 不同语言中判断句的构成具有不同特点.判断句中判断词的使用情况变数多,而且复杂.对各种语言的调查结果显示:判断句的判断命题是取决于句中名词性谓语的语义,判断词只有语法功能,并无语义内涵.  相似文献   

7.
宣传语的汉译英中存在着不少的问题。这些问题包括语言错误和社交语用失误。本文通过实例分析说明宣传英语使用中存在的这些语用问题。语言错误主要表现在:词的用法不当,词的搭配错误,词性有误,词的感情色彩不当,词的随意增减,词的表意不清,词的使用不规范,句子结构有误,英、汉表达内容不一致,时态问题。语言错误是由于语言基本功不深造成的。语用语言失误是由于误用了表达方式、将源语的习惯表达方式套人到目的语中去,从而使译文不符合本族人的语言习惯,不易被接受。社交语用失误通常由提示信息不当和文化差异所引起的。加强双语基本功、重视文化对比研究有助于解决这些翻译语用问题。  相似文献   

8.
以对比的方法就引导短语和引导that从句的given一词的词性意义及其句法功能进行研究,可以看出它的词性范畴及其在句子中的语法功能。语言是社会的产物,它随着社会的发展而发展变化,我们应该在学习和研究纷杂的语言现象中有所发展和深化。  相似文献   

9.
采用分层语法规则的加权概念转移网络,并将语法规则和类似于统计语言模型中的概率分布结合起来,通过引入平滑的概念,为一些超出词典的OOV词和超出语法规则的词分配一个较小的概率,使模型具有较强的稳健性.实验结果表明:这种分层语法表示灵活、概念清晰、实现简单,可以较大地降低语言模型的混乱度;模型在概念级的预测性能可达到99%的正确率.用该语言模型为语音识别提供预测单元,可以提高识别率.  相似文献   

10.
在传统语法研究中词法与句法严格分离,而且以构词法和构形法作为词法的主要内容,只是在词平面上加以研究。这容易把语言研究引入歧途,使我们无法阐明格(K),静词化尬发(SUBSZ)以及屈折成分(INFL)等构形成分的句法层次关系。以乔姆斯基为代表的生成语法学派理论推翻了传统语法或结构主义语法不切实际的一套东西,摧毁了传统语法在词法和句法之间人为设置的藩篱,为阿尔泰的研究开辟了新的道路。当我们按生成语法理论把阿尔泰语言的构形成分作为功能语类(functional category)处理时发现,传统语法中一直无法说明的句法层次问题得到了圆满的解释。  相似文献   

11.
副词性确认标记词是指方言“有 VP”句式中“有”字,它的语法意义主要是表确认,句法位置固定,几乎能置放于任何时态的语言环境中,起着明显的标记作用。“副词性确认标记”这个概念涵盖了“有”的语法性质、语法意义和语法作用。  相似文献   

12.
具体的语言环境与大量的语言事实是正确界定一个词词义及词性的先决条件。文章就传统的析“以”为“率领”义时的介词词性与动词词义存有疑虑,并从四个方面进行了探讨,旨在明析这一特殊现象。  相似文献   

13.
凡是用声调作为手段来表示“词汇意义和词的语法意义”的语言,被称为“声调语言”:凡是不用声调作为手段来表示“词汇意叉和词的语法意叉”的语言,被称为“非声调语言”。中国境内有藏语、彝语、壮语、傣语、苗语、瑶语等几十种语言都属声调语言之列。到目前为止,学者们对这些语言声调的起源、构成、发展、变化做过十分精辟的研究,但是也留下一些问题有待讨论。比如.声调语言的辅音有“单辅音、复辅音”之分,元音有“单元音、复元音”之分,其声调是不是也有“单声调、复声调”之分呢?这样的问题一直还没有人论证过。通过审听、实验和综舍分析有关语料,所得出的答案是肯定的。  相似文献   

14.
《毛诗话训传》共有复音词’“约870个。按其词性大致可分为名词、形容词、动词儿大类。在词的构造上,既有由语音造词形成的联绵词和重言词,也有由语法造词形成的复合词,且呈现出由语音遣词大量向语法选调转化的趋势,在复音调发展史上具有重要的承先启后作用。  相似文献   

15.
语法和修辞的性质不同,各有各的任务。语法是研究组词造句规律的,它从语法规则着眼,看说(或写)得通不通一怎样才通;修辞是研究如何运用语言提高表达效果的方法和规律的,它从语言的表达效果着眼,看说(或写)得好不好,怎样才好。请看下面两个句子:  相似文献   

16.
临沂方言含有丰富的后缀,同一个后缀可以附着在不同词性的词根后表示词的意义或某种语法作用,这体现出临沂方言后缀成词的能产性.对临沂方言中的名词后缀、动词后缀、形容词后缀进行探究,可以很好地展现出临沂方言后缀的语言面貌.  相似文献   

17.
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.  相似文献   

18.
“人而无信”这种语法形式是“体词(各词、代词或名词性结构) 而 谓词(动词、形容词或谓词性结构)。在先秦文献中,这种语法形式常见,本文试对其语法、语度作以探讨研究。  相似文献   

19.
程芳 《今日科技》2003,(12):37-39
一、什么是普遍语法 生成语法学家提倡研究普遍语法,提倡用自然主义的方法去研究人类语言的本质。普遍语法诞生于20世纪中期的乔姆斯基革命。普遍语法虽然也称为语法,但却与平常所说的英语语法、德语语法等个别语言语法的意义迥然不同。普遍语法是人脑的语言机制遗传的部分,即人类语言机制与生俱来的共性。平常所说的语法只是尽可能地对各种语言现象进行充分地描述,总结出适合这种语言的具体规则。而普  相似文献   

20.
单词向量化是自然语言处理领域中的重要研究课题之一,其核心是对文本中的单词建模,用一个较低维的向量来表征每个单词.生成词向量的方式有很多,目前性能最佳的是基于神经网络语言模型生成的分布式词向量,Google公司在2012年推出的Word2vec开源工具就是其中之一.分布式词向量已被应用于聚类、命名实体识别、词性分析等自然语言处理任务中,它的性能依赖于神经网络语言模型本身的性能,并与语言模型处理的具体任务有关.本文从三个方面介绍基于神经网络的分布式词向量,包括:经典神经网络语言模型的构建方法;对语言模型中存在的多分类问题的优化方法;如何利用辅助结构训练词向量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号