首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
文章提出了一种基于义项相似度的自动合并算法,用于整合以现代汉语语法信息词典、现代汉语虚词用法知识库和现代汉语词典(第5版)为核心,以现代汉语语义词典和同义词词林等其他19个词典为补充的多源词典和知识库,初步的构建了大规模汉语词汇语义知识库CLSKB。自动合并算法准确率达到32.9%,大幅度地提高了合并工作的效率。CLSKB共包括核心知识库CLSKB_Core和扩展知识库CLSKB_Extended。CLSKB_Core由可信度高的资源合并得到,规模约16万条。CLSKB_Extended是扩展知识库,主要资源来自网络,用于补充核心知识库,规模约33万条。该知识库可为自然语言处理中诸多领域提供丰富的词汇语义及关系信息。  相似文献   

2.
我校中文系今年用的现代汉语教材是陆仁昌先生主编,东北师大出版的《现代汉语教程》.本教材对同义词的定义作了如下的描述:同义词是语音不同而语义相同或相近的一组词语.这个定义科学不科学、它符合不符合汉语的实际,有待于探讨.无须争论的是,同义词是词在意义上的分类的结果之一.词汇里,词与词间的同义关系,是由于它们指称的事物、现象、关系(包括语法关系)的相同或相近决定的.指称的对象相同,词义的逻辑内容一致的一些词,是等义关系词;指称的对象相似,词义的逻辑内容大同小异的一些词,是近义关系的词.这是同义词的两个方面.  相似文献   

3.
以《汉语水平词汇与汉字等级大纲》甲级词中的单音节动词为对象,同与之同义的单音节动词(包括非大纲甲级词甚至非大纲中的词)组成了297组同义词,对词义进行比较发现,《现代汉语词典》对297组同义词的解释可以分为两大类:义项相同的同义单音节动词和义项相近的同义单音节动词。  相似文献   

4.
基于《现代汉语语义词典》,首先建立不同语义层次的词典,根据词典分别构建模型并进行语义预测,然后将各个模型进行集成,通过集成模型再对未登录词进行语义预测,得到较好的预测性能。利用预测模型对2000年《人民日报》语料进行未登录词语义预测和标注,最终得到带有未登录词语义义项标注的语料资源。  相似文献   

5.
根据时贤对同义词的界定标准,从历时角度分析“酣”、“醉”的同义关系及在语义、语法、语用方面的差别。  相似文献   

6.
同义副词辨析浅谈   总被引:1,自引:0,他引:1  
同义副词的辨析,是中学语文、语法教学中的一个难点。传统的辨析方法,一般是沿引《词典》上现存的注文加以解说,而注文本身存在着辗转解说、界线不清的现象,因而给同义副词的辨析带来较大困难。例如,《现代汉语虚词用法小词典》在“从来”条下说:“……‘向来’也是‘从来’的意思,只是语意比较轻些”,这样的注文就很容易叫人误认为这组同义副词的意思是一样的。我认为,辨析同义副词只有从研究它们在各种语言形式中的具体用法入手,才能揭示其不同的语法意义,达到辨析目的。同义副词在用法上的特点,主要表现以下几方面。  相似文献   

7.
通过对127个高频形容词在《现代汉语规范词典》中的释义进行统计分析,发现了一种新的一词多义表征方式——同义词或反义词加语义特征。采用“三步法”,可以全面收集某个形容词在词库中的同义词、反义词和相关特征,包括那些没有在本词条下出现的词和特征。这项研究在一定程度上增进了对“互训”和语义特征的认识,有助于进一步开展相关的语义学和自然语言处理研究。  相似文献   

8.
鉴于细粒度产品特征挖掘的重要性以及现有产品评论研究中对产品特征语义(上下位特征、同义特征)缺失的问题,根据手机产品说明书构建手机产品特征本体,再采用爬虫程序从电子商务网站获取用户评论信息,并对自然评论语言进行分词、词性标注、去重等预处理,利用Apriori算法提取相应的产品特征,结合HowNet词典,将手机产品特征本体进行语义扩展、完善,便于将来进一步准确地从用户角度对产品进行情感分析.  相似文献   

9.
基于同义词词林提出一种语义空间变换算法,并将其应用于平滑BLEU中,提出一种改进的基于同义词词林的BLEUS评测方法,该方法针对候选译文中短译文或英文缩写可能导致一元语法零匹配的情况,对传统BLEUS的n元语法均进行了平滑处理,并且以参考译文的一元语法为标准,对候选译文进行语义空间变换.在俄汉双语句子数据集上对谷歌、百度、必应、有道在线翻译系统的俄汉翻译输出译文进行评测,改进方法与传统BLEUS的评测结果一致;基于同义词词林的BLEUS提升传统BLEUS的评测性能,使得百度的NBLEUS值提高了3.99%,谷歌提高了7.66%,必应提高了11.15%,有道提高了4.65%.与此同时,验证了基于同一类型评测方法的纵向比较方法的有效性.  相似文献   

10.
针对在微博情感分析中没有有效地构造情感词典的方法问题,提出基于《同义词词林》和微博检索系统的情感词典的构造方法。利用《同义词词林》对4部基础情感词典进行扩展形成一部情感词典,利用点互信息(PMI)公式计算情感词语的情感倾向值。针对情感分析中特征选择的问题,利用不同的特征组合通过对比实验选取了有效的特征组合。实验证明,构造的情感词典和选择的特征组合有效,能够明显提高微博情感分析的质量。  相似文献   

11.
<蒙古语语法信息词典>是为实现蒙古语的自动分析和自动生成而研制的一部机器词典.从词典建设的实际需求出发,设计了<蒙古语语法信息词典>管理平台,介绍了管理平台设计和实现的基本方法.  相似文献   

12.
《现代汉语词典》古词语释义的疏误   总被引:2,自引:0,他引:2  
作为权威性语文辞书《现代汉语词典》,其释义达到了较高的质量。该书所涉古词语占全书相当比重,但其释义问题较多,可以说古词语是其释义的盲区。这也是该词典研究的冷角。今选明显失误的若干条进行辨正,按致误的主要特征分为四个小类:一、不明古名物而误;二、混淆近似事物而误;三、不解词素义而误;四、不辨旧注,未利用文物考古资料而误。以引起大家的重视,促进其质量的进一步提高。  相似文献   

13.
<朗文当代英语辞典>第四版微观信息更加丰富和多样化,具体表现在例证更加丰富,增加习惯搭配信息.新增类义词汇栏,新增百科信息,恢复语言说明栏.在宏观结构方面,新的版本采用全彩印刷,查找更为方便,插图更为丰富,另外书后附有CD-ROM光碟,这是新版的重大突破.尽管仍有不足之处,但它依然是英语学习的好帮手,质量优良的好词典.  相似文献   

14.
中文文档与源代码间关联关系提取方法的研究   总被引:1,自引:0,他引:1  
文章提出了一种提取中文软件文档与源代码间的关联关系的方法,根据中文软件文档和源代码的一些特征,在潜在语义索引模型的基础上使用了3种策略:引入项目数据词典辅助中文分词和中英文的翻译、将文档按类型分层以实现反馈、调整代码中的特征项的权值。实验结果表明,同时使用3种策略可以在提取阀值C相同的情况下,提高查全率4%~28%,在查全率不变的情况下,提高查准率8%~30%。  相似文献   

15.
用分类方法为汉字编码,简捷直观,便于编制输入软件.作为典型例子,选择一个最小的汉字库、一个最常用的汉字库和一个目前最完备的大汉字库,设计制作了汉字输入系统,使小字库上的数码可作为大字库上的简码,十分方便易学好用.大道至繁至简,汉字本身存在一字多音、一字多义、一字多形的实况,从而导致汉字编码可以规范方法解决输入系统一字多码和一码多字的问题.  相似文献   

16.
黄琪 《科技信息》2008,(29):131-131
Halliday认为概念语法隐喻的使用增加词汇密度,降低语法密度。通过对中国英语专业学生语言产出中语法隐喻、词汇密度和语法密度关系的研究,得出以下结论:一、概念语法隐喻、语篇语法隐喻与词汇密度正相关,与语法密度负相关,人际语法隐喻正好相反。二、学习者语域意识不够强,其书面语中词汇密度过低。三、词汇密度和语法密度呈现逆向发展态势。  相似文献   

17.
针对目前中文分词技术主要依赖于常用词词典,而词典对未登录词识别率较低的问题,提出一种用双词典识别未登录词的方法,即构建一个常用词词典和一个单字词词典,二者相互结合进行分词,有效解决了对未登录词识别效率偏低的问题.实验表明,采用构建单字词表法对未登录词的识别准确率可达90%以上.  相似文献   

18.
《现代汉语词典》与《现代汉语规范词典》都按有无国家试行标准两大类分别收录处理异形词,但它们在分条立目、对同组异形词推荐词形与非推荐词形的界定、对异形词推荐词形与非推荐词形词语间语义关系的认定及对非推荐词形异形词的标注形式等方面都有差异。差异主要成因在于两者对异形词收录原则有不同理解。相对而言,《现代汉语词典》更强调“从简”、“系统性”,《现代汉语规范词典》更强调“理据性”、“规范性”。《现代汉语词典》和《现代汉语规范词典》对异形词所做的整理性收录,正在并仍将对现代汉语异形词表的审定产生积极影响,有助于现代汉语词汇规范化。  相似文献   

19.
通过梳理近代汉语助词"着""了"用法和意义的历史演变研究,尤其是元代汉语助词"着""了"的研究,指出元代汉语存在助词"着""了"混用的现象,而不是语法分工不清,这种现象可能与语言接触有关。  相似文献   

20.
<应用汉语词典>是目前使用较广的一部词典.通过对其中成语的分析,认为:现当代产生的成语应注意其词义的双重性,应以常用习见的词形作主条.对现代汉语词典如何收录成语有帮助.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号