首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
统计与规则相结合的藏文句子自动断句方法   总被引:1,自引:0,他引:1  
 藏文句子断句是藏文信息处理领域的难点之一,也是藏汉机器翻译、藏文文本分类等工作的一项重要基础性研究.提出了一种统计与规则相结合的藏文句子自动断句方法以解决藏文标点符号功能的歧义问题,实验结果表明该方法具有比较好的效果,F1值达到98%以上.在规则中首先使用经验的方法,识别出不确定的藏文句子作为候选句子,然后采用基于关联词的复句分析方法进行分句合并形成二次候选句子;最后使用最大熵的方法对二次候选句子进行断句.经验方法和复句分析有效解决了最大熵算法无法触及的语料稀疏和分句问题.  相似文献   

2.
给文言文断句,是阅读文言文最基本的能力.最近两年的高考文言文断句这一题型,分值有所提高,似有愈演愈烈之势.因而,在高考备考中,这一考点是不容忽视的.而考生在做文言断句题时,还未能掌握一定的断句技巧,得分率较低.文章探析了文言文断句的几点做法.  相似文献   

3.
给文言文断句,是阅读文言文最基本的能力。最近两年的高考文言文断句这一题型,分值有所提高,似有愈演愈烈之势。因而,在高考备考中,这一考点是不容忽视的。而考生在做文言断句题时,还未能掌握一定的断句技巧,得分率较低。文章探析了文言文断句的几点做法。  相似文献   

4.
标点符号在现代汉语中扮演着重要的角色,但古代汉语中却不含有任何标点。这使得现代中国人阅读古代文献有严重的困难。该文提出一个基于条件随机场(CRF)的古汉语自动断句标点方法,并引入互信息和t测-试差两个统计量作为模型的特征。分别在《论语》与《史记》两个语料库上进行了充分实验,该方法在《论语》断句处理F 1分数上超出现有方法0.124,在《论语》标点和《史记》断句、标点处理上也取得了满意效果。实验证明:基于条件随机场的方法能较好解决古文自动标点处理问题;层叠条件随机场策略亦优于单层条件随机场策略。  相似文献   

5.
提出一种基于循环神经网络的古文自动断句方法。该方法采用基于GRU(gated recurrent unit)的双向循环神经网络进行古文断句。在解码过程中,该算法不仅利用神经网络输出的概率分布,还进一步引入状态转移概率和长度惩罚,以便提高断句准确率。在大规模古籍语料上的实验结果表明,所提方法能够取得比传统方法更高的断句F1值。  相似文献   

6.
古汉语文本信息处理和语义理解一直是自然语言处理领域的重难点之一,而断句又是语义理解中的基础任务。传统的机器学习方法解决古汉语断句问题需要基于大量的专业标注语料,过程繁琐,效果不佳。本文基于已有的BERT模型,在《四库全书》中文繁体版全文数据集的基础上构建了SikuBERT预训练模型,并将该模型迁移到《方志物产》数据中,完成了在不同数据集上的古汉语自动断句实验,实验最优F值为77.23%,比基础的BERT模型断句效果高出10.3个百分点。实验结果表明,SikuBERT模型具有较好的古汉语断句效果,且在有一定关联性数据集合中的迁移性较好。  相似文献   

7.
英语复合句是英语句子结构中最为复杂的句子形式之一,是英语长难句的主要构成部分,也是英语学习者阅读及写作提高过程中的最大障碍。文章从依存语法与配价理论视角出发,具体阐释了英语复合句断句的必要性,分析了断句的理论依据并提出了断句的基本方法及策略。  相似文献   

8.
利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题.为了解决这一难题,设计了一种六字位标记集,提出了一种基于层叠式条件随机场模型的古文断句与句读标记方法.基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察序列和低层的句子边界信息进行句读标记.实验在5 M混合古文语料上分别进行了封闭测试和开放测试,封闭测试断句与句读标注的F值分别达到96.48%和91.35%,开放测试断句与句读标注的F值分别达到71.42%和67.67%.  相似文献   

9.
虚词是汉语表达语法意义的重要手段,与现代汉语相比较,古汉语中的虚词数量更多一些,用法也更为复杂。这些虚词,除了起到他们应有的语法作用外,同时也起着标点断句的作用。由于句子中存在着文言虚词,人们一是可以通过虚词,更准确地理解文句的含义,同时还可以直接利用某些虚词给文章断句。本文就文言虚词对古文断句的影响进行了分析阐释。  相似文献   

10.
《刘知远诸宫调》中的“口中只道得得两度三回,不放了你才”句断句及说解分歧较大,根据文中多为了押韵而调换词序语序,以及现代方言口语中还保留着诸多副词后置的用法,认为诸家对“才”义求之过甚,“才”可能就是一个普通的副词,“不放了你才”是为了跟“开”、“派”押韵而调整了“才不放了你”的语序。  相似文献   

11.
许建平先生主要从三个方面提出了《金瓶梅》前八十回和后二十回(或至少第一百回)不是同一作者的问题:一是"参将"在文中的出现;二是前八十回和后二十回中清河的地理位置问题;三是第一百回的回末词。笔者针对于此进行研究商榷,提出不同的看法。  相似文献   

12.
《水浒传》是一部英雄传奇,其所叙之故事都与一定的时间相联系,故而可以按年月日顺序对其进行编次。研究《水浒传》的著名专家何心先生已对《水浒传》前七十一回中的故事进行了编年,至于七十一回之后,何心先生认为“年月日难以计算”,不可进行编年。其实小说第七十一回之后的时间线索虽不如前七十一回清晰、明确,但根据常理与小说的具体叙述进行推断,仍可确定其发生的大致时间,故而也可对之进行编年。  相似文献   

13.
王逸章句《楚辞》的动因,源于思想上与屈原的趋同性和地域上的认同感。其章句的独特方式体现在:挖掘《楚辞》的儒家思想,及所承继的《诗经》“比兴”手法,肯定屈原思想与《楚辞》价值。王逸在章句时,凸现了汉人“解经”法,不仅力图将《楚辞》纳入经学研究的范畴,还企望将《楚辞》提高到“经学”的地位,同时在思想和情感上体现了独有特点。  相似文献   

14.
蒲松龄的《聊斋志异》中涉及科举制度的篇章将近百篇,占总篇数的近五分之一。这些篇章中的主人公大多出身寒门,很多文名出众之人都屡败于科场。在蒲松龄的笔下,科举成败有诸多影响因素,然不管如何都不由自己。蒲松龄将自己的科举遭遇融入笔下,塑造了一个个鲜明的主人公形象。  相似文献   

15.
《红楼梦》中的很多重大事件都是由许许多多具体、细小的日常生活和各种小事积累而成的;这些重大事件所显示的矛盾冲突也是各种关系、各种矛盾互相作用、长期积累的结果。恰如涓涓细流汇成滔滔江河,最终形成浩瀚的汪洋大海。其高潮前面的伏笔,往往可以上溯至数回;其高潮后面的余波,常常可以延伸至下面数回。此种“草蛇灰线”的笔法,成为《红楼梦》艺术架构的重要特色之一。而宝玉挨打、《酸凤姐大闹宁国府》和《惑奸谗抄检大观园》乃是体现这种架构的代表性事件,而且这三件大事也是作品中写得最成功、最精彩,影响最深远的章节。  相似文献   

16.
依钢靠本的三基复习;重点知识,重点方法,重点技巧前挂后联的专题复习:小章节的知识查缺补漏练习;大章节的知识查缺补漏及局部综合练习:纵横交叉的模拟训练;学生的自由复习。  相似文献   

17.
汉初,《论语》出现了不同的传本。最著名的就是《古论语》、《齐论语》和《鲁论语》。三《论》在出现的先后次序上是《齐论》、《鲁论》的出现要晚于《古论》。在内容、篇次、文字的异同上:《鲁论》与《古论》除篇次不同外。篇目、内容大体相同;《齐论》比《鲁论》和《古论》多“问王”、“知道”二篇,其他20篇中“细章文句”也多于《鲁论》和《古论》;在都有的20篇中,《齐论》、《鲁论》的篇次相同。在源流上,三《论》同源而异流。  相似文献   

18.
畸笏叟在“脂批”中注明自己是《红楼梦》后四十回的作者,是他用“辛酸之泪哭成此书”。畸笏叟就是曹頫。曹雪芹去世后,是他的父亲曹頫写了《红楼梦》的后四十回。与曹頫同时代的袁枚,在《随园诗话》中明确指出,曹寅之子作了《红楼梦》。  相似文献   

19.
本文主要阐述了自然对数在高等数学课程中各个章节中的作用,由此提示高等数学理论体系的内在联系。  相似文献   

20.
通过对新闻类文体的结构分析,将新闻文体按段落划分,采用一种基于情感词典和语义规则相结合的情感关键句抽取方法,对段落内的句子进行情感分析。综合考虑情感、转折、否定、程度和归总等词语信息构建情感词典,根据规则切割新闻文本,将新闻划分为意群、句子、段落以及篇章,通过制定的规则计算情感关键句倾向值,最终获得段落以及整个篇章的情感倾向值,从而得出新闻的情感倾向。与情感词典和SVM情感分类方法的实验结果对比表明,本文方法在对新闻文本进行倾向判别时效果较好,方法具可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号