首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 593 毫秒
1.
藏文文本自动校对系统开发研究   总被引:2,自引:0,他引:2  
文本自动校对在自然语言处理领域中有着广阔的应用前景.文章通过比较分析国内外文本自动校对系统的发展现状,提出了设计现代藏文文本自动校对系统的两种方案,并就第二种方案研究了现代藏文文本自动校对系统的结构和功能设计.  相似文献   

2.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,文章提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。  相似文献   

3.
文章描述藏文文本校对在国内外的发展现状,并借鉴国内外自动校对技术及算法研究的最新成果,提出基于词的藏文文本校对模型的研究方案。针对藏文文本的复杂特征和容易出现的错误状况,提出了统计与规则相结合的校对方案。  相似文献   

4.
音节字是构成藏文文本的基本单位,也是整个现代藏文自动校对的基础。音节字校对的结果直接影响词校对的正确率,从而对词、格助词、句法和语义校对等产生重要影响。文章以语料库统计得到的藏文音节字字表、二元同现表和纠错建议表等作为语言知识库,以藏文音节字的错误类型为依据,设计了字表匹配和查找同现概率为侦错方法、用纠错建议表进行纠错的音节字校对系统。  相似文献   

5.
现代藏文自动校对中,对音节字( )的校对是其基础。在藏文文本中音节字是用音节点进行间隔的,由于藏文二维的书写特征和音节字形成过程中与其构件之间严格的搭配规则等诸多问题,使得对它的校对又区别于任何一种文字。文章介绍了音节字的构件、结构和搭配规则等问题,列举了藏文音节字中的错误类型,并针对其特殊性给出了一个特有的音节字校对的流程和方法。  相似文献   

6.
文章以框架语义学为理论基础,以消息域为研究对象,探索藏文自然语言处理中藏语框架语义分析的理论和方法,探讨了用框架描述消息域的知识方式,并用语义框架项的描述及消息域框架间的层级关系设计了藏文消息域框架语义系统,为藏文典型实例的分析提供支撑.  相似文献   

7.
藏文文本资源的收集对藏语信息处理研究有着至关重要的作用.文章在分析国内外藏文网页主要编码方式的基础上,提出了藏文网页的编码识别、自动获取与过滤,文本编码统一转换的算法.系统主要包括网页编码识别网页、自动获取、文本过滤、编码转换等几个模块.在windows平台下对系统的测试结果良好,为藏语电子文本的收集和整理提供了方便、快捷的平台.  相似文献   

8.
张同玲  祁坤钰 《科技信息》2011,(17):191-191,199
本文通过藏语语法知识和藏汉两种语言对句子概念的对比,将藏语单句划分,并进一步进行了细化。其利于藏文校对,信息检索、双语对译、自动分词、搜索引擎等信息技术的不断发展。  相似文献   

9.
自组织时分多址接续系统的吞吐模型   总被引:2,自引:0,他引:2  
基于自组织时分多址接续协议的自动相关监测技术即将全面应用于空中和海上交通管制领域,研究了误码自组织时分多址接续系统动态预约的影响机制,提出了用于描述有扰信道中自组织时分多址接续系统吞吐特性的马尔可夫随机过程模型,并导出自组织时分多址接续系统吞吐率的算法。  相似文献   

10.
首先对现有的中文文本自动校对技术进行了分类研究,并在此基础上,结合二元语法模型、散串技术和校对候选矩阵方法,提出了一种基于窗口技术的校对方法。该方法先利用词间字接续方法和散串技术来定位疑错窗口,然后在疑错窗口内,依据由可信度增量构建的校对候选集对窗口内的疑错字串进行最终的定错和纠错。  相似文献   

11.
文章在win8操作系统支持下,设计并实现了基于音节的现代藏文文本校对功能。通过分析和研究藏文音节的拼写规则,对传统藏语中的音节拼写规则进行了详细的形式化描述。采用统计方法对藏语音节的搭配规则做了探索性的研究,创建了音节搭配规则知识库,以这些知识库为基础进行音节模式匹配查错,创建了音节规则校对模型,运用音节规则模型实现现代藏文文本的音节级校对功能。  相似文献   

12.
Generally, text proofreading consists of two procedures, finding the wrongly used words and then presenting the correct forms. At present, most of the Chinese text proofreading focuses on finding the wrongly used words, but pays less attention to correcting these errors. In this paper, the Chinese text features are interpreted first and then a Chinese text proofreading method and its algorithm are introduced. In this algorithm, text features, including text statistical feature and language structure feature, are properly used. Here, correcting errors goes on at the same time with finding errors. Experimental results show that this method has a performance of detecting 75% of wrongly used Chinese words and correcting about 60% of them with the first candidates.  相似文献   

13.
Generally, text proofreading consists of two procedures, finding the wrongly used words and then presenting the correct forms. At present, most of the Chinese text proofreading focuses on finding the wrongly used words, but pays less attention to correcting these errors. In this paper, the Chinese text features are interpreted first and then a Chinese text proofreading method and its algorithm are introduced. In this algorithm, text features, including text statistical feature and language structure feature, are properly used. Here, correcting errors goes on at the same time with finding errors. Experimental results show that this method has a performance of detecting 75% of wrongly used Chinese words and correcting about 60% of them with the first candidates.  相似文献   

14.
提出了一种改进型疑错窗口方法,同时基于该方法提出了一种新的中文文本校对方法。该方法预先用窗口技术初步定位可能存在错误的语段,然后再在各个疑错窗口内运用Markov模型进行定错和校对。由于该新方法较大程度地减小了校对候选矩阵的维数,因而相比传统的Markov模型,该方法有更小的计算复杂度。试验结果表明,相比传统方法,新方法在时间复杂性和空间复杂性上得到了明显降低,而纠错效果基本不变。  相似文献   

15.
一种在NOVELL网络环境中使用的通用计算机中英文录入竞赛系统,由文本录入子系统、批卷子系统和考务管理子系统三部分组成,主要特点在于灵活多样的竞赛模式、快速文本智能匹配批卷、友好的界面以及方便的操作手段.  相似文献   

16.
基于LZ77算法的藏文文本压缩算法设计与实现   总被引:1,自引:0,他引:1  
随着信息量的不断增加,用计算机处理的文本文件越来越大,需要对庞大的藏文文本进行数字化处理,如何节约资源对藏文文本进行高效压缩显得极为重要。项目在LZ77算法基础上结合藏文的特点和当前文本压缩的技术主流完成了关于藏文文本压缩的设计和实现工作,按照藏文特点有效的提高了藏文文本压缩率。这种压缩算法是针对藏文特点的两个子算法和目前主流的LZ77压缩算法合成的。  相似文献   

17.
着眼于自由曲面五轴CNC加工中无干涉刀具接近方向集合的自动获取算法的研究,给出了一种基于凸包和适应性离散的采样算法,使得在干涉检查过程中,采样点的选取能适应曲面几何特征.在刀具路径的每个CC位置,自动给出可行方向的集合,减少干涉检查的人工交互,提高计算效率.该算法可以作为模具加工的并行工程框架中自动无干涉路径规划的支持工具.  相似文献   

18.
为了减少大学生完成作业过程中的抄袭问题,提高大学课程教学的过程性考核效果。基于自然语言处理中常用的Simhash算法,设计开发了作业查重系统。该系统以Spring、SpringMVC、MyBatis(SSM)为开发框架,前端开发采用Bootstrap技术。先采用IKAnalyzer分词器对输入的作业文本进行分词处理,再使用Simhash算法计算文档的签名,最后通过计算汉明距离得到作业的查重结果。该系统能够对学生提交的作业进行查重,帮助教师客观地评价学生的作业完成情况,有效防止作业抄袭现象,从而营造良好的学风环境,促进学生的健康发展。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号