首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 100 毫秒
1.
讨论和分析了自动分词的现状,并针对分词问题,提出了一种基于规则的中文文本分词自动校对方法。该方法通过对机器分词语料和人工校对语料的对比,自动获取中文文本的分词校对规则,并应用规则对机器分词结果进行自动校对,提高分词语料的质量。  相似文献   

2.
汉语分词技术研究现状与应用展望   总被引:8,自引:0,他引:8  
汉语自动分词是计算机中文信息处理系统的基础和难题,本文对近年来的汉语自动分词的研究方法与成果进行了分析综述。探讨了分词中存在的一些关键问题,同时介绍了分词技术在科研以及商用系统中的应用。并展望了未来分词技术在应用方向的发展.  相似文献   

3.
书面汉语自动分词及歧义分析   总被引:8,自引:0,他引:8  
歧义现象是自动分词过程中不可避免的现象,本文通过对自动分词过程的分析,总结出书面汉语自动分词中歧义产生的根源,提出处理这些歧义字段的方法.  相似文献   

4.
索娟娟  于宝英 《科技信息》2012,(3):39-39,41
为了更有效的克服歧义这一汉语机器翻译的瓶颈问题,提高汉语自动分词精度,采用改进蚁群算法和灰熵对汉语的自动分词问题进行了研究。在构造分词模型的基础上,以灰熵度量分词的准确性。应用实例证明了方法的有效性。该方法对于提高我国机器翻译水平,提高我国数字化水平具有重要意义。  相似文献   

5.
罗洋 《科技信息》2009,(7):204-204,242
在中文信息处理中,汉语的自动分词是一个难点。本文对汉语自动分词的方法及已有的词典机制进行了探讨。  相似文献   

6.
基于特征词的自动分词研究   总被引:3,自引:0,他引:3  
拓展了特征词的范畴,提出了基于特征词的汉语自动分词方法,将特征词作为切分依据,采用“分而治之”的策略,以对单句或短语进行不断细分的方式来实现自动分词.由于处理单位的缩小降低了待分材料的分词复杂度,因此可以有效地提高切分的正确率.  相似文献   

7.
基于最长次长匹配的汉语自动分词   总被引:12,自引:1,他引:11  
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT),自然语言理解(NLU),情报检索(IR)等都需以自动分词作为基础。为解决分词中的歧义问题,针对歧义切分字段的分布特点,提出一种基于最长匹配原则的汉语自动分词方法,分词效果较好。  相似文献   

8.
中文是一种没有明显的形态界限可以作为分词依据的表意语言,因而在中文文本的处理中面临的第一个问题就是词语的切分问题。本文说明了汉语自动分词的必要性和困难,介绍了自动分词的三种算法。  相似文献   

9.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,文章提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。  相似文献   

10.
根据实际工作,开发了一个自动分词系统,对汉语自动分词技术在智能人机交互中的实现进行探讨.基于系统的情况,分词算法采用了最大匹配法,在词库检索中提出了化查询为直接存取的方法,提高了检索效率,节省了内存,有利于分词速度的提高.  相似文献   

11.
为解决手写汉字文本的自动切分问题,提出了一种基于动态规划的联机手写汉字分割方法.该方法根据手写笔画的结构特征、笔顺信息以及神经网络分类器给出的类概率构造代价函数,并将其分别应用于手写句子的预分割和基于识别的分割过程,然后利用动态规划算法寻找最佳分割路径.预分割在保持较低误分割率的前提下,可以有效地降低候选分割块的数量,以加速分割过程.实验结果表明,预分割的误分割率为0.57%,过分割率仅为11.1%;在未应用语言模型的情况下,最终的正确分割率为88.2%.  相似文献   

12.
基于Chan-Vese算法的自适应分等级分割方法   总被引:1,自引:0,他引:1  
针对多目标物体图像的分割问题,在Chan-Vese多相分割模型的基础上,结合分等级分割的概念,提出自适应分等级分割方法,在每一阶段分割之前能够先根据图像中的物体数量判断出所需要的Level Set函数的个数,再进行分割工作.实验结果表明,自适应分等级分割方法不仅消除了多相分割模型对初始化曲线位置敏感的不足,而且能够充分利用每一个Level Set函数,减少分割步骤,并且能提高弱边界的提取精度,是一种有效且稳定的方法,能够产生光滑、准确的分割结果.  相似文献   

13.
矿岩颗粒图像分割方法研究综述   总被引:1,自引:0,他引:1  
工业矿场中,各种矿岩颗粒的存在形式是复杂多变的,如何更好地分割各种岩块,直接影响着生产成本和设备需求。传统矿岩颗粒的分割以肉眼观察和描述为主,存在主观性差、实时性差、定量困难等问题,故将数字图像处理技术引入岩石分割研究中。针对矿岩颗粒图像分割,通过介绍传统和新型的图像分割方法,对国内已有的矿岩分割算法进行了概括总结,并对今后的矿岩颗粒图像分割方法进行了展望。  相似文献   

14.
图像分割技术的发展   总被引:2,自引:0,他引:2  
图像分割是图像处理中的一项关键技术 ,也是一经典难题 ,从发展至今仍没有找到一个通用的方法 ,也没有制定出判断分割算法好坏的通过标准 .本文对图像分割方法中的域值分割方法、边缘检测方法和区域提取方法等作了一概述 ,并介绍了一些近年来出现的各种新方法和对分割评价标准的研究情况 .最后 ,指出了图像分割技术今后的发展方向  相似文献   

15.
针对低对比度前视红外(FLIR)图像分割问题的特点,将多分辨率图像处理技术与基于模型的前视红外图像分割方法结合起来,提出了基于模型的FLIR图像的多分辨率分割方法.首先建立一金字塔结构的多分辨率图像集,然后在每一固定分辨率级别上使用基于模型的FLIR图像分割方法,并用低分辨率上的分割结果修正高分辨率上迭代的初始概率,最后在原FLIR图像中得到分割结果.该方法能得到更为精确的目标分割结果,并大大减小背景对分割图像的干扰,同时还加快了选代的收敛速度.对实际红外目标图像的分割结果证实了本算法的有效性.  相似文献   

16.
基于二维灰度直方图的最小模糊熵分割方法   总被引:2,自引:0,他引:2  
本文在一维最大模糊熵分割方法的基础上,根据图像目标和背景内部像素灰度值的一致性和集中性,提出了一种新的图像分割隶属度函数,从而得到最小模糊熵分割方法.本文还针对传统的基于一维灰度直方图的模糊熵分割方法不能反应图像的空间信息,抗噪声能力差的缺点,提出了基于二维灰度直方图的模糊熵分割算法.本实验结果证明,最小模糊熵分割方法对于某些图像的分割效果要好于最大模糊熵分割效果,而二维分割方法对于绝大多数图像,都具有很强的鲁棒性和抗噪能力,分割效果明显优于一维的方法,而且方便地推广到其他的一维熵分割方法中。  相似文献   

17.
针对印刷体维文在连体段切分部分存在过切分和漏切分的现象,结合水平投影法和连通域搜索法实现维文文本的行切分和单词切分;同时针对连体段切分正确率不高的问题,提出一种新的切分方法。首先对字母连体段位于基线上方的部分进行竖直投影来寻找所有可能的切点,然后利用阈值判定法去除误切分。实验证明,该方法提高了印刷体维文的切分正确率,为提高维文识别的正确率打下基础。  相似文献   

18.
针对基于粗糙熵的图像分割算法不能满足复杂图像的多类目标提取的需要,本文先利用K-均值聚类算法对图像进行区域分割,再利用基于粗糙熵的方法对分割结果进行目标提取,从而达到多阈值分割的目的。通过对遥感图像进行分割处理,证明了改进后算法的有效性。  相似文献   

19.
图像阈值分割技术在图像分析和图像识别中具有重要的意义,最大熵方法具有很多优点,但同时也存在弱点:需要大量的运算时间,因此需要引入优化算法,文中将遗传算法用于最大熵阈值的图像分割方法中,提出了一种基于遗传算法的最大熵阈值图像分割方法。仿真实验表明,该方法可以有效地提高最大熵图像分割的计算速度,提高图像处理的实时性。  相似文献   

20.
对于大规模的语音语料,语音切分方法主要有传统的人工切分和机器自动化切分2种方式.人工切分大规模语音语料的切分质量易控制,但效率低、成本高;机器自动化切分效率高,但后期查找切分错误时任务极其繁重.因而提出一种人机交互语音切分系统,切分人员可选择自动切分算法,设置切分参数,修改有问题的自动切分结果,同时可自动生成用于HTK训练的标注文件.以课题组采集的1 000个普米语语音文件为研究对象,以普米语孤立词为切分基元,机器自动化切分存在难以避免的切分错误,后期检查时工作量巨大;然而使用本文提出的人机交互语言切分系统进行切分,切分人员在无需高认知度的情况下也可做到近100%的切分正确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号