首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 31 毫秒
1.
中文自动分词技术在中文信息处理、Web文档挖掘等处理文档类研究中是一项关键技术,而分词算法是其中的核心.正向最大匹配算法FMM( Forward Maximum Match)具有切分速度快、简洁、容易实现等优点,但是还存在分词过程中设定的最大词长初始值固定不变的问题,带来匹配次数相对较多的弊端.针对此问题提出了根据中文...  相似文献   

2.
基于最大概率分词算法的中文分词方法研究   总被引:1,自引:0,他引:1  
丁洁 《科技信息》2010,(21):I0075-I0075
本文提出了一种基于最大概率分词算法的中文分词方法,以实例贯穿全文系统描述了最大概率分词算法的基本思想与实现,根据针对大规模真实语料库的对比测试,分词运行效率有较大提高,该方法是行之有效的,并且提出了该算法的改进方向。  相似文献   

3.
通过研究和分析现有最大匹配分词算法,词库结构的设计和分词算法直接关系着分词的速度和效率,提出了一种改进的最大匹配分词算法--基于双字词的动态最大匹配分词算法,设计并实现了汉语分词词库和算法.实验结果表明,此算法相对于现有最大匹配分词算法有显著提高.  相似文献   

4.
考试系统基于中文分词技术的主观题评分尝试   总被引:2,自引:0,他引:2  
周振波 《科技信息》2009,(28):I0213-I0214
为了保证考试系统评分的公正性与准确性,在系统中采用了手工评定简答题的方式,但是为了在将来能够真正的实现全自动的评分,本文尝试使用了最大正向匹配法(MM法)进行分词,在识别出主观题型关键词的基础上,进行主观题批阅。  相似文献   

5.
基于词形的最佳路径分词算法   总被引:4,自引:0,他引:4  
在基于词形统计模型分词算法的基础上,通过以存词表结构的有效组织及改进词的匹配算法和切分算法,并以最佳路径法实现了一种快速的基于词形的分词算法,在保证了较高准确率的同时,大大提高了分词速度。  相似文献   

6.
马凌霄 《科技资讯》2014,(26):219-219
中文自动分词不仅是中文信息处理的基础性工作而且对后续句法分析、语义分析等中文信息处理流程有着很大的影响。本文基于最小费用最大流,提出一个具有拓展性的中文分词算法模型,实验证明了本算法能够准确地对输入文字串进行切分。  相似文献   

7.
刘勇  范丽辉 《科技信息》2012,(8):264-265
中文分词技术是一项在搜索引擎中广泛应用的关键技术,也是中文信息处理中的一项关键技术。文章通过对中文分词系统中预处理模块的改进提高了分词的速度,改进了分词系统。  相似文献   

8.
中文分词在邮件过滤系统中的应用   总被引:4,自引:0,他引:4  
针对邮件文本分词效果较差的特点,提出采用一种改进的最大匹配法来进行中文分词的方法.该方法对于普通的邮件文本和一些具有特定格式的邮件文本都可以进行有效的分词;文中还利用φ2统计法生成新词,对词典起到了动态更新的作用,提高了分词的精度和准确度.两种方法在邮件过滤系统中结合应用,使分词的误分率低于0.025.  相似文献   

9.
中文分词是中文信息处理的基础、前提和关键.通过分析已有的中文分词算法,提出了一种新的分词词典机制,并根据新的分词词典机制提出了一种快速双向中文分词算法.使用该算法可以实现快速查找和双向匹配,从而极大地提高中文分词的速度和准确率.  相似文献   

10.
基于Lucene的中文分词方法设计与实现   总被引:1,自引:2,他引:1  
本文设计实现了一个中文分词模块,其主要研究目的在于寻找更为有效的中文词汇处理方法,提高全文检索系统的中文处理能力.整个模块基于当前最流行的搜索引擎架构Lucene,实现了带有歧义消除功能的正向最大匹配算法.在系统评测方面,比较了该方法与现有方法的区别,对于如何构建一个高效的中文检索系统,提出了一种实现.  相似文献   

11.
几种基于词典的中文分词算法评价   总被引:1,自引:0,他引:1  
基于词典的中文自动分词是中文信息处理的基础.按照使用计算机缓存的优化原则,分析了几种典型的分词词典机制,指出了其中的一些问题.改进了整词二分法,极大地提高了速度.结合哈希索引和PATRICIA tree搜索算法,提出了一个综合最优化的中文分词系统.  相似文献   

12.
对活动轮廓模型存在的问题,即活动曲线收缩范围小且无法检测图像的凹陷边界,提出了一种改进的算法.先采用GREEDY近似最优算法使活动曲线尽可能地接近图像的边界,然后在图像缓变区域取一适当的递减参数对外部能量进行放大,以使活动曲线向图像的凹陷边界移动.实验结果表明该方法是有效可行的.  相似文献   

13.
讨论了灰度图象的二维最大熵阀值分割算法.根据图象象素的灰度、均值二维直方图分布的特点,给出了一个新的分割阀值判决函数.理论分析和实验结果表明:该阀值判决函数比仅使用一个二维矢量阀值具有更强的抗噪声能力,分割性能更好.  相似文献   

14.
针对传统分水岭算法分割图像后存在的细节不准确问题,提出了一种改进的分水岭算法.此算法将传统分水岭算法和概率相结合,通过有序队列来实现边界的计算,从而得到分水岭.实验证明,这种算法得到的结果更加准确,对人脑MR图像病灶区的分割非常重要.  相似文献   

15.
一种纹理图像分割的松弛算法   总被引:6,自引:1,他引:6  
利用分层马尔可夫随机场模型表征纹理图像,根据最大后验概论分布准则提出一种确定型松弛分割算法。对纹理图像进行分割的实验表明,该算法与模拟退火算法相比,明显地减少了计算时间,其分割误差与模拟退火分割误差非常接近。  相似文献   

16.
讨论了一类可变端点的最优控制问题,即状态终端为闭凸集约束的情况.利用凸锥理论,推得了最优控制所满足的最大值原理.对线性系统,还讨论了最大值原理的“几乎”充分性  相似文献   

17.
分析了传统的互信息特征选择算法的不足,针对可能赋予低频特征词过高权重的问题,利用词频、集中度这两个强信息特征指标对算法进行改进,提出了一种基于词频和文本类别的互信息改进算法(Improved Mutual Infonnation Algodthm based on Word Frequency and Text Category,简称改进的MIFC)。实验结果表明,改进的MIFC算法提取的特征空间比传统的互信息算法有更高的精确度。  相似文献   

18.
基于小波变换和动态聚类的图象分割方法   总被引:3,自引:3,他引:0  
本文讨论了一种结合小波变换和非监督动态聚类的图象分割算法。在图象分割过程中,首先用小波变换提取图象中的边缘信息,再利用所得的边缘信息和原图象的灰度信息进行聚类。实验证明了这种方法是行之有效的。  相似文献   

19.
证明了如下定理: 设f(z)=sum from n=1 to ∞(1/n)a_nP_m(z)为一整函数,P_n(z)为Legendre多项式,λ为一正数,如果(n+1~λ/n)a_n/a_(n+1)|为n的终归单增函数,则有 (α,f)<{1+0(1)}λ~(-λ-1)Γ(1+λ)e~λv(α,f)μ(α,f);■  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号