首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 50 毫秒
1.
一种改进的MM分词方法的研究与实现   总被引:1,自引:0,他引:1  
在最大匹配法(Maximum Match)“长词优先”原则的基础上,提出了一种改进的最大匹配(MaximumMatch)自动分词方法,并给出了相应的算法及词典设计。  相似文献   

2.
中文自动分词技术在中文信息处理、Web文档挖掘等处理文档类研究中是一项关键技术,而分词算法是其中的核心.正向最大匹配算法FMM( Forward Maximum Match)具有切分速度快、简洁、容易实现等优点,但是还存在分词过程中设定的最大词长初始值固定不变的问题,带来匹配次数相对较多的弊端.针对此问题提出了根据中文...  相似文献   

3.
本文提出了一种基于最大匹配快速中文分词算法的改进算法。通过对最大匹配分词算法做出改进,从而解决了最大匹配快速中文分词算法所不能解决的一些问题,并得出较准确的粗分结果。结合本人主持开发的《长春市市长干公开电话之中文分词系统》的项目实践,对系统海量信息的处理起到了关键作用,  相似文献   

4.
通过研究和分析现有最大匹配分词算法,词库结构的设计和分词算法直接关系着分词的速度和效率,提出了一种改进的最大匹配分词算法--基于双字词的动态最大匹配分词算法,设计并实现了汉语分词词库和算法.实验结果表明,此算法相对于现有最大匹配分词算法有显著提高.  相似文献   

5.
建立了二部图C=(V,U,E)的二级优先匹配规则,在此规则下,用改进的深度优先搜索对匹配算法进行改进,使得算法能够根据连通分量的个数动态优化算法的性能,使动态最大匹配算法的时间复杂度提高到0(max(|V|,|E|,m|E|)).  相似文献   

6.
汉语分词中一种逐词匹配算法的研究   总被引:1,自引:0,他引:1  
提出了一种改进的运词匹配算法.该算法通过对非歧义字段切分,对人名地名进行判别,以及对伪歧义字段进行处理,使交集型歧义字段切分正确率有了大幅度提高.在5万汉字语料开放测试中,交集型歧义字鼹切分正确率可达98%以上.  相似文献   

7.
基于最大概率分词算法的中文分词方法研究   总被引:1,自引:0,他引:1  
丁洁 《科技信息》2010,(21):I0075-I0075
本文提出了一种基于最大概率分词算法的中文分词方法,以实例贯穿全文系统描述了最大概率分词算法的基本思想与实现,根据针对大规模真实语料库的对比测试,分词运行效率有较大提高,该方法是行之有效的,并且提出了该算法的改进方向。  相似文献   

8.
针对序列模式挖掘中, 频繁子序列个数随模式长度增加而爆炸性增长的问题, 提出一种从序列数据库中挖掘最大频繁序列模式的新算法(MFSPAN). MFSPAN充分利用不同序列可能具有相同前缀的性质来减少项集比较次数. 在标准测试数据集上的实验结果表明了MFSPAN的有效性.  相似文献   

9.
对数据库受限汉语自然语言查询语句进行分渊处理.分词算法分为两个部分,第一部分对最大匹配法进行改进,改进的核心思想足体现整句长词优先的原则,改进后的算法能够减少切分歧义;第二部分根据实例数据库的查询需要处理姓名和不稳定的属性值两类未登录词,未登录词的识别对后续句子的理解起着至关重要的作用.  相似文献   

10.
匹配理论是图论中一个重要的分支,已被广泛地应用于许多领域,如组合优化、线性规划、人工智能和矩阵论等.给出一个求解多部图的最大匹配算法,并用仿真例子说明其实用性和有效性,此算法为解决复杂的指派问题开辟了新途径.  相似文献   

11.
针对SIFT特征匹配算法在特征空间中进行历遍搜索,匹配速度慢的问题,提出一种金字塔层间匹配算法。首先,根据特征点所处金字塔层不同将特征点划分为不同的集合,其次,选择待配准图像金字塔中某一层集合,在基准图像金字塔中寻找相似层,并确定待配准图像金字塔与基准图像金字塔层之间的相似关系,最后,在相似层之间寻找匹配点。待配准图像中的选择层集合由金字塔底层到顶层,寻找相似层所用时间依次缩短。与原算法相比,该算法具有相同的旋转稳定性。将该算法与原算法分别应用实际图像配准中,结果表明:可见光图像配准中,匹配速度提高了3.2倍,正确匹配率提高了10.3%,红外图像配准中,匹配速度提高1.4倍,正确匹配率达到100%。  相似文献   

12.
基于图像视差的三维扫描技术中,计算样本外形需要从存在干扰的图像中寻找匹配对应点,提出一种镜像立体匹配改进算法,处理场景存在镜面的情况下物体和镜像的点点对应问题.新算法通过计算像素点与其邻域的灰度值之差,结合变权构建多维判别向量,通过判断物体空间和像空间中对应点的多维向量夹角的大小,来确定两个像素是否匹配.实验结果表明,相比传统的SAD,NSAD,SSD,NSSD立体匹配方法,新算法能够更好地处理有衰减模糊和色差的图像匹配问题,提高重现物体的几何外形精度.  相似文献   

13.
一种改进的点模式指纹匹配方法   总被引:3,自引:1,他引:3  
自动指纹识别因其在身份认证方面所具有的方便、快速、准确等特点而得到了广泛的关注,而指纹匹配算法的研究又是其中一个非常重要的研究内容.针对基准点定位困难的问题,提出了一种根据特征点集合中3个近邻点所组成的子集之间的相互关系来确定基准点以及变换参数的算法.实验结果证明,该算法可以快速、准确的定位基准点,精确求取变换参数,指纹匹配的速度和准确率可以满足实际应用的需要.  相似文献   

14.
字符匹配效率是很多计算机应用系统的性能瓶颈,研究设计高效的匹配算法有助于提高相应系统的应用性能。在分析典型Sunday匹配算法的基础上,对其进行了较为有效的改进。改进算法在字符串匹配前先计算模式串的倒序特征值,也就是以此计算出模式串的最后s个字符在本模式串中倒序除自己以外的下一次出现的位置。每一次字符匹配都采用倒序匹配并利用这种匹配的结果,匹配结果结合倒序特征值可以直接决定特征串的下一次位移数。在进行完一次字符匹配后,采用增加一个遍历字符的Sunday算法来遍历模式串以计算下一次位移数,以此尽可能地排除无效匹配。实验结果表明改进算法的效率比Sunday算法有一定提高。  相似文献   

15.
基于多关键字匹配的Sun Wu算法进行的分析,结合Qs算法的思想,设计了一种改进的多关键字匹配算法:QMS(quick multi-pattern searching)。算法使用散列技术和前缀表减少发生部分匹配时实际进行的关键字比较次数。在计算跳跃距离时,充分考虑当前窗口的紧邻下一个字符带来的信息,进而使用更加精确的跳跃距离计算方法以获得更大的平均跳跃距离,从而获得更高的扫描效率和空间利用率。在真实文本上的对比实验表明,在通常应用环境中,该算法显著的缩短了扫描时间,取得了很好的效果。  相似文献   

16.
一种改进的SIFT特征点匹配算法   总被引:1,自引:0,他引:1  
提出一种改进的SIFT特征点匹配算法.以提高图像特征点匹配算法效率为目的,研究了SIFT特征点描述子基于欧氏最小距离测度的匹配算法.由于SIFT特征点检测算法检测到的特征点数量较大,且每个特征点描述子都是128维的向量,而基于欧氏最小距离测度的匹配算法要求,待匹配第一幅图像的每个特征点要和待匹配第二幅图像的所有特征点求距离,排序后寻找极值,这导致了算法效率较低.依据光学成像理论和双目视觉理论,由第一幅图像每个特征点的坐标,从行列两个方向缩小第二幅图像待匹配特征点坐标的搜索范围,在保持匹配精度的基础上,提高了算法的效率,算法速度约是原算法速度的2.7倍.  相似文献   

17.
目前的入侵检测系统大多是基于特征的,系统的性能瓶颈在于模式匹配算法的执行效率.在探讨几种典型的模式匹配算法的基础上,提出了改进的BMH算法.该算法通过取文本串中的两个连续字符计算偏移量的方式,减少了匹配的次数.实验结果证明匹配速度得到了一定程度的提高.  相似文献   

18.
为提高入侵检测系统整体的性能和效率,在研究经典的WM(Wu-Manber)多模式匹配算法的基础上,提出一种改进的WM多模式匹配算法.该算法使用后缀表方法,减少了匹配过程中模式字符串与文本的比较次数.实验结果表明,该算法有效提高了入侵检测系统匹配的速度和效率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号