首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 468 毫秒
1.
为了从不同的文本获取干净、有效的信息,首先要做的是删除重复的内容,而问题的核心是字段的匹配。目前大部分的字段匹配算法主要针对英文,对于中文的字段匹配算法还存在许多缺陷。为解决中文文本匹配准确度较低的问题,通过分析汉语语法的特点以及编辑距离算法中针对中文文本相似度计算时的不足,提出了一种基于中文文本的编辑距离算法的改进方法。该算法采用中文分词和基于短句的方法,解决了编辑距离算法在中文文本相似度计算时不能处理字段颠倒的情况。通过对实验结果的分析,改进后的算法明显提高了中文文本相似度计算时的匹配准确率。  相似文献   

2.
为了实现委托外部检测单位进行的化验任务中古生物代码的导入,设计了基于编辑距离算法的古生物代码匹配方法。该方法在匹配指定古生物代码时,首先计算该古生物代码与本地古生物代码库中各个代码的字符串相似度,然后按照相似度从高到低推荐给用户进行选择。为了提高匹配的效率,在匹配过程中,若找到编辑距离为0的本地代码后即为最佳匹配结果,结束整个匹配过程;此外,对实验人员手工选择的匹配结果进行缓存,以供下次快速匹配。实例分析结果表明,基于编辑距离算法的匹配方法能够精确得到古生物代码之间的相似度,达到了预期的效果。  相似文献   

3.
基于拼音索引的中文模糊匹配算法   总被引:3,自引:0,他引:3  
主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化为多个精确匹配,对精确匹配的结果按与查询串的相似程度进行排序。在实验中,将该方法应用于网页文本语料库中。在使用基于拼音改良的编辑距离度量方式时,在时间和空间复杂度增长不大的情况下,该方法取得了60.42%的准确率与50.41%召回率。  相似文献   

4.
提出了一种基于小波和动态时间弯曲(DTW)距离的时间序列索引和相似匹配方法. 该方法采用小波变换进行数据降维,利用R·-tree建立多维索引结构. 给出了查询序列的DTW距离边界和其在小波空间的查询超矩形的计算方法,从而将原始空间的基于DTW距离的相似匹配转换为小波空间基于欧氏距离的相似匹配. 证明了此匹配方法不会产生漏报,给出了基于DTW距离的范围查询算法和近邻查询算法. 实验结果表明该方法具有较高匹配精度和其较低的计算代价.  相似文献   

5.
提出了一种基于编辑距离的图像轮廓8方向Freeman链码模板匹配算法度量两个链码序列的相似度进行手写数字字符识别。通过对自备手写数字字符样本库的分类,实验结果表明该算法的有效性。  相似文献   

6.
提出一种基于空域的网格特征匹配定位算法,利用信号衰减模型,将信号空间的匹配计算变换为距离空间的匹配计算,并计算相似度,选出最邻近的目标网格,最后通过加权计算进行精确求解.该方法有效降低非线性空间匹配带来的位置相似度误差,利用网格匹配算法的思想,进一步降低了定位误差,提高了定位精度,与基于信号强度的K近邻算法和基于信号强度的网格匹配算法相比,所提出的基于空域网格匹配算法降低了定位误差,定位精度提升近10%,满足了目前室内高精度定位需求.  相似文献   

7.
为了克服当前图像匹配方法主要通过测量距离的方法来实现图像匹配,忽略了图像间的相似度,导致算法存在错误匹配较多以及鲁棒性较差的问题。本文提出了基于相似度模型耦合角度制约规则的图像匹配算法。采用FAST检测方法对图像特征进行检测,快速获取鲁棒特征点,以改善算法的匹配正确率。随后,利用SURF特征描述机制,通过计算特征圆域内的Haar小波响应值,对特征点进行描述。引入结构相似度SSIM(structural similarity index measurement)模型,将其与欧氏距离模型相结合,构造相似度模型,从结构相似度与测量距离两方面出发,将特征点进行粗匹配。最后,利用特征点的余弦关系,求取特征点间角度,建立角度制约规则,对粗匹配结果完成优化。实验结果显示:与典型的匹配方法相比,该算法具有更好的匹配性能较好,在多种几何变换下仍具有理想的匹配精度。  相似文献   

8.
针对中文医药类网络文本的不规范性引起的药名实体识别性能下降,提出基于层次结构的多策略方法。首先使用条件随机场模型结合改进的最大匹配算法识别药名实体,然后在此基础上对其中的不规范药名实体利用最小编辑距离方法规范化药名实体并扩充药名词典。实验结果表明,改进的最大匹配算法结合统计模型有效地提升了药名实体识别的性能,同时为药名实体规范化扩展提供了新的思路。  相似文献   

9.
为解决传统极限距离立体匹配算法在深度不连续区域,以及光照差异增大时出现匹配误差大幅升高等问题,提出基于自适应权重极限距离变换的立体匹配算法。在Delta-Gama对数空间下,该算法首先根据初始匹配结果计算立体图像对Gama校正系数,基于光照差异修正极线距离变换相似度函数带宽,其次基于权重相似度自适应选取极线端点,确定分割系数;最后利用置信度传播算法计算视差图。实验结果表明,本文算法能够有效提高深度变换区域的匹配准确度,同时有效降低光照差异图像的误匹配效率。相对于当前先进算法,本文算法的匹配率比当前先进算法提高至少40%。  相似文献   

10.
提出了一种基于统计方法和分词的匹配模型,该模型能够根据简称找出最可能的全称。这一模型由三个部分组成:针对不同类别的全称,对兴趣点全称进行分类,将全称划分成机构、公司、行业、区域和未知五类单词;把单词按照长度分为六类,然后在此基础上建立隐马尔可夫统计模型;在越频繁使用的全称越有可能产生简称的假设下,建立一个流行度统计模型。实验表明上述模型的首选准确率达到近85%,比现有搜索引擎的匹配能力有了显著的提高。  相似文献   

11.
文章针对图像自相似或具有对称性时SIFT匹配稳定性不高的问题,研究基于Harris尺度不变特征的图像匹配方法.为了获取更稳定的特征点,将SIFT特征描述方法引入到Harris尺度不变特征描述中,改进了基于Harris特征的匹配算法;结合简单高效的基于欧氏距离的双向匹配算法,去除了大部分的错误匹配,明显提高了匹配的稳定性...  相似文献   

12.
为解决在深度不连续区域传统极线距离立体匹配算法,光照差异增大时出现匹配误差大幅升高等问题,提出基于自适应权重极线距离变换的立体匹配算法。在Delta-Gama对数空间下,该算法首先根据初始匹配结果计算立体图像对Gama校正系数,基于光照差异修正极线距离变换相似度函数带宽,其次基于权重相似度自适应选取极线端点,确定分割系数;最后利用置信度传播算法计算视差图。实验结果表明,所提算法能够有效提高深度变换区域的匹配准确度,同时有效降低光照差异图像的误匹配率。相对于当前先进算法,所提算法的匹配率比当前先进算法提高至少40%。  相似文献   

13.
根据图像几何变换的单应性矩阵将匹配点一一对应的特点,提出一种基于单应性矩阵的剔除方法.该方法首先利用SIFT进行匹配,得到初始匹配对,进行初步筛选,然后利用相似三角形求出基准单应性矩阵,设定阈值,剔除不满足阈值的匹配点对,最后得到精确匹配点对.通过与RANSAC算法以及结合欧式距离的RANSAC改进算法进行实验比较,该算法具有更高的正确匹配率.  相似文献   

14.
针对现有产品实例检索方法存在的问题及概念产品结构的特点,提出了一种基于路径集的微机电系统(MEMS)产品实例检索方法,通过关键元部件及其拓扑关系建立产品结构树,并转化为相应的产品路径集,以产品路径集的编辑距离来衡量产品实例相似度大小.文中首先提出了产品路径集及其编辑操作的定义,建立了基于产品路径集的加权编辑距离计算模型;然后根据路径集编辑操作的原则提出了产品路径对编辑距离算法,以此为基础提出产品路径集编辑距离的计算方法和流程,实现对MEMS产品实例结构的相似度评价;最后以微机械滤波器的实例检索为例验证了该方法的有效性.  相似文献   

15.
尺度不变特征变换SIFT由于其良好的性能在图像匹配中具有广泛应用,但传统的SIFT特征匹配结果中仍然会包含不少的错误匹配.提出了一种基于多种几何约束的误匹配剔除算法,该方法利用匹配点对之间多种几何约束的组合来识别并剔除错误的匹配,具体包括方向角算法、邻域信息算法、点线距离算法和局部相似三角形算法.实验结果证明:这一基于组合策略的方法能有效地剔除错误匹配,并且极大限度地保留正确匹配.  相似文献   

16.
针对目前基于语义的服务匹配系统中的匹配方法存在对同一等级概念区别不清的问题,采用Web Services和语义Web技术,提出了一个基于UDDI和OWL-S的服务匹配模型,即对传统服务匹配模型的UDDI中引入语义化服务描述和基于数值计算的语义匹配功能.并综合利用基于几何距离和基于信息容量两种语义相似度算法的优点,设计了一种综合语义匹配算法,最后通过实验验证了该方法的优越性.  相似文献   

17.
基于邻接距离属性动态聚类算法采用能综合反映属性名称相似性和语义相似性的“邻接距离”,提高了属性匹配的准确率;以类内损失、类间损失之和最小化为准则,使用动态聚类算法对相似属性进行匹配,不需要设置聚类参数,避免了人为造成的误差。  相似文献   

18.
在计算机无纸化考试中,自动评分的设计与实现是最重要也是最难的一个环节.编辑距离算法通过统计替换、删除、插入、交换操作来计算两文本间相似程度,应用到文本匹配类的自动评分中具有较高的信度.在分析默写题评分需求的基础上,对编辑距离算法做出了相应的改进,提高了相似度计算的精度,并通过回溯的方法,实现了评分过程的反馈.实际应用的数据表明,该方法在汉字评分中具有普适性.  相似文献   

19.
针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务, 使用CCF提供的新浪微博数据作为训练和测试数据, 利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具, 提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法, 提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF 中文微博实体链接评测任务中正确结果的准确率为0.8838, 在10 个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。  相似文献   

20.
为了提高中文分词算法的切分速度和存储效率,提出一种基于对偶编码的特征匹配算法。由中文分词的字符集和字符相邻关系提取特征值,根据此特征值在中文分词词典中进行快速匹配,基于字符的位置相邻关系提取特征值,支持模糊匹配,因此无需对多字词进行单独匹配,从而有效节省匹配时间。实验仿真表明,该算法可以降低特征存储空间,有效提高中文分词精度和效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号