首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 46 毫秒
1.
基于SIFT算法的复制-粘贴篡改检测方法中用广义2NN测试获得的匹配点对存在错误匹配,产生误匹配点,针对这一问题,提出了一种利用匹配点对间的结构相似性对广义2NN测试得到的匹配点对进行提纯,剔除误匹配点对,提高匹配正确率;误匹配点对的剔除,减少了匹配点对,使后续的聚类和几何评估操作减少了时间,由此提高了整个算法的执行效率;实验表明改进算法性能有较大提升。  相似文献   

2.
随着数字图书馆和互联网的飞速发展,数字化文档唾手可得。近年来学术剽窃现象屡见报端,互联网上日益增多的重复网页降低了检索效率,给用户带来不便。文档复制检测技术在保护知识产权和优化搜索引擎方面起着重要作用,是近年来数据库安全领域研究的热点。文档复制检测方法有两类:一是基于词频统计的方法,一是基于字符串匹配的方法。本文详尽分析了现有基于这两类方法的复制检测技术,并指出它们的优缺点,针对两类方法都存在的问题提出一些改进方案。最后总结了复制检测技术应满足的特性,讨论了检测方法的准确性和文档分解规则。  相似文献   

3.
徐德玉  王迪 《科技信息》2009,(31):49-50
本文以网上发表的文章为研究对象,通过比较,选择对文章采取分句的处理方法。以COPS原型系统为基础,改进其步骤和计算方法,以适应网上文章的复制检测,最后合并加权相似度的算法,计算文章的相似度。  相似文献   

4.
抄袭论文识别研究与进展   总被引:23,自引:1,他引:23  
抄袭论文识别研究对于净化学术风气、保护知识产权具有重要意义.国外对于抄袭论文(英文)识别技术与系统的研究已有多年历史,并取得一定进展,而国内发表的相关文献尚少.综述了抄袭论文识别技术,如数字指纹和词频统计等技术;介绍了相关识别系统,如siff、COPS、dSCAM、KOALA和Check等;分析了各抄袭识别技术特点及应用范围.最后结合中文学术论文的特点,从应用角度出发,讨论了若干待解决的关键问题及发展趋势.  相似文献   

5.
基于语义理解的文本相似度算法   总被引:26,自引:0,他引:26  
相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景.研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算.给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度.实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.  相似文献   

6.
基于指纹和语义特征的文档复制检测方法   总被引:1,自引:0,他引:1  
文档复制检测是保护知识产权、提高信息检索效率的有效手段.提出一种基于指纹和语义特征的文档复制检测方法.介绍了指纹提取算法以及相关的重叠度度量,并且以知网的概念描述为基础对文本进行语义分析,利用词类信息和语义规则进行歧义消解,并采用基于框架的层级表示方法描述句子的语义特征.在3种测试集上把该方法与现存的方法在检测准确率上进行比较,实验结果表明该方法能够有效地检测出各种方式的复制文本.  相似文献   

7.
针对代码抄袭及软件盗版现象, 研究了3种传统基于程序结构相似性检测方法, 并提出一种基于语法树的程序相似度检测方法。该方法先对源程序进行语法分析得到其语法树, 然后基于语法树重点分析源程序的语法结构并计算其相似度, 从语法结构的角度消除高级抄袭手段所带来的干扰。实验结果表明, 基于语法树的程序相似度检测方法可以较好地检测增加冗余语句、 控制结构的等价替换等10种抄袭手段。  相似文献   

8.
论文抄袭一直是学术领域重点关注和研究的问题。为了有效的检测出抄袭的情况,本文结合模式匹配算法研究设计了论文抄袭检测方法。提出采用模式匹配中的基于字符串匹配的相似度算法,通过添加、删除、替换等操作还原文档,并计算文档间的相似距离,根据相似距离获得文档相似度,从而判断文档的抄袭比例。反抄袭算法的研究实现为遏制进一步恶化的抄袭现象,净化学术风气提供了有效的监控技术。  相似文献   

9.
段落是最基本的篇章结构单位。文章按篇章功能给段落分类,描写各类段落在结构和分布上的特点,在此基础上.分析段落与段落之间的各种衔接手段。  相似文献   

10.
11.
针对传统的视频拷贝检测算法计算量大、对视频变化敏感等问题,提出一种新的视频指纹算法来产生包含时空域信息的关键帧。采用奇异值分解的方法提取视频关键帧的特征向量,对视频特征序列进行降维。改进的视频拷贝检测算法对噪声、帧平移、帧旋转、丢帧等有很好的鲁棒性。与以往的拷贝算法相比,提高了视频拷贝检测的查全率和准确率,降低了误码率,与源视频具有较高的匹配率。  相似文献   

12.
根据读者举报,比较了两篇公开发表的、内容几乎完全相同的学术论文,得出肯定有一篇论文属于抄袭的结论。  相似文献   

13.
如何快速准确地发现剽窃文本是知识产权保护中的一个核心问题.该文利用KMP算法构建了一个中文文本复制检测系统,它大大减小了复杂度,提高了运行速度.  相似文献   

14.
汇编语言程序相似性检测混合算法   总被引:1,自引:0,他引:1       下载免费PDF全文
根据汇编语言自身的特点,提出了结合属性计数和结构度量技术的相似性检测混合算法.在该方法中,将程序段的数目、子程序定义和调用的次数、循环指令loop出现的次数、转移指令出现的次数作为结构信息,73个使用频率较高的关键字作为属性信息.在从汇编语言程序中提取这些信息后,利用卡方检验来判断2个程序的相似性.实验结果表明,从混合...  相似文献   

15.
在多副本的机会网络路由算法中,副本数量多的消息发送机会要多于副本数量少的,消息发送机会的不平衡影响网络中消息投递率。针对上述问题,提出一种消息副本动态感知的机会网络路由算法;该算法根据消息产生的副本数和消息被节点接收的时间两个特征,利用接收节点所设置的接收消息的门限,控制消息的转发和消息副本的删除。仿真结果表明,该路由是一种简单有效的路由算法。与传统的传染路由和概率路由相比,该路由在消息投递率、平均延迟时间和开销方面比上述两个路由协议的性能更好。  相似文献   

16.
为了使抄纸过程的输出(湿度和基重)最大限度地接近给定值,采用BP神经网络PID控制。此控制器由PID控制器和BP神经网络组成,采用BP算法进行PID参数的在线调整,使输出值较好地跟踪了给定值,能达到较好的控制效果,并为抄纸过程的控制提供另一种思路。  相似文献   

17.
数据备份技术   总被引:1,自引:0,他引:1  
数据备份是保证系统安全运行的手段,因而采用高效率、低成本的备份技术显得越来越重要。简要介绍了计算机系统数据备份的重要性及备份的概念,常用的备份措施和技术要求。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号