首页 | 本学科首页   官方微博 | 高级检索  
     

基于指纹和语义特征的文档复制检测方法
引用本文:李旭,赵亚伟,刘国华. 基于指纹和语义特征的文档复制检测方法[J]. 燕山大学学报, 2008, 32(4)
作者姓名:李旭  赵亚伟  刘国华
作者单位:1. 燕山大学信息科学与工程学院,河北,秦皇岛,066004
2. 石家庄信息工程职业学院,河北,石家庄,050032
摘    要:文档复制检测是保护知识产权、提高信息检索效率的有效手段.提出一种基于指纹和语义特征的文档复制检测方法.介绍了指纹提取算法以及相关的重叠度度量,并且以知网的概念描述为基础对文本进行语义分析,利用词类信息和语义规则进行歧义消解,并采用基于框架的层级表示方法描述句子的语义特征.在3种测试集上把该方法与现存的方法在检测准确率上进行比较,实验结果表明该方法能够有效地检测出各种方式的复制文本.

关 键 词:复制检测  文档表示  指纹  语义特征  重叠度

Document copy detection method based on fingerprint and semantic feature
LI Xu,ZHAO Ya-wei,LIU Guo-hua. Document copy detection method based on fingerprint and semantic feature[J]. Journal of Yanshan University, 2008, 32(4)
Authors:LI Xu  ZHAO Ya-wei  LIU Guo-hua
Affiliation:LI Xu 1,ZHAO Ya-wei 2,LIU Guo-hua 1 (1. College of Information Science , Engineering,Yanshan University,Qinhuangdao,Hebei 066004,China,2. Shijiazhuang Information Engineering Vocational College,Shijiazhuang,Hebei 050032,China)
Abstract:
Keywords:copy detection  document representation  fingerprint  semantic feature  overlap  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号