首页 | 本学科首页   官方微博 | 高级检索  
     检索      

图文文档摹本识别的一种统计方法
引用本文:董重明.图文文档摹本识别的一种统计方法[J].四川大学学报(自然科学版),2003,40(1):36-40.
作者姓名:董重明
作者单位:四川大学数学学院,成都,610064
摘    要:提出了一种使用聚类分析对批量到达的图文文档进行摹本识别的方法。首先把已读入计算机的单页图文文档转换为单色位图,给出若干互不相交的同心圆盘(圆盘的中心按页的边缘计算),计算出各轴像素密度(各圆环内“on”象素的个数)作为图形的特征向量,在页面的特征向量之间,建立一种距离,再进行聚类分析以识别文档的摹本,对从网下载的批量图形文档利用MATLAB进行多次仿真实验结果,单页文档的正确识别率达到了85%-98%。

关 键 词:图文文档  摹本识别  统计方法  轴象素密度  MATLAB  聚类分析  图像识别
文章编号:0490-6756(2003)01-0036-05

A Statistical Method on Duplication Detection of Image Documents
Abstract:
Keywords:duplication detection  radial pixel density  MATLAB  cluster analysis  
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号