首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 286 毫秒
1.
针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。  相似文献   

2.
针对复杂背景中过多的边缘信息与噪声干扰引起笔画宽度检测不准确的问题,提出了一种结合纹理背景抑制的笔画宽度变换文本检测方法.采用Butterworth高通并结合文本纹理特征,实现了在抑制背景的同时有效保留文本区域的信息.通过结合利用加权引导滤波的图像增强技术降低噪声对边缘检测的干扰,使得文本图像的笔画宽度与边缘梯度信息的提取更为准确,从而有效提升了笔画宽度变换文本检测的性能.基于ICDAR数据库的实验结果也验证了该方法的有效性.  相似文献   

3.
为解决传统算法对文本区域检测查准率较低的问题, 从自然场景文本特性出发, 提出了一种基于视觉显 著性与边缘密集度的鲁棒性文本定位方法。 首先利用谱残差理论提取图像的显著性区域, 然后在提取的显著 性区域中寻找边缘密集度大的区域, 以此构建候选连通域, 利用少量的先验信息滤除其中的非文本区域。 在标 准数据集上的实验结果表明, 与单纯利用边缘特征进行文本区域检测的方法相比, 该方法可获得 70% 的综合 检测率。  相似文献   

4.
利用局部显著文字型区域描述结合连通分量分析思路,文章提出一种复杂背景下针对场景文本稳健的文本提取算法.该算法首先通过灰度的局部显著变化和显著多方向边缘强度定位图像的显著文本区域;然后依据区域灰度变化将原始图像进行分割,获得显著区域的连通分量包括文本分量和非文本分量;接着用一个级联分类器基于字符属性滤除部分非文本连通分量,最后统计文字包围盒的边缘方向分布信息,对每个候选连通分量提取8维的特征送入SVM分类器进行验证,最终定位出文本区域.实验结果表明,这种基于显著区域提取文本的算法有效地结合了文本的区域特性和文本连通体的笔画属性,在保证文本提取正确率的同时提高了算法速度,测试结果表现出较满意的性能.  相似文献   

5.
针对基于文本内容的主题爬虫算法引入过多无关特征属性以及没有考虑出现频次不同的特征属性对相关性判定影响的不足,提出一种基于候选链接主题边缘文本的主题爬虫.使用杜威十进分类法提取锚文本关键词和与锚文本关键词词义相近的网页正文中的关键词,称为候选链接主题边缘文本.在使用朴素贝叶斯分类器进行相关性判定时,对出现频次不同的特征属性进行加权,获取的候选链接按照判定结果的大小顺序存入队列等待下一轮的访问.实验结果表明,该爬虫有效提高了相关网页获取的准确性.  相似文献   

6.
文本图像页面分割算法研究   总被引:1,自引:0,他引:1  
提出了一种基于改进纹理谱的文本页面分割算法,该算法首先采用改进的递归投影轮廓切割算法对文本图像页面进行粗分割,并提取文本图像的纹理谱特征;然后采用最小距离法将相邻纹理单元进行分类;最后实现文本图像页面文字区与非文字区的精确分割.实验表明,提出的方法在含有文字、图、表格的文本图像页面分割中效果很好,对其他复杂文本图像页面分割也具有适应性.  相似文献   

7.
提出了一种基于谐波-瞬时-残差感知子空间分解模型的音频特征提取方法.首先,根据心理声学的研究成果,提出了基于感知的谐波分子、瞬时原子和残差分布字典,可分别用于提取音频中的长时谐波成分、瞬时频率成分和残差谱分布特性;随后,利用该字典和匹配追踪算法,将音频信号分解到谐波子空间、瞬时子空间和残差子空间这三个感知子空间;最后,通过融合各子空间的特征参数生成音频特征.实验表明:在15类音效分类任务中,所提出的特征比传统梅尔频率倒谱特征准确性提升9.1%,比基于传统匹配追踪的特征提升8.3%.  相似文献   

8.
针对自然场景文本检测在复杂背景下虚警高的问题,提出利用小波变换(wavelet transform,WT)和方块编码算法(block truncation coding,BTC)相结合的方式(WT-BTC)表征文本纹理,并结合支持向量机(support vector machine,SVM)完成对候选文本区域的分类确认。算法首先利用边缘检测和启发式规则快速确定候选文本区域;然后对候选文本区域进行小波分解和BTC编码,提取水平、垂直、对角方向的WT-BTC纹理特征;使用三个SVM分类器分别对不同方向纹理特征学习训练,组合SVM模型实现候选文本区域的二次检测,确认文本区域。实验结果表明算法提高了文本区域检测鲁棒性,在复杂背景条件下对场景文本有较好的检测效果。  相似文献   

9.
为了提高英文文本移除后图像的修补效果,提出一种全自动文本移除算法。该算法基于骨架计算笔画宽度,并采用无监督连通区域分类实现文本区域检测与勾画。在文字提取后的缺损区域修复中,对传统基于样本块的修复算法进行了改进,依据边缘结构信息强弱确定边界块的合理修复顺序,采用两步搜索策略避免相似块误匹配,基于低秩矩阵填充技术提高填充区域的逼真度。实验结果表明,该算法能够准确定位文本区域,文本移除后的图像无明显篡改痕迹。  相似文献   

10.
针对自然场景中复杂的背景纹理对文本区域检测的干扰,提出了一种改进型局部二值模式(ULBP)提取算法,用于维吾尔文文本特征提取,并用获得的特征向量对候选维吾尔文本区域进行分类。本算法首先利用同质化映射来构建图像的同质化空间;然后,在同质化空间利用角点检测快速获取候选文本区域;最后,在候选文本区域里提取ULBP特征,把这些特征导入训练后的支持向量机(SVM)即可获得精确的文本区域。实验结果表明:ULBP特征对维吾尔文本区域具有较高的区分度,且能使误检率降低到8.3%,鲁棒性较强。  相似文献   

11.
针对脱机手写女书文字,在研究其细化后骨架特征和分析特征点的基础上,提出了一种对手写女书文字进行修整美化的方法。经扫描得到脱机手写女书文字,由于笔画存在一定宽度,致使细化后骨架局部发生畸变。提出一种基于畸变区、惩罚度C和n次贝塞尔曲线的自动纠正美化算法。实验结果表明,该算法能有效纠正畸变,得到无局部变异骨架,并实现批处理。  相似文献   

12.
为了提高英文文本移除后图像的修补效果,提出一种全自动文本移除算法。该算法基于骨架计算笔画宽度,并采用无监督连通区域分类实现文本区域检测与勾画。在文字提取后的缺损区域修复中,对传统基于样本块的修复算法进行了改进,依据边缘结构信息强弱确定边界块的合理修复顺序,采用两步搜索策略避免相似块误匹配,基于低秩矩阵填充技术提高填充区域的逼真度。实验结果表明,该算法能够准确定位文本区域,文本移除后的图像无明显篡改痕迹。  相似文献   

13.
针对传统人脸检测方法采用空间向量对复杂环境下的高维度人脸特征进行辨识时, 存在检测效率低、 检测精度差的问题, 提出一种基于随机Fourier有监督特征变换降维算法的人脸检测方法. 首先, 通过随机Fourier映射随机形成大规模多维候选集合, 采用特征选择算法获取特征集内的最佳子集; 其次, 基于l2,1范数的极限学习机, 产生高斯核拟合效果的随机映射, 利用l2,1正规则化过滤掉人脸随机特征中的无价值及冗余特征, 并对该过程进行优化, 提高人脸特征降维的精度; 最后, 采用基于降维特征与Adaboost算法的人脸检测方法获取的降维特征, 通过Boosted级联算法获取级联分类器, 实现人脸特征的准确检测. 实验结果表明, 该方法的漏检率和误检率均为8%, 平均检测时间为118 ms, 运行效率和检测精度均较高.  相似文献   

14.
针对维吾尔文手写体文本中行分割问题,该文根据维吾尔文字包含区分字母的诸多点笔画和附加部分的特点,对文字主体笔画部分采用分段式前景涂抹算法,并将涂抹后图像的前景部分进行细化运算,通过细化线条与原图像的叠加、着色处理获取主体文本区域定位;然后通过重心辐射扫描的方法,解决了剩余细小笔画的文本行归附问题。实验结果表明:该文方法与常见的水平投影、分段式投影与基于涂抹方法相比具有更好的行分割效果。  相似文献   

15.
在线性判别的基础上提出了一种基于脊波变换的线性判别分析算法,有效地解决了传统线性判别分析算法的小样本问题.首先利用Radon变换将二维人脸图像转换为投影矩阵,然后进行小波变换获取脊波系数矩阵,最后采用线性判别分析方法提取特征后作分类.在ORL人脸数据库上的比较实验结果证实了该算法的有效性.  相似文献   

16.
基于FAST关键点的增强现实跟踪注册算法   总被引:1,自引:0,他引:1  
介绍了一种基于 FAST关键点的无标志点增强现实跟踪注册算法. 算法在标定关键帧图像的基础上,对获取的视频图像,使用FAST角点探测算法提取特征点并建立相应点的SURF描述. 经过RANSAC算法消除外点后,将这些点与关键帧图像中的FAST关键点进行匹配,获取摄像机的姿态,完成系统的自动跟踪注册. 实验结果表明,算法实时性好、鲁棒性强、跟踪定位精度高,有效推动了AR在智能终端的应用.   相似文献   

17.
针对三维重建中点云特征点检测问题,提出了一种基于点云的最小核值相似区(SUSAN)特征点检测算法,并将其应用于三维重建的初始配准.首先,对待测点云进行遍历,利用kd-tree数据结构获取三维r-邻域核值相似区,计算得到点云的候选特征点;其次,使用快速点特征直方图对候选点进行特征描述并实现两幅点云特征点间的匹配;最后,利用奇异值矩阵分解法计算变换矩阵,完成两幅点云的初始配准.实验结果表明该特征点检测算法计算效率较高,产生的特征点匹配准确,可为精确配准提供较好的初始位置.  相似文献   

18.
为了实现快速谱聚类分析,设计了一种基于余弦函数和矩阵变换的谱聚类算法(CMTSC).CMTSC将余弦函数和矩阵变换技术融入到了谱聚类算法之中.利用余弦函数构造了相似度矩阵W,跳过了传统谱聚类算法中设置尺度因子的过程,随后利用矩阵变换技术实现了矩阵W的特征值分解,降低了分解的计算复杂度.在UCI数据库中部分数据集上的聚类实验和Berkeley图像库中部分图像上的分割实验,验证了CMTSC的有效性和高效性.  相似文献   

19.
研究了基于小波变换的图像文本信息提取模型,提出了一种在小波域内提取图像文本信息的算法,该算法首先对图像进行二维小波变换,设置滑动窗扫描高频子带,计算滑动窗内图像的小波纹理特征,采用k-均值聚类算法提取文本区域,再对原图像进行边缘检测,根据文本区域的相关特征精确地定位文本区域,最后将文字与背景分离.从实验结果可以看出该算法能够较准确地从背景图像中提取出不同语种、字体、大小的文本信息.  相似文献   

20.
将人工免疫及集合最近邻方法应用于人脸检测中,实现一种基于特征的人脸检测算法.首先对人脸图象进行多分辨率小波分解,用低频分量来描述人脸识别,实现数据压缩,并有效削弱光照的影响;然后对小波低频图象进行傅立叶变换,分析变换后的系数矩阵,取得人脸图象的特征向量;采用了人工免疫中的克隆选择算法,对一个人的多张不同表情的人脸图像进行训练,产生一个简约特征集合,用这个简约集合代表此人的人脸特征数据库;就待识别人脸而言,以待识别人脸到人脸数据库中各个人脸特征集合的集合最近邻作为识别结果.实验结果表明,人工免疫算法可以有效地获取训练样本的人脸特征集简约集合,再通过集合最近邻进行人脸识别,可以提高准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号