共查询到20条相似文献,搜索用时 0 毫秒
1.
针对中文文本图像的特点, 提出了一种改进的压缩算法MC-JBIG2 。该算法首先对中文字符进行多级特征提取, 然后将提取到的特征数据用于一个级联聚类算法中以替代传统 JBIG2 中的模式匹配过程。实验表明, MC-JBIG2 改进了传统 JBIG2 算法对中文文本图像压缩的不足, 能够保证在内容无损的情况下提高对中文文本图像的压缩率, 同时该算法对英文本图像的压缩也有一定的改进。 相似文献
2.
话题检测的提出是为了帮助人们从海量的新闻报道中发现未知的新话题,其中文本聚类算法的研究,是实现藏文新闻文本的话题检测技术的核心.本文提出一种聚类算法,是基于简易聚类算法的改进,首先改进了文本顺序对聚类结果产生的影响,其次通过确定种子话题,来确定话题的类别.本研究的聚类算法在较小规模的语料中比改进前源算法有一定程度的提高.本文的研究对象是藏文网站中的新闻文本. 相似文献
3.
LDA主题模型是一种有效的文本语义信息提取工具,利用在文档层中实现词项的共现,将词项矩阵转化为主题矩阵,得到主题特征;然而在生成文档过程中会蕴含冗余主题。针对LDA主题模型提取主题特征时存在冗余的不足,提出一种基于邻域粗糙集的LDA主题模型约简算法NRS-LDA。利用邻域粗糙集构造主题决策系统,通过预先设定主题个数,计算出每个主题的重要度;根据重要度进行排序,将排序后重要度低的主题删除。将提出的NRS-LDA算法应用于K-means文本聚类问题上并与传统的文本特征提取算法及改进的算法进行比较,结果表明NRS-LDA方法可以得到更高的聚类精度。 相似文献
4.
介绍Web文本挖掘的定义,描述几种特征提取方法及特点,并在主成分分析的基础上提出了SVD方法,进一步提高了Web文本的处理效率,为文本的分类、聚类以及其它处理提供了简练的特征表示方法.实验证明,该处理方法有效降低了文本特征矢量的维数. 相似文献
5.
提出了基于KFST(核Foley-Sammon变换)特征提取的KNN算法(KNNKFST):首先利用KFST来提取特征, 然后在按照特征被提取的先后关系赋权重, 再利用KNN算法进行分类. 实验表明, KNNKFST能够在大多数情况下极大地提高分类准确率. 相似文献
6.
尺度不变特征变换(SIFT)是一种常用的特征提取算法,但它采用固定的阈值来筛选特征点,匹配效果不是很理想.文中针对SIFT对不同图像无自适应性的缺点,提出了一种新的计算自适应阈值的方法,即将中介真值程度(MMTD)和SIFT相结合,用MMTD改进SIFT算法能够避免为了选取合适的阈值而进行大量的实验.采用MMTD改进阈值来筛选图像中的特征点,再将特征点进行图像匹配.实验结果表明,匹配点的数量比采用传统的SIFT方法增加了约两倍,说明文中所提出的基于MMTD的SIFT特征提取算法是有效的. 相似文献
7.
《广西大学学报(自然科学版)》2019,(6)
为对彩色图像进行快速、准确的特征提取,在分析研究彩色图像的三维参数的色彩边缘、分叉点、拐点等特征基础上,提出彩色图像的色彩边缘、分叉点的一种抽取算法,即色彩相似区域法,给出这种算法使用于色彩分布的不同情况的提取效果,给出此算法与现有常用的经典图像边缘、分叉点提取算法的对比实验及效果分析。实验结果表明:在色彩边缘较明显的情况下,色彩相似区域法比现有经典图像处理算法检测边缘效果好、抗噪声能力强、速度快等特点。色彩相似区域法算法的提出,不但丰富了图像处理算法的内容,而且为图像分割、特征提取、准确定位等提供了一种解决工具,为快速、准确的破案、手术、科研信息搜索提供了思路方法。 相似文献
8.
黄国华 《邵阳学院学报(自然科学版)》2011,8(1):29-33
特征是物体匹配和识别的依据.为提高图形图像的识别率,对曲线的特征提取进行了探索,提出了一种基于曲线相对高度的特征提取算法.算法可大致描述如下:利用曲线的高分割曲线,再分别计算各段曲线的相对高度,不断重复前面两个操作,直至相对高度满足小于某个给定的常数.对于每一个相对高度,按照分割曲线的层次存储在二叉树相应的节点.实验结果表明,该算法能够满足曲线在平移、旋转、缩放和对称变换后,其特征不变,而且具有良好的灵敏度.该算法可用于手写汉字和人脸轮廓的识别. 相似文献
9.
自动指纹识别系统(AFIS)已经成为很多安全和执法应用中一种流行的工具。许多安全和执法系统都依靠指纹图像中脊线结点和分叉点来进行指纹匹配。尽管结点和分叉点信息对于小的数据库系统来说是足够的,但它在大量的指纹图像分析中却不能提供足够的分辨信息。通过示范一种新的提取指纹灰度图像中汗孔位置的方法,介绍一种从指纹图像中获取额外的分辨信息的方法。这种信息的提取是通过实行改进的最小平方误差方法。这种算法即使应用于500点每英寸的图像上,也可以取得很好的效果。 相似文献
10.
基于自动编码器的短文本特征提取及聚类研究 总被引:3,自引:0,他引:3
针对短文本的特点, 提出一种基于深层噪音自动编码器的特征提取及聚类算法。该算法利用深度学习网络, 将高维、稀疏的短文本空间向量变换到新的低维、本质特征空间。首先在自动编码器的基础上, 引入L1范式惩罚项来避免模型过分拟合, 然后添加噪音项以提高算法的鲁棒性。实验结果表明, 将提取的文本特征应用于短文本聚类, 显著提高了聚类的效果, 有效地解决了短文本空间向量的高维、稀疏问题。 相似文献
11.
研究了一种基于统计的Web新闻文本自动摘要生成方法.首先,根据Web新闻文本的特点,对词汇和句子赋予不同的权重,然后根据权重大小按给定的比例挑选句子,并进行平滑处理,生成文字流畅的摘要. 相似文献
12.
基于改进互信息的特征提取的文本分类系统 总被引:2,自引:0,他引:2
文章提出并实现了一种改进互信息的特征提取和支持朴素贝叶斯的文本分类系统,改进的互信息算法加强了负值单词的互信息值,弥补了原来互信息预处理算法的不足,从而提高了分类精度.实验结果表明本算法和系统具有较高的分类准确率。 相似文献
13.
14.
《郑州大学学报(理学版)》2017,(4)
提出了一种改进小波变换的方法对心电信号进行检测.首先设计不同的方法对心电干扰进行消噪预处理;然后对预处理后的心电信号采用改进小波变换和窗口函数的方法检测QRS波群;最后利用MIT-BIH标准数据库中的数据对此算法的准确度和有效性进行验证.结果表明改进小波变换方法对R波峰值定位的准确度可达到99.89%,为其他波群的检测定位奠定良好的基础,对诊断心肌梗死等心血管疾病具有重要意义. 相似文献
15.
针对原始高维空间数据特征冗余的特征问题,提出了一种自适应Lasso流形规整的特征提取方法.在原始空间中的样本,经过投影后可以保持在原始空间中的近邻结构,投影到低维空间后也可像高维空间中那样相近.通过模型做完特征选择后,以这些被选的特征子集作为输入,在数据集中做了一系列的分类实验.结果表明,该算法可以精准提取高维样本集的低维流形结构,具有较小的尺寸误差递减,特征提取性能较好. 相似文献
16.
笔者介绍了CCD图像的来源,基于MATLAB对光学实验中获取的CCD图像进行了数据分析,并且采用不同的算法提取了CCD图像中的亮点和直线,根据需要计算出了两条直线之间的距离,绘制了提取亮点后的合成图.最后对使用的算法的优缺点进行了分析探讨. 相似文献
17.
网络文本分类中基于信息瓶颈的特征提取 总被引:3,自引:0,他引:3
针对网络文本特征关键词多、新词多的特点,提出了一种基于概念特征的文本分类提取方法。应用信息瓶颈法,根据关键词在不同类标号上的分布情况完成关键词聚类。在此基础上,结合概念抽取的方法,将词聚类结果映射到知网义原,并以此作为分类特征。在网络文本语料上的分类实验显示,该方法保留了基于概念特征提取方法的鲁棒性强、特征维数低的优点,但克服了概念词典中新词无定义,需要维护更新词典的不足。 相似文献
18.
基于感兴趣区域的图像情感特征提取算法研究 总被引:1,自引:0,他引:1
李琳 《太原科技大学学报》2009,30(6):446-451
随着图像检索系统的发展,现有的各种图像特征提取方法已不能很好的满足用户的需要.另外,合理组织和管理图像数据库已渐渐成为用户检索的关键所在.基于感兴趣区域的图像情感特征提取算法融合了图像感兴趣区域及非感兴趣区域权重并由提取出的图像的颜色及纹理特征得到对应的特征向量.之后利用SOM聚类分析方法实现图像加权前后特征聚类,实验结果表明,该特征提取算法提取出的图像特征向量作为聚类输入不仅可以提高聚类准确率而且更适合对实际数据的聚类. 相似文献
19.
分析了针对相似图像的几种特征提取方法的特点及局限性,提出了一种新的基于非线性回归原理的印章自适应特征提取算法.针对一组相似印章样本,通过相关分析和显著性检验,确定特征的优化选取,并给出了相应的算法,取得了令人满意的实验结果 相似文献
20.
基于Web的新闻文本分类技术的研究 总被引:1,自引:0,他引:1
从Web新闻网页中挖掘出有用的知识是当前研究的热点问题,将Web新闻网页进行解析,在此基础上进行Web新闻文本分类处理,可在一定程度上解决此问题.针对Web新闻网页的结构特点,提出了基于Web的新闻文本分类系统的实现框架.实验结果表明,基于KNN算法的分类系统具有较好的分类效果. 相似文献