首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
一种改进的基于同义词替换的中文文本信息隐藏方法   总被引:2,自引:0,他引:2  
通过深入分析当前针对中文的基于同义词替换的自然语言信息隐藏算法,发现由于存在大量不完全可替换的同义词词组,经过同义词替换后可能会破坏句子的语义一致性,针对这一缺点,提出了一种改进的基于同义词替换的中文文本信息隐藏算法,该算法利用知网对同义词词组进行分类,对于不完全可替换的同义词词组,通过依存句法分析来获取同义词的上下文搭配词语,根据搭配词语判断是否进行替换,实验结果表明,该算法能有效地排除错误的同义词替换,替换的准确率达到89.1%。  相似文献   

2.
提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进K最近邻分类算法(KNN)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提出一种根据中文表达习惯的基于加权主题词的短语主题抽取算法.实验结果表明,后两种算法对短语主题抽取效果良好,平均查全率分别达到78.88%和83.39%,平均查准率达99.06%和99.70%.  相似文献   

3.
科技文献资料之间的相似度计算可以帮助人们从中挖掘更多的科学知识。但是科技文献资料中的复杂的同义词关系却明显地影响了相似度的准确性。尤其在计算生物医学科技资料时其准确度常常受到领域专业词汇的影响而降低。因此本文提出了一种基于TF-IDF方法结合生物医学同义词的文本相似度计算方法。该方法首先识别生物医学专业词汇及其同义词关系并建立同义词库,之后根据同义词权重规则修改TF-IDF中更能体现文本特征的权重值,最后计算文本的相似度。实验表明该方法有效提高了生物医学文本相似度计算的稳定性和准确度,是一种相较于传统TF-IDF更为有效的文本相似性计算法。  相似文献   

4.
关键词在自然语言处理的各个领域有着十分重要的意义.对于中文自然语言处理,一词多义和多词一义问题始终是困扰研究人员的一个重大难题.传统的一些基于统计的方法,诸如KEA只是机械地统计了词频,而没有考虑词之间的关系.文中提出了一种基于同义词的中文关键词提取方法SKEA,并建立一阶隐马尔可夫模型进行词义消歧,将文本从稀疏的词空间映射到语义空间,从而实现了文本的降维.同时改进了KEA的位置权重公式,并提出新的关键词特征选取项.最后对SKEA方法和KEA方法进行比较实验,证明SKEA是一种更优秀的中文关键词提取方法.  相似文献   

5.
基于同义词词林的中文文本主题词提取   总被引:3,自引:0,他引:3  
中文文本主题词的提取可以浓缩一篇文章,可以提炼一个中文网页,还可以帮助实现网上广告与网页的精确匹配。提出了一种基于同义词词林的中文文本主题词提取方法,不仅考虑了传统的影响主题词语权重的因素,还考虑到了同义词、相关词以及下位词的出现对于词语权重的影响。实验表明,用该方法对中文文本  相似文献   

6.
利用局部分析法,提出一种基于词语之间同义关系的查询扩展方法.该方法利用原始查询术语实现初次查询,然后利用局部分析法得到查询术语在初次查询结果集中的同义词,并实现查询扩展.实验结果表明,该方法能有效提高检索性能.  相似文献   

7.
屈松 《科技信息》2008,(13):61-61
本文阐述了利用同义词技术,对现存的数据库应用程序进行重构的方法。该方法简便易行.不用修改任何代码,由DBA直接完成.对普通用户没有任何影响。通过重构.解决了现存应用程序的安全问题。  相似文献   

8.
一种结合同义词典和词对共现距离的查询扩展方法   总被引:1,自引:0,他引:1  
为了在检索过程中全面表达查询意愿,提出一种结合同义词典和词对共现距离的查询扩展方法。横向利用同义词典方法进行扩展,发挥它的简单、高效优势;纵向利用可观察的语言事实统计上下文词对的共现距离,从而对词汇语义相关性进行精确和有效的度量,用简洁、相关的词来扩展查询词。实验表明,该方法在实际搜索引擎中有较好效果。  相似文献   

9.
基于语料库的搭配和语义韵研究为英语同义词辨析提供一个新的研究视角.文章在搭配理论和语义韵理论框架下,分析了gain和obtain在FROWN语料库中的搭配形式和语义韵特征,并探讨了搭配和语义韵研究对同义词辨析的作用.研究发现:(1)词语的搭配关系是人类认知的反映,语义韵是认知规律性的体现;(2)搭配是词义引申的一个重要...  相似文献   

10.
一种基于同义词词典的模糊查询扩展方法   总被引:2,自引:0,他引:2  
在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法. 为此,提出一种基于同义词词典的模糊查询扩展方法. 该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0, 1]使用Tanimoto系数获得. 利用该词典,能够进行较好的查询扩展. 将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度. 所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统的检索性能有一定改善.  相似文献   

11.
传统的互信息特征选择方法受边缘概率的影响较大, 可能产生稀有词的概率评估分高于常用词的评估分, 从而导致倾向于选择低频词条的现象。为此,在分析了几种传统的特征提取方法基础上, 通过引入分散度及平均词频两个参数, 将互信息方法与特征的词频相关联, 从而使互信息的分类更加准确。实验结果表明, 该方法使分类效果更好。  相似文献   

12.
魏峻 《河南科学》2015,(1):58-64
DNA微阵列数据通常含有成千上万个基因,其中含有大量与分类无关的基因和冗余基因,这些基因的存在会严重影响分类精度和效率.针对这一问题,提出一种基于改进的和声搜索算法的特征基因选择方法,首先采用Relief F算法对微阵列基因数据集排序,取排序靠前的N个基因构成初选基因子集,然后再利用改进的和声搜索算法选择特征基因.通过在3个公共微阵列数据集上的仿真实验,结果表明,该算法能够在更少的特征基因情况下达到很高的精度,是一种有效的特征基因选择算法.  相似文献   

13.
曾朝  彭黎 《科学技术与工程》2007,7(19):5160-5162
在人脸特征提取与选择方法的研究中,提出了以Zl-Zr法为基础,通过对特征分量判据J的计算,不断通过交替增加或剔除特征来得到优化解。同时,为了解决该方法存在的特征分量相关度和计算复杂度的问题,使用K-L变换法对n维原始特征组成的向量进行线性正交变换,以使特征在一个新的空间内不再相关。进而,再通过调整参数使得在进行特征选择时的计算复杂度大幅降低,使该方法的实用性提高。  相似文献   

14.
有效提取特征有利于提高后续人体动作识别的准确率。针对人体动作识别时方向梯度直方图(histogram of oriented gradient,HOG)特征维数过高和相似动作不好区分的问题,提出一种基于特征优选和图像相似度的人体动作识别算法。实验对比三种降维方法主成分分析法(principal component analysis,PCA)、PCA+Pearson、PCA+Spearman处理后的动作识别率,证明PCA+Pearson相关系数的降维效果最佳。同时将全局特征八星模型与降维后的局部特征HOG特征组合在一起全面表征人体动作,并计算相邻两帧图像相似度,自适应分配一个判别周期内单帧支持向量机分类结果的统计权值,最后二次分类人体姿态识别结果。在标准数据集KTH上进行实验,该算法识别准确率为94. 5%,较其他方法有所提高,在视频人体动作识别领域有较好应用价值。  相似文献   

15.
特征提取是进行模式识别的关键环节,利用稀疏分解将信号表达为具有一定结构特征的原子组合,为提取信号内部特征信息提供了一种有效途径.本文提出基于改进量子进化算法的稀疏特征提取方法,利用改进量子进化算法的并行性和全局搜索能力,使信号在过完备的原子库上实现快速精确的稀疏分解.对过完备的原子库进行量子比特概率幅编码,通过量子比特的交叉进化-变异操作更新原子库,以信号残差与原子的内积作为量子进化目标函数,筛选出最具信号结构特征的原子,凭借稀疏重构实现信号的特征提取.仿真信号和故障轴承振动信号的稀疏特征提取结果表明了所提方法的有效性和优越性.   相似文献   

16.
基于小波纹理特征的医学图像检索   总被引:2,自引:0,他引:2  
为了缩小图像高层语义与底层特征之间的鸿沟,提出了一种基于共生矩阵的图像纹理特征提取的新方法.该方法结合了图像的频域统计特征和空间分布特性,首先通过小波变换提取图像的局部频域信息,然后结合图像的整体结构特征,构建用于提取图像纹理特征的小波灰度共生矩阵.通过对比实验表明,与分别使用其他灰度共生矩阵和小波特征相比,基于小波灰度共生矩阵的纹理特征提取方法在医学图像检索中取得了更好的效果.  相似文献   

17.
由于传统系统受到网络时延和信号干扰的影响,导致系统监测效果较差,提出了基于改进特征选择法的移动通信网络流量异常监测系统.利用报警装置对异常数据进行警示,并通过显示模块显示监测结果,解析全部网络流量特征.根据特征选择流程,获取网络流量异常特征,实现对异常网络流量的实时监测.提取异常流量并展开分析,采用改进特征选择法对异常流量进行选择,由此实现移动通信网络流量异常监测系统的设计.实验结果显示,该系统最高监测准确率可达88%,保证移动通信网络能在安全稳定条件下运行.  相似文献   

18.
为解决图像检索中单一特征检索性能不佳、多特征融合耗时的问题,提出了一种新的融合颜色特征和形状特征的图像检索方法。检索过程分为两个阶段:首先对图像进行圆环分块,提取图像整体和各圆环子块颜色特征向量,以特征向量间距离大小为准则对图像库分类;然后在类内提取图像的ART形状描述符作为形状特征进行相似性度量以实现检索。形状特征提取只在某一类内进行,减小了运算量,同时弥补了颜色特征对图像空间信息丢失的不足,提高了检索准确率。仿真实验取得了较好的检索效果。  相似文献   

19.
一种基于特征选择的入侵检测方法   总被引:1,自引:0,他引:1  
针对入侵检测中网络数据高维度、 大规模所带来的问题, 基于特征选择方法Fisher在网络安全数据集中的应用, 提出一种基于特征选择的通用入侵检测框架. 该方法通过提取关键特征, 降低安全数据的维度; 采用K近邻方法作为分类器, 验证特征选择后的检测效果. 实验结果表明, 该方法能在较少特征的情况下达到较高的检测率, 具有较好的可行性.  相似文献   

20.
特征选择在模式识别技术中起着非常重要的作用,用信息论的方法进行特征选择还是一个新课题.MIFS和MIFS-U是两种用信息论方法进行特征选择的近似算法,MIFS和MIFS-U算法都有一个考虑输入特征之间信息冗余的权重系数,MIFS-U算法还有一个条件限制.当条件不满足或权重系数取值不合适时,这两种算法的特征选择性能就会下降.通过研究这两种算法,借助互信息的概念提出一种新的信息论特征选择算法MIFS-D.和MIFS、MIFS-U算法相比,MIFS-D是一种更精确的算法,去掉了限制条件和权重系数.将3种算法应用于几个分类问题,结果表明MIFS-D算法具有相对更好的特征选择性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号