首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
基于加权欧氏距离度量的目标再识别算法   总被引:1,自引:0,他引:1  
针对传统欧氏距离在特征相似性度量中存在区分能力弱的缺陷,提出了基于加权欧氏距离度量的目标再识别算法.首先,针对现有目标再识别算法中目标分割易受衣着和背景颜色干扰的缺陷以及忽略人体头部特征的现象,提出了一种简单的比例分割方法,即根据VIPeR和i-LIDS数据集上目标各部件的比例统计将目标按比例分割成3部分.然后提取各部件的多种互补特征来增加其对光照变化等因素的鲁棒性.在部件特征描述过程中,文中提出了以显著性因子为权重的显著性局部二值模式(SLBP)特征来增加局部二值模式(LBP)特征对目标显著性的描述.最后综合各部件的相似性度量结果来判断目标是否匹配.在VIPeR和i-LIDS数据集上的对比实验结果显示,文中算法的目标再识别准确率优于其他算法.  相似文献   

2.
提出一种利用关系数据库系统在一般图结构的半结构化数据上进行近似查询的途径.根据嵌套结构和文本值的相似性来度量路径的相似性;根据路径的相似性得到查询目标节点与数据源节点的相似性.为返回数据源中与查询目标节点相似的节点,首先提取出数据源中长度在固定范围内的所有路径,然后利用关系数据库系统将其与查询路径进行相似性连接,并按相似度从大到小返回所有结果.为提高相似性连接的效率,引入q窗口概念,并利用若干路径相似的必要条件来减少计算相似性函数的次数.试验证明了其有效性.  相似文献   

3.
标准的模糊C均值算法(FCM)采用欧式距离测度,均等地利用所有特征来计算数据间的相似性,但其存在受局部特征影响、对非球状簇识别效果不佳、无法适应高维数据等缺点.为此,提出一种将基于差异信息理论的灰关联分析结合到FCM中的新算法,利用均衡接近度描述数据间的相似性,强调从整体上判断数据的相似程度,减弱局部特征高关联性的影响,能够适应不同形状簇的识别.在人工和真实数据集上的实验表明,所提出的新算法具有更高的聚类精度和更好的稳定性.  相似文献   

4.
聚类是数据挖掘中重要的功能算法,其主要的功能是发现数据中潜在的知识.目前文献发表的聚类算法多数仅限于处理单一数值型数据或者分类型数据,其主要原因是含有多种类型的混合型数据间的相似性很难度量.本文提出了一种混合数据相似性度量方法:对于分类型属性,利用互信息构建贝叶斯信念网络,利用贝叶斯信念网络构建关系层次,继而为层次附上距离,形成关系层次距离,而对于数值型属性则利用标准化的曼哈顿距离来度量其相似性,最后结合分类型属性与数值型属性来对整个数据集进行相似性的度量.在此基础上,设计实现了用于混合型数据聚类算法CRHD,并通过UCI中的多个数据集和已有算法进行仿真实验对比,证明了CRHD算法的有效性.  相似文献   

5.
提出了一种改进的基于空间结构约束的迭代最近点(ICP)影像配准方法.该方法通过结合特征点的空间结构相似性和特征相似性获得特征点的匹配矩阵,其中特征相似性通过特征点的局部特征描述算子进行计算,空间相似性则通过特征点的空间位置进行计算.特征点之间的空间结构相似性不仅包括了对应特征点之间的空间距离,还包含了特征点到邻近特征点的空间距离.在匹配过程中,分别从参考影像和待配准影像的角度出发,实现了匹配的对称性处理.通过对具有不同影像特征的真实遥感影像进行实验,结果表明该算法具有较高的配准精度.  相似文献   

6.
基于时空切分和词向量相似性的轨迹伴随模式挖掘   总被引:2,自引:0,他引:2  
设计了一种基于时空Hausdorff距离切分、词向量相似性的轨迹大数据挖掘方法,以准确高效地分析数据中的伴随规律,真实反映人群和车辆的流动行为。基于时序特征的一对三Hausdorff距离算法可以排除反向轨迹、挖掘伴随关系;利用时间滑动窗口切分得到的轨迹段集合可为相似性度量建立数据基础。而基于词向量的轨迹相似性度量方法,建立了轨迹和词句的类比关系,体现了轨迹的空间、时间和方向异质性,能较为准确地度量伴随轨迹在结构上的相似程度,为发现同类目标或检测频繁路径等提供参考依据。  相似文献   

7.
基于特征向量子空间距离的MPC控制器性能诊断   总被引:1,自引:0,他引:1  
针对当前MPC控制器性能评价方法无法定位性能下降源的问题,提出一种基于子空间距离聚类的控制器性能诊断新方法.新方法引入特征向量子空间描述各性能类别的特征,建立子空间距离来度量当前实时数据和已知类别数据的相似性,以距离为度量函数确定监控数据对应的类别,定位引起MPC控制器性能下降的原因.在Wood.Berry塔上的仿真结果验证了新方法的有效性.  相似文献   

8.
提出一种基于流形距离的局部线性嵌入算法,以流形距离测度数据间的相似度,选择各样本点的近邻域,解决了欧氏距离作为相似性度量时对邻域参数的敏感性.在MDLLE算法中引入最大边缘准则(maximum margin criterion,MMC)来构建最优平移缩放模型,使得算法在保持LLE局部几何结构的同时,具有MMC准则判别能力.通过正交化低维特征向量可消除降维过程中的噪声影响,进而提高算法的监督判别能力.由实验结果得到,所提出的方法具有良好的降维效果,能有效避免局部降维算法对邻域参数的敏感.随机投影独立于原始高维数据,将高维数据映射到一个行单位化的随机变换矩阵的低维空间中,维持映射与原始数据的紧密关系,从理论上分析证明了在流形学习算法中采用随机投影可以高概率保证在低维空间保持高维数据信息.  相似文献   

9.
进行GO(gene ontology)语义相似性度量是解决生物学数据集成中语义异构问题的重要方法. 传统方法主要是基于距离的度量和基于信息量的度量.文中提出了一种基于语义路径覆盖的度量方法,并实现了其中Combine算法.该算法首先计算出每个节点的信息量,然后分别计算两个节点的语义路径的交的节点信息量之和以及这两个节点语义路径的并的节点信息量之和,将这两者之间的比率作为相似性度量值.实验结果表明该算法具有较高的相关系数.  相似文献   

10.
针对待聚类的数据对象的对称性,提出了一种基于对称点距离的蚂蚁聚类算法.该算法不再采用Euclidean距离来计算类内对象的相似性,而是使用新的对称点距离来计算相似性.实验结果表明:与标准的蚂蚁聚类算法相比,该算法在处理带有对称性质的数据集时,可以更好的识别数据集的聚类数目和划分.  相似文献   

11.
多标记学习的嵌入式特征选择   总被引:2,自引:0,他引:2  
维数约减是数据挖掘领域的关键技术.传统的降维方法主要解决单标记学习问题.由于多标记学习问题的复杂性,多标记降维方法很少.直接应用未监督的降维方法到多标记学习中,忽略了类标信息.而通过分解多标记问题为单标记问题,应用现有的有监督降维方法到多标记学习中,忽略了类标间的关系.现有的多标记有监督的降维方法是基于依赖最大化的维数约简(multi-label dimensionalityreduction via depen dence maximization,MDDM),它是一种特征抽取的方法.目前还没有多标记的特征选择方法.因为在多标记学习中如何评估特征,是一个很有挑战性的问题.本文提出一个嵌入式的特征选择方法MEFS(multi-label embedded feature selection),其中采用预报风险准则作为特征的评价准则.在公开评测的yahoo网页分类数据集上进行了两个实验:(1)分析多标记学习的性能指标对特征评估的影响;(2)比较MEFS与MDDM,PCA(主成份分析),LPP(局部保留投影)的降维效果,实验显示MEFS的性能优于新近提出的MDDM等一些流行的多标记降维方法.  相似文献   

12.
现有非线性维数约简算法均需要人工设定适当的邻域点数而(或者邻域半径ε)才能获得合理的嵌入结果.但常用的基于嵌入残差的邻域参数选择方法本质上是循环依赖的,不能有效工作.为实现非线性维数约简算法的定量评价的参数辨识,从讨论优化嵌入的基本判定原则出发,给出了基于空域互信息和正则依赖指数谱的优化嵌入判据实现嵌入质量的定量评价和非线性维数约简算法的非监督参数辨识.仿真实验表明,直观的嵌入质量可被优化嵌入判据有效反映,且由嵌入集拟合恢复原数据集时的拟合精度与优化嵌入判据之间存在显著的正相关.  相似文献   

13.
针对现有的距离度量方法度量准确度低且计算效率低的问题,提出了基于形态拟合的距离度量算法.该算法使用滑动聚集平均近似方法对序列进行分段降维处理,计算降维后的分段序列的动态弯曲路径,并计算处于动态弯曲路径上的分段序列之间的欧式距离,以所有分段序列的欧式距离的累积值作为最终的距离计算结果.实验表明基于形态拟合的距离度量算法具有度量准确度高且计算效率高的优点.  相似文献   

14.
对随机旋转集成方法提出了一种针对降维问题的改进,得到了新的降维算法框架进行随机变换降维,可以显著减少降维过程中造成的信息损失.采用随机变换降维后,训练监督学习算法时可以获得更高的准确率和更好的泛化性能.通过在模拟数据上进行的实验,证明了使用多重共线性数据进行回归分析时,与传统降维算法相比,经随机变换降维处理后可以保留更多的信息,获得更小的均方误差.对随机变换降维在手写数字识别数据集上的表现进行了研究,证明了与一般性的降维算法相比,随机变换降维在图像分类问题上可以获得更高的准确率.  相似文献   

15.
多标记学习降维方法在实际应用问题中用以处理特征,标记或二者维度较高的数据集,已成为研究热点;针对目前多标记学习降维方法数量众多,种类繁杂而导致缺乏科学分类的问题,从多标记数据降维空间选择的角度,提出将多标记学习降维方法按照特征空间降维,标记空间降维和二者均降维的形式归纳为三类,其中特征空间降维又分为特征降维和特征选择两类问题,分别从独立于和依赖于彼此空间的角度对已有的40余篇文献中的典型多标记学习降维算法的研究现状进行了综述;最后,总结了多标记学习降维方法的研究现状和启示,并提出了未来进一步的研究方向。  相似文献   

16.
针对光照变化人脸识别中大多数现有的人脸识别算法只能单独实施降维或者字典学习而不能完全利用训练样本判别信息的问题,提出了基于判别性降维的字典学习算法。首先,利用经典的特征提取算法PCA初始化降维投影矩阵;然后,计算字典和系数,通过联合降维与字典学习使得投影矩阵和字典更好地相互拟合;最后,利用迭代算法输出字典和投影矩阵,并利用经l2-范数正则化的分类器完成人脸的识别。在PIE及扩展的YaleB两大人脸数据库上得到了验证了所提算法的有效性及可靠性,实验结果表明,相比几种较为先进的线性表示算法,所提算法在处理光照变化人脸识别时取得了更高的识别率。  相似文献   

17.
针对一些面积较大、节点分布密度过低的实际应用场景中,由于节点间距离测量误差过大而导致定位算法结果精度较低的问题,提出一种根据各邻居节点相关信息划分为若干个局部网络块的节点定位算法.该算法首先将无线传感器网络节点定位技术与机器学习领域中的降维方法相结合;然后根据节点间的距离越近,测量精度越高的规则及在一定通信半径内的各邻居节点相关信息共建网络块;最后将网络块组建成全局坐标系,利用全局构建以及锚节点的具体信息映射出各节点的坐标.仿真实验结果表明,该算法较其他节点定位算法在节点定位精度方面表现更优.  相似文献   

18.
一种改进的LLE方法   总被引:1,自引:0,他引:1  
局部线性嵌入(Locally Linear Embedding,简称LLE)是一种较好的非线性降维方法,这种方法对于位于某种非线性流形上的数据的降维有着比较好的效果.但是这种方法对于其中一个重要参数——近邻个数,太过敏感.文章将另一种非线性降维方法Conformal-Isomap中的一种度量数据之间距离的方法引入到LLE方法中.经过实验发现,新引入的距离对于近邻个数的选择有比较好的效果,可以使得实验的结果对近邻个数的选择不那么敏感.  相似文献   

19.
在威胁情报包含的信息中,与网络攻击相关的战术、技术、程序(TTPs)是最能刻画组织行为的关键信息。但是,TTPs信息抽象层次高,并且通常存在于语法结构不规则的网络威胁情报文本中。这导致传统的人工分析方法以及基于特征工程的机器学习方法难以快速有效地从中分类出TTPs。使用单一的深度学习特征提取器则因无法提取文本语意中完整的邻域特征和序列特征,导致技战术分类精度低。 针对上述问题,本文提出一种基于注意力机制和特征融合的深度学习模型:ACRCNN,用于网络威胁情报中的战术与技术的分类。该模型通过卷积与循环神经网络同时提取网络威胁情报文本中的邻域与序列信息,再由卷积层与池化层进行深层次的特征抽取与降维,完成特征融合。然后,通过注意力层完成特征加权,最终经由全连接层完成战术与技术的分类。实验结果表明,ACRCNN在战术、技术分类任务中表现优异,在F1指标上达到了91.91%、83.86%,对比现有模型,分别提高了2.46%和4.94%。  相似文献   

20.
当今时代信息技术的高速发展促使人们对人机交互领域投以更多的目光,随时监测操作者脑力负荷情况并依此对操作者的任务工作量进行调整,在当下有着重要意义。有研究表明,脑电信号功率谱密度对于脑力负荷分类任务较为适用,但脑电特征维数较高,极易出现维度灾难。目前机器学习中降维方面应用最广泛的算法为主成分分析(principal component analysis, PCA),针对主成分分析在脑电信号分类上的不适应性和支持向量机(support vector machine, SVM)对特征间关系的敏感性,提出了基于PCA-SVM与逐阶枚举法的包裹式降维方法,在特征工程阶段引入固定验证集概念辅助包裹式降维,以验证集精度为指标调整特征工程方案,以此提高数据降维后的可分性。由于引入了监督学习概念,实验结果表明,基于PCA-SVM与逐阶枚举法降维过后的数据分类精度要普遍高于只依靠传统PCA的降维方式,以此为高维生物电数据降维提供了新思路。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号