首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
提出了一种面向翻唱歌曲识别的相似度融合算法。该算法将基于乐理特征的相似度和基于人耳感知特性的相似度融合,通过把基于节拍跟踪和瞬时频率音级轮廓(IF-PCP)的最大互相关相似度、基于和声音级轮廓(HPCP)的Qmax相似度、基于耳蜗音级轮廓(CPCP)的Q_(max)相似度映射到同一个多维空间,并计算其几何距离来进行相似度融合。该算法使得IF-PCP特征的节拍速度不变性、HPCP特征的和声优势、CPCP特征的人耳感知特性有效融合。为了验证算法的有效性,采用包含212首不同歌曲共502个版本的数据库作为测试对象,以平均正确率均值和TOP-N作为测试指标对算法性能进行测试。测试结果表明,与基于单一相似度算法相比,该融合算法可提高翻唱歌曲识别准确率。  相似文献   

2.
针对洞库类目标自动识别研究较少、识别率较低、识别方法成本较高等问题,设计了基于多种特征的洞库类目标识别算法.探讨了典型洞库类目标的模型并总结其主要特征;其次利用HOG特征对输入图像进行初步筛选,筛选出包含有洞库类目标的图像;然后基于洞库类目标的灰度特征提出了一种图像局部自适应阈值生成算法Wiblack提取图像中的疑似目标;最后搭建了洞库类目标的数学模型,并提出了基于形状相似度的目标判别算法,采用圆形相似度与椭圆形状相似度二次相似度判别方法,最终得出识别结果并描述目标轮廓,完成目标识别.实验结果表明该方法在洞库类目标的识别应用中有效可行,基于本文实验数据的识别准确度为92.6%.   相似文献   

3.
针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口(MPEG 7)音频特征(包括音频频谱质心,音频频谱带宽等低层音频特征.)及MPEG 7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率.  相似文献   

4.
针对语音/音乐分类过程中由于特征参数提取过多造成的维数灾难及分类准确率有待提高等问题,提出了一种基于过零率及频谱的语音/音乐分类算法.该算法在对语音及音乐2类信号进行端点检测及分段预处理后,结合每一音频段的过零率和频谱幅值特性进行分类识别处理,最后通过计算被判别为语音或音乐的概率实现分类.实验结果表明,此算法在音频分类中较同样最多只提2个音频特征且未用分类器算法的准确率平均提高约7.9%,较提取多个音频特征且采用分类器算法的准确率平均提高约5.7%.证明了该算法不仅计算量小,且分类准确率也有所提高.  相似文献   

5.
在行人重识别模型中引入邻域数据关系,提出了一种基于图像邻域相似度的重排序方法。首先扩充图像的邻域数据,然后计算图像对不同邻域数据的相似度权重,利用该权重得到代表邻域相似度的分布距离,再用分布距离与原始距离计算得出最终距离作为重排序评判标准。使用CCL,Transreid, Torchreid等行人重识别模型在Market-1501,DukeMTMC-reID数据集上进行实验,结果表明本文方法对基准模型的精度提升均超过该领域的主流算法,证实了本文方法的有效性和泛化性。该重排序方法不需要任何人工交互和额外数据,适用于大规模数据集,可以有效应用于图像检索、目标跟踪等需要考虑相似度关系的任务中。  相似文献   

6.
模式识别技术在扬声器故障诊断中的应用   总被引:1,自引:1,他引:1  
针对目前扬声器检测普遍采用人耳监听的现状,提出一种基于模式识别技术进行扬声器故障检测的方法.首先,对87个类型已知的各类扬声器进行数据采集和数据处理,并计算不同类型扬声器的类标准频谱图;然后,测试其他已知类型的扬声器,进行数据处理,计算其频谱与类标准频谱图之间的欧氏距离、相似度和二维相关系数三种指标,并根据其对扬声器进行识别.试验结果表明,利用频谱图及多指标的模式识别技术能够提高故障诊断精度.  相似文献   

7.
文章提出了一种基于多度量融合的微博转发行为预测方法(MRBP-MMF),该方法提取用户微博特征,设计了转发行为习惯度、历史微博认同度、微博内容相似度和转发行为相似度计算方法,并综合多种度量标准预测用户转发行为。在实际微博数据集上实验发现,MRBP-MMF方法对用户转发行为的预测灵敏度比融合前平均高出12%,分别比预测模型3:基于情感主题模型(The Third Prediction Model-Emotion topic based Model,PM3)和多异质扩散关系网络转发行为(Retweeting Behavior on Multiple Heterogeneous Diffusion Relation Networks,RBMHDRN)平均高出4%和0.7%,在训练数据较少的情况下,MRBP-MMF方法更具优越性。实验结果表明,MRBPMMF方法预测灵敏度高于基于微博正文或用户情感的转发行为预测方法。  相似文献   

8.
提出一种基于相位敏感光时域反射计(φ-OTDR)的光纤振动传感系统, 提取信号的主波能量、 主瓣时延、 主波峰峰值、 主波Q值、 频谱、 3 dB时延、 主瓣峰值、 中心频率、 二次回波损耗、 波数和半波长度11种特征参量作为参考衡量标准, 用多参量模糊评价矩阵的目标识别方法, 对5组200次实验进行相似目标识别分类. 结果表明,  该方法通过多角度参量进行目标衡量判别, 综合识别率达90.87%, 提高了相似识别的准确性.  相似文献   

9.
提出一种基于相位敏感光时域反射计(φ-OTDR)的光纤振动传感系统, 提取信号的主波能量、 主瓣时延、 主波峰峰值、 主波Q值、 频谱、 3 dB时延、 主瓣峰值、 中心频率、 二次回波损耗、 波数和半波长度11种特征参量作为参考衡量标准, 用多参量模糊评价矩阵的目标识别方法, 对5组200次实验进行相似目标识别分类. 结果表明,  该方法通过多角度参量进行目标衡量判别, 综合识别率达90.87%, 提高了相似识别的准确性.  相似文献   

10.
为了解决多模态数据中数据样本不平衡的问题,利用资源丰富的文本模态知识对资源贫乏的声学模态建模,构建一种利用辅助模态间相似度监督训练的情绪识别神经网络。首先,使用以双向门控单元为核心的神经网络结构,分别学习文本与音频模态的初始特征向量;其次,使用SoftMax函数进行情绪识别预测,同时使用一个全连接层生成2个模态对应的目标特征向量;最后,利用该目标特征向量计算彼此之间的相似度辅助监督训练,提升情绪识别的性能。结果表明,该神经网络可以在IEMOCAP数据集上进行情绪4分类,实现了82.6%的加权准确率和81.3%的不加权准确率。研究结果为人工智能多模态领域的情绪识别以及辅助建模提供了参考依据。  相似文献   

11.
提出了一种打击乐器——管钟的音高的计算方法。该方法以有限单元法为基础,通过计算管钟振动的各阶模态确定其定音频率。使用该方法研究了管钟音高特征与管长、管径和壁厚等几何参数的关系,得到了一系列反应频率和几何参数关系的曲线。另外,为了对计算结果进行实验检验,采集了管钟的声音,并通过快速Fourier变换对其频率特征进行了分析,其结果与计算结果显示出很好的一致性。该文提出的方法可用于乐器的设计和生产制造过程。  相似文献   

12.
针对广义频率响应函数(GFRF)在故障诊断中存在计算量大、无法满足系统对诊断实时性要求的问题,提出基于非线性输出频率响应函数(NOFRF)的工业机器人驱动系统故障诊断方法。该方法构建系统一维频谱函数的辨识模型,将系统的输出频谱与估计频谱进行比较求出残差,根据残差大小改变辨识步长迭代出前4阶频谱;对获取到的4阶频谱进行逐阶采样,每阶频谱采集10个数值,共40个频谱构成40维特征矢量,将其作为系统的故障特征输入核主成分分析方法(KPCA)进行压缩,通过计算主元累计贡献率将高维数据压缩至3维,降低变量之间的非线性度;构造SVM分类器,将KPCA方法生成的低维数据中60%的数据作为训练集对分类器进行训练,将40%的数据作为测试集进行故障识别。实验结果表明,在相同的数据提取任务下,与基于GFRF的方法相比,所提方法节约时间854%,可以准确、快速地提取系统故障特征,进一步验证了该方法在工业机器人驱动系统故障诊断应用上的可靠性。  相似文献   

13.
介绍了本体的相关知识和3种不同的领域本体语义相似度算法,针对这3种算法的视角和优缺点提出了改进的基于领域本体的语义相似度计算方法。该方法综合考虑语义距离、概念特征和信息量中多种语义相似度计算影响因素,较真实地反映了概念间的语义关系。  相似文献   

14.
大地电磁法是一种利用天然电磁场源进行深部地电结构勘探的地球物理方法,其信号容易受到各种噪声干扰。为了更好地识别大地电磁的信号与噪声,提取出有用的信号进行阻抗估计,本文提出一种基于频率域大地电磁信号形态进行自动聚类的算法,并使用该算法对合成数据和实测数据进行计算。研究结果表明:在频率域中,大地电磁信号形态都有一定的相似性,强干扰噪声在其对应的频段上表现出与信号不一样的特征,可以使用余弦相似度提取此类特征,并使用聚类算法将信号与噪声分离;基于合成、实测数据,采用所提出的算法计算的视电阻率曲线和相位曲线都更加平滑、连续,说明经过本方法处理后的大地电磁数据阻抗估计结果得到了明显的改善。  相似文献   

15.
介绍了一种基于Android平台的音频捕获和音频频谱分析的实现方法。采用Audio Record和Audio Track类进行音频捕获与输出。利用基-2快速傅里叶算法对捕获到的音频数据进行时频变换,设置分析窗口大小及数据起始位置,可以显示任意时刻声音频谱特性。分析了歌声和鸟叫声的频谱特征,可以直观显示歌唱者的不同歌唱水平和情感表现力对应的频谱特征。  相似文献   

16.
针对传统的语义相似度计算方法计算量过大、 计算过程较复杂等问题, 提出了一种基于阶段递进的综合本体相似度计算方法。该方法把计算相似度的过程分为4个阶段, 每个阶段根据实际情况设定一个阈值, 如果此阶段计算的相似度大于阈值, 则计算下一阶段的相似度; 如果小于阈值, 则认为该对概念间不相似, 不必再计算以下各阶段的相似度, 可大大减少相似度的计算量, 使计算过程清晰可控。通过实验数据可知, 该算法与Glue算法相比, 其查全率、 查准率分别提高4.78%和3.05%, 而计算效率提高50%以上。  相似文献   

17.
科技文献资料之间的相似度计算可以帮助人们从中挖掘更多的科学知识。但是科技文献资料中的复杂的同义词关系却明显地影响了相似度的准确性。尤其在计算生物医学科技资料时其准确度常常受到领域专业词汇的影响而降低。因此本文提出了一种基于TF-IDF方法结合生物医学同义词的文本相似度计算方法。该方法首先识别生物医学专业词汇及其同义词关系并建立同义词库,之后根据同义词权重规则修改TF-IDF中更能体现文本特征的权重值,最后计算文本的相似度。实验表明该方法有效提高了生物医学文本相似度计算的稳定性和准确度,是一种相较于传统TF-IDF更为有效的文本相似性计算法。  相似文献   

18.
为了提高特征词权重和文本语义相似度计算的精确性,文章提出了一种基于加权语义网的改进文本相似度计算方法。该方法首先以特征词为节点,以特征词窗口共现原理创建边,以频率-逆文本频率(term frequency-inverse document frequency,TF-IDF)值作为特征词节点的初始权值,融合共现频率和概念语义距离自定义边权重计算方法,构建加权文本语义复杂网络。然后使用语义网络中特征词综合特征指数排名靠前的m个词组成特征向量,利用搬土距离(earth mover's distance,EMD)衡量两个文本间的语义相似度。最后基于公开数据集对文本进行聚类实验,实验结果表明,在基于F1度量值标准上文章提出的方法要优于传统的文本相似度计算方法。  相似文献   

19.
为弥补传统的基于文本相似函数(如编辑距离、语音距离等)的方法在重复记录的识别方面的不足,对记录内部单个字段的语义以及字段之间的语义进行了研究;采用字段名与统计分析相结合的方法来识别字段内部的语义,采用语义规则库来识别字段之间的层次语义和依赖关系;将语义引入到优先队列算法中,提出了改进的优先队列法(IPQM),在计算记录之间的相似度时,显式考虑字段之间的层次语义关系,对不同的字段类型调用不同的相似度计算方法.同时将语义规则库引入到数据清理框架,在预处理阶段利用语义来处理等价类型错误,在处理阶段利用IPQM来计算记录之间的相似度.实验结果表明该框架提高了数据清理的质量,遗漏率低于7%,误判率不超过3%.  相似文献   

20.
基于变分辨率频谱特征的向量机静音检测和实时混音技术   总被引:1,自引:0,他引:1  
静音检测算法基于两个语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729B静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729B静音检测算法的视频系统.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号