首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本文主要研究音乐声的音色感知特征与图像的纹理之间的关联关系并建立音色与纹理的匹配模型.首先对Brodatz纹理库中的图片提取纹理特征,然后利用纹理特征对纹理图片进行系统聚类和多维尺度分析,挑选出18张用来做主观评价实验的纹理图片.通过主观评价实验,得到音色感知特征值以及音色和纹理的匹配关系数据,并基于此数据分别计算了匹配(或不匹配)的音色感知特征纹理特征之间的皮尔逊相关系数,相关系数绝对值最高达0.75,证明了二者之间存在强烈关联.最后使用逻辑回归、随机森林、多层感知神经网络对音色感知特征和纹理之间的匹配关系进行预测,得到了准确率较高的预测模型,说明通过音色感知特征和纹理特征预测二者匹配关系是可行的.  相似文献   

2.
基于客观特征对民族乐器的音色进行了研究与分析.首先通过对音色描述词的主观打分,进行了描述词的分析与聚类选择,将16个音色描述词进一步分为具有区分度的4个音色类别.然后基于同种类乐器具有相似音色的前提,构建了民族乐器音色的分类模型,其中支持向量机模型表现最好,准确率达到78.38%.针对实验现象,本文进一步分析了音色的影响因素,除与乐器种类有关以外,音色还与乐器类别、音高等多重因素相关.  相似文献   

3.
本文主要研究音乐声的音色感知特征与情感的关联关系.首先通过多维尺度分析方法确定了一个5维的情感空间;然后针对72种音色的音阶素材和48种音色的旋律素材进行情感标注主观评价实验,得到音色素材的情感数据;按照演奏内容、时域特性以及乐器类型这3种因素进行分类,分别研究了音色感知特征和情感的相关关系;采用多维偏好分析方法和单因...  相似文献   

4.
为了提高音频数据分类正确率,提出一种通过非负张量分解(NTF)的分类方法.音频信号经过预处理后,提取声学特征和感知特征参数,然后构建非负的3阶音频张量,其各阶分别对应特征、帧、样本;其次,通过NTF得到每一类音频的核张量与因子矩阵,让测试样本构建的张量与各类型音频的因子矩阵的转置进行张量乘,得到对核张量的近似;最后,通过Frobenius范数进行相似性度量,完成分类.使用古典音乐、流行音乐、语音、噪声4种类型的音频数据测试分类效果.结果表明,平均分类正确率在85%,以上,说明该方法可以有效地完成音频分类.  相似文献   

5.
本文对5种双耳渲染算法进行了客观评测。首先对双耳信号提取双耳特征和单耳特征,并进行特征选择和降维,最终选择岭回归建立了总体评价和其二级维度,即音质、定位和空间感的客观评测模型,并探究了主观感知和客观参数之间的关系。实验结果表明,将实验信号时频域特征的双耳差值用于客观评测模型可以获得理想的拟合效果;对于音质的感知,与频域能量相关的特征是最为重要的影响因素;变化丰富的双耳线索和双耳间频谱信息的变化差异性对于定位和空间的感知有较为显著的影响。  相似文献   

6.
视觉感兴趣区的提取及其在视频图像质量评估中的应用   总被引:3,自引:0,他引:3  
通过主观眼动跟踪实验和客观Itti模型分别研究了视频图像的感兴趣区域提取问题.通过研究眼动跟踪实验数据与视频图像的时间同步问题和适当选取人眼在观察视频时所能接受的感兴趣区域个数,分别得出了主、客观实验的视频图像感兴趣区权重矩阵.在此基础上,在传统图像质量评估方法峰值信噪比(PSNR)中加入主观眼动跟踪实验和客观Itti模型得出的感兴趣区权重矩阵,分析和比较了2种感兴趣区权重矩阵对PSNR的影响.实验证明,通过参数设置,主观眼动跟踪实验和客观Itti模型提取的感兴趣区权重矩阵对 PSNR都有明显的改善,改善后的模型不但保持了传统方法的简易性,同时也提高了其与主观感知的相关性.  相似文献   

7.
针对视觉SLAM闭环检测过程中由于感知歧义导致的闭环不准确问题,基于TF-IDF方法提出了一种带权重的计算两幅图像相似性得分的算法,用于视觉SLAM的闭环检测研究;首先在特征点检测时,为了得到均匀分布且重叠点较少的特征点,使用FAST角点检测方法得到关键点,而后对关键点进行非极大值抑制;其次使用改进的算法计算两幅图像间带权重的相似性得分;最后根据场景图像的特征,进行闭环确认,进一步剔除错误闭环。实验通过搭建平台和使用标准数据集进行测试,证明了改进的闭环检测方法能够有效提高闭环的识别率与准确率。  相似文献   

8.
基于主成分分析构建指标权重的客观赋权法   总被引:3,自引:0,他引:3  
针对主观赋权法在多指标评价过程中受人为因素的影响,导致评价结果随意性较强的问题,提出一种基于主成分分析构建指标权重的客观赋权法;将样本数据矩阵转置,依据客观数据之间的关系,用主成分分析的方法计算各项指标的得分,继而归一化处理,作为各项指标的权重系数。结果表明,该方法既能体现各项指标的相对重要性,又能体现指标间的差异性,将其应用于多指标综合评价中的评价结果能够达到科学、合理、客观的要求。  相似文献   

9.
针对音频感知质量评价模型(PEAQ)在流媒体音乐质量评测中存在的问题,提出一种针对流媒体音乐质量客观评测的框架——流媒体音频感知质量评价模型(PESAQ).用PESAQ设计对齐算法消除流媒体音乐中的抖动,并使用PEAQ评测编解码、噪声等造成的损伤,同时引入基于梅尔倒谱系数的动态时间规整最小距离对抖动造成的损伤进行评测,最后综合两种损伤的评测结果得到流媒体音乐的客观质量评分.主客观对比实验表明,PE-SAQ对流媒体音乐质量的评测结果比PEAQ更接近主观实验结果.  相似文献   

10.
基于颜色共生矩阵的纹理检索算法MCM   总被引:1,自引:0,他引:1  
描述了一种基于颜色共生矩阵的纹理检索算法MCM,主要包括颜色共生矩阵纹理特征提取算法以及纹理特征的相似性度量函数,给出了利用MCM算法检索图像库的实例.通过MCM算法提取的特征除了反映图像的纹理关系外,还综合了其颜色构成特征,部分建立了与人的视觉感知之间的对应关系.实验表明,MCM算法优于一般的灰度共生矩阵纹理检索算法,并且具有较好的检索效果.  相似文献   

11.
在图像压缩,图像恢复和图像传输等领域中真实评价输出图像的视觉质量是一项重要的工作。图像质量评价(IQA)旨在开发一种与人眼视觉感知紧密相关的方法。本文提出一个新的图像质量评价模型VFDP,该模型首先在视觉显著性特征基础上,结合颜色特征和梯度特征来描述局部图像质量。其中,本文采用新的计算梯度特征相似性方法,该方法融合参考图像与对应失真图像的亮度通道,并计算该通道的梯度图与参考/失真图像梯度图之间的相似性。最后采用平均偏差加权的方法对视觉显著特征,颜色特征与改进的梯度特征融合,得到图像质量评价结果。在TID2013、TID2008与LIVE数据库测试,结果表明VFDP所预测的PLCC与SROCC值优于8种主流算法预测的结果,其预测结果与人眼主观评价有较好的一致性。  相似文献   

12.
为了提高图像超分辨率重建的效率与质量,考虑到高、低分辨率稀疏表示系数的不同,改进了锚定邻域回归算法,并结合半耦合字典学习算法提出了一种快速图像超分辨率重建算法.首先采用半耦合字典学习算法得到高分辨率字典、低分辨率字典及映射矩阵;再采用岭回归算法求解低分辨率稀疏表示系数,并根据高分辨率稀疏表示系数与低分辨率稀疏表示系数之间的映射关系,得到高分辨率稀疏表示系数;然后,根据输入图像块特征寻找字典中与其最相关的字典原子,计算该字典原子所对应的投影矩阵,进行超分辨率重建.仿真结果表明:提出的算法不仅在重建速度上表现更快,重建图像的质量也得到提高,在客观指标和主观效果上均取得更好的效果.  相似文献   

13.
中国民族乐器的共振特性很大程度上反映了其独特的音色,但一直缺乏较系统的相关研究.本文录制了4种中国弹拨乐器的常用单音作为分析的声音样本,利用基频与迭代的倒谱分析方法,提出了一种估计乐器共振频段的算法,并在西方弹拨乐器上验证了其有效性.该算法采用改进的倒谱法估计单音共振峰,然后针对估计结果,设计了共振谱法和频带法进行后处理,从而得到乐器的有效共振频段.文中估计了录制的4种中国弹拨乐器的共振频段,并对其描述的乐器共振模式进行分析,为中国弹拨乐器尖锐的合奏听感提供了一种客观依据.  相似文献   

14.
提出了一种改进的基于空间结构约束的迭代最近点(ICP)影像配准方法.该方法通过结合特征点的空间结构相似性和特征相似性获得特征点的匹配矩阵,其中特征相似性通过特征点的局部特征描述算子进行计算,空间相似性则通过特征点的空间位置进行计算.特征点之间的空间结构相似性不仅包括了对应特征点之间的空间距离,还包含了特征点到邻近特征点的空间距离.在匹配过程中,分别从参考影像和待配准影像的角度出发,实现了匹配的对称性处理.通过对具有不同影像特征的真实遥感影像进行实验,结果表明该算法具有较高的配准精度.  相似文献   

15.
针对网络异常流量检测中大数据小异常造成的难题,提出了一种新的基于残差分析的网络异常流量检测方法。从多个角度提取网络流量的特征属性,以准确刻画正常行为和异常行为之间的差异性。利用提取的特征属性构建属性矩阵,采用流之间的相似性构建邻接矩阵。使用属性矩阵和邻接矩阵构建网络异常检测模型,采用CUR矩阵分解方法重构属性矩阵得到主模式,对属性矩阵和重构的属性矩阵进行残差计算进而获得残差矩阵。对残差矩阵中的每一个流计算其残差,根据每个流的残差和预设阈值进行异常判定。采集了西安交通大学校园网流量数据进行实验,实验结果表明:所提方法在不需要任何先验知识的情况下能够使异常检测率达到90%以上;与其他异常检测方法相比,所提方法不仅具有较高的检测率,而且能够实现异常源定位。  相似文献   

16.
为了实现遥感影像的完整性认证,提出了一种基于边缘特征的遥感影像感知哈希算法.首先,对影像进行格网划分,并对格网单元进行自适应的预处理.其次,采用Canny算子提取格网单元的边缘特征,进一步生成边缘特征矩阵.然后,对边缘特征矩阵进行奇异值分解,选择较大的奇异值作为格网单元的特征,并采用Hash函数进行归一化.最后,串联所有格网单元的归一化特征,得到影像的感知哈希散列.在影像接收端,计算待认证影像的感知哈希散列,并与收到的感知哈希散列进行匹配,实现遥感影像的完整性认证.实验结果表明,该算法能够有效检测遥感影像的局部细节篡改,对于保持影像内容不变的操作具备较好的鲁棒性,且运行效率较高,为遥感影像的内容完整性认证提供了一种高效途径.  相似文献   

17.
可见光与红外灰度融合图像感知对比度客观评价   总被引:1,自引:0,他引:1  
如何客观有效地评价融合图像质量,是融合技术发展与装备应用面临的一个关键问题.图像对比度是衡量双波段灰度融合质量的一项重要的评价指标.针对目前的图像对比度客观计算模型没有充分反映人眼视觉特性,从而影响模型计算结果与人眼视觉感受的一致性的问题.在各向同性局部对比度计算模型基础上,引入人眼视觉的亮度掩盖特性,提出图像感知对比度客观评价模型.使用模拟灰度图像以及人眼主观评价实验得到的15组不同真实场景融合图像的对比度评价数据来验证客观计算模型.结果表明,相比于4种经典的对比度客观评价模型,建立的图像感知对比度模型评价结果更符合人眼视觉感受,可以有效实现双波段灰度融合图像感知对比度的客观评价.   相似文献   

18.
提出一种基于特征融合矩阵的语音音色的厚薄度客观评价方法.提取最符合人耳听觉特性的梅尔频率倒谱系数(MFCC)和线性预测系数(LPC)作为语音特征参数,同时提取了3种非语音参数特征,包括共鸣因子指数、身高质量指数和肺活量体重指数,将这些特征进行融合即可形成特征融合矩阵,采用softmax分类器对语音音色中的厚薄度进行分级.实验结果表明,该方法可以获得较高的分级准确率.   相似文献   

19.
为了有效地检测Android平台上的恶意软件,提出了一种基于敏感权限及其函数调用流程图的静态综合检测方法.通过对恶意软件进行逆向工程分析,构建了包含恶意代码敏感权限与函数调用图的特征库.并采用Munkres匈牙利算法计算待测样本与特征库在相同敏感权限下两个函数调用图之间的编辑距离,得到两个函数调用图之间的相似性,进而得到两个应用程序之间的相似性,据此对恶意软件进行检测识别.实验结果表明,该检测方法具有较高的准确性与有效性,检测效果明显优于工具Androguard.  相似文献   

20.
在无约束条件下,人脸表情、姿态、光照以及背景等复杂因素可能导致人脸图像的类内变化大于类间变化.针对如何降低较大的类内变化对人脸验证研究的影响,本文结合加权子空间,提出了一种带先验相似性和先验距离约束的相似度度量学习方法.首先,利用类内人脸对样本,学习带权重的类内协方差矩阵,通过加权子空间的投影,从人脸图像中获得鲁棒性的人脸特征表达;其次,利用样本对的相似性与差异性,建立了带先验相似性和先验距离约束的相似度度量学习模型,优化后的度量矩阵可以有效提高特征向量的类内鲁棒性和类间判别性;最后,利用优化的度量矩阵计算人脸对的相似度.在LFW(Labeled Faces in the Wild)数据集的实验验证了所提模型的有效性,与其它同类相似度度量学习方法相比,优化的度量矩阵更能准确地评估人脸间的相似性,并在受限训练集上取得了91.2%的识别率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号