期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张毛磊陈涛杨锐袁宏永《清华大学学报(自然科学版)》2011,(6):809-813

一般的目标追踪算法提取目标的颜色或轮廓特征,在图像区域内使用匹配算法完成对目标的追踪。由于飞艇容易受到气流影响,艇载相机平移误差会造成目标在视频的相邻帧间运动距离过大,传统目标追踪算法容易陷入到局部最优解而造成目标跟错或者丢失。该文提出了一种基于视频稳像的追踪方法,使用基于运动估计和混合滤波算法,首先处理视频使之平滑稳定,在此基础上利用人机交互选择目标并应用基于MeanShift的算法实现追踪。比较本文提出的算法和一般算法在飞艇视频目标追踪中的效果,结果表明:该方法在目标追踪中具有更高的准确率,同时满足实时性要求。实验证明了本文提出算法可以准确有效地处理飞艇视频目标跟踪问题。相似文献

2.

基于特征分组的在线目标跟踪算法

姜明新《大连理工大学学报》2013,53(5):755-759

在线目标跟踪是计算机视觉领域的一个具有挑战性的问题.提出了一种基于特征分组的在线目标跟踪算法.首先,利用像素点在多帧的方差对模板库中的目标模板进行特征分组.然后,利用主要特征图像和次要特征图像学习投影矩阵P,对样本进行投影.最后,利用最小误差法得出当前帧的跟踪结果.与其他典型算法相比,该算法对目标的异常变化具有很强的鲁棒性. 相似文献

3.

基于双特征融合的动态图像分析算法

江虹郭树旭钱晓华《吉林大学学报(信息科学版)》2011,29(2):110-115

为解决汽车碰撞实验过程进行测量和记录数据困难的问题,提出一种能从汽车碰撞动态图像中检测、识别和追踪标志目标的算法。该算法采用二值图像同或相关法分离出目标和背景;在找出感兴趣区域后提取相邻帧目标的坐标和纹理进行特征匹配;给出了对匹配量化值进行加权平均融合的策略,并由等错误率最小准则确定融合的最佳权系数;在融合量化值定义为相似度的基础上,通过决策阈值对相邻帧目标间的最大相似度组合进行识别;从而进一步提出了用同构映射原则来判断相邻帧目标的最佳配对。实验结果表明,该算法对相邻帧目标的配对准确率比传统单特征法提高5%,能更有效的对目标进行追踪。相似文献

4.

基于Keystone变换的多帧步进频信号处理 总被引：2，自引：2，他引：0

原浩娟高梅国《北京理工大学学报》2008,28(11):1023-1026

针对运动目标在步进帧间跨高分辨距离单元走动的问题,提出了基于Keystone变换的解决方案来补偿运动目标帧间距离走动造成的影响,并分析了利用多帧步进频信号实现运动目标距离-速度二维高分辨检测的信号处理方法及算法性能.理论分析和仿真结果表明,只要参数设计合理,该方法可以在不需要任何先验速度信息的情况下,实现运动目标的帧间相参积累,获得目标的高分辨速度和距离信息.同时,由于多帧处理有效地提高了相参积累时间,更加有利于微弱目标的检测. 相似文献

5.

基于动态规划的视频自动裁剪

龙思敏周斌胡波《中南民族大学学报(自然科学版)》2023,(2):238-244

传统视频裁剪方法大多只考虑内容保持,而忽略了由裁剪窗口频繁移动造成的时间不连续问题.为此,提出了一种基于动态规划的视频自动裁剪算法,并通过平滑因子和面积约束将视差控制在舒适区间.算法主要分为目标检测、轨迹定义、轨迹找寻三个阶段.首先将输入的视频序列进行语义处理并输出,运用YOLOX模型检测输出视频中的重要内容;然后定义一个对数线性模型融合每帧图像的特征、颜色直方图和灰度图,以得到一组帧系数,并对裁剪窗口进行面积和距离上的约束;最后运用动态规划中最短关键路径方法为视频帧找到一系列裁剪窗口,在相邻帧之间设置过渡因子来保证裁剪轨迹的平滑,同时定义了一个视觉惩罚函数平衡内容丢失与裁剪窗口偏移的问题.实验结果表明：所提出的算法在裁剪率、扭曲度和稳定性方面都优于以往的方法. 相似文献

6.

采取阶段性改进的全新ViBe目标检测算法

涂伟强李炎炎龙伟陈金戈丁伟《四川大学学报(自然科学版)》2021,58(3):032003-032003-6

针对ViBe (Visual Background extractor)算法在目标检测过程中易产生鬼影问题和检测目标不完整问题,从ViBe算法处理过程的主要阶段出发,提出一种全新的ViBe目标检测算法.首先,在模型初始化阶段,利用前m帧视频序列对应像素点的均值构建背景模型,同时将原算法的8邻域改为24邻域进行样本选取以及动态调整匹配半径;然后,在目标检测阶段,引入最大类间方差法来计算当前图像帧的最佳分割阈值,进而对前景像素进行二次判别;其次,在背景模型更新阶段,根据背景变化快慢程度动态地调整更新因子;最后,对获得的前景图像进行形态学处理得到最终的前景目标.实验结果表明,改进后的ViBe算法使鬼影问题得到有效解决,目标检测的准确度和完整度也有大幅提高. 相似文献

7.

一种基于预测谱偏移的自适应高斯混合模型在语音转换中的应用

《华东理工大学学报(自然科学版)》2017,(4)

基于高斯混合模型(GMM)的语音帧谱包络转换算法容易导致转换后的语音谱包络过平滑、语音细节特征受损。通过对GMM中协方差的准确性与谱包络过平滑现象的研究,提出了一种基于预测谱偏移的自适应GMM建模方法。该方法采用平滑加权算法对目标谱的偏移进行建模,并根据语音帧信息自适应调节预测谱偏移项的比例系数,结合高斯混合模型共同实现对谱包络的转换。实验结果表明,该建模方法能够有效抑制转换后语音谱包络的失真现象,提高转换后语音的清晰度、自然度和可懂度。相似文献

8.

谱包络参数的平滑算法

赵铭崔慧娟唐昆杜文《清华大学学报(自然科学版)》2005,45(4):448-451

为降低谱包络参数的量化失真,研究了谱包络参数的平滑算法,称为DCT-S算法.谱包络参数用线谱频率(LSF)参数表示,用离散余弦变换(DCT)对多帧线谱频率(LSF)参数每一维组成的矢量进行变换,然后对DCT系数进行截断,再进行反离散余弦变换,得到LSF参数的平滑轨迹.测试表明,应用DCT-S算法,在LSF参数单帧矢量量化时,平均谱失真下降了约 0.23 dB;在LSF参数多帧联合矢量量化时,平均谱失真下降了约0.25～0.45 dB. 实验结果表明,DCT-S算法使谱包络参数的变化轨迹得到了平滑,有效地降低了谱失真. 相似文献

9.

动态环境下改进五帧差分的运动目标检测新算法 总被引：1，自引：0，他引：1

陈志勇彭力张纪宽《江南大学学报(自然科学版)》2015,14(1)

在噪声、光照变化和背景不断变换等动态环境下运动目标检测存在着误检、漏检现象.帧间差分法对动态环境有较强的适应性,但一般只能提取目标的轮廓,不能完全检测出目标,容易产生内容空洞和虚假边缘的现象.为此文中提出一种改进五帧差分法的运动目标检测新算法.该算法首先利用中值滤波对每一帧图像进行去噪处理,然后对去噪后的图像进行文中的五帧运算,最后通过新的动态阈值分割算法和数学形态学处理完成对运动目标的提取.实验结果表明,该算法的运算复杂度较低,可以检测动态环境下的运动目标,大大提高了运动目标检测的准确性. 相似文献

10.

一种尺度和旋转自适应的目标跟踪算法

赵钦君张勇赵东标《中南大学学报(自然科学版)》2013,44(6)

为了解决目标跟踪中的尺度和旋转问题,提出一种基于尺度不变特征变换(SIFT)和均值漂移的目标跟踪算法.该算法首先检测模板区域和目标区域在尺度空间中的极值点,然后通过拟合三维二次函数精确定位特征点的位置和尺度,接着对目标区域和模板区域的特征点进行匹配,并根据相邻帧之间尺度和角度的连续性,去除误匹配,最后利用正确匹配的特征点中的尺度和角度信息,计算被跟踪目标的尺度和旋转角度.研究结果表明:当被跟踪目标的角度和尺度发生变化时,该算法皆具有较好的跟踪效果. 相似文献

11.

声音转换实验系统的研究与实现

刘金凤符敏程德福《南京理工大学学报(自然科学版)》2005,29(Z1):211-214

声音转换是将源说话人的声音转化成具有目标说话人特征信息的声音的方法。该系统选择共振峰频率和带宽及基音周期等声音特征参数,分别使用LPC求根法和自相关法提取这些特征参数。矢量量化的码本映射方法实现声音特征转换,共振峰参数法合成转换语音。实验中对5个国际音标与语音中的元音进行转换,并使用MFCC听觉倒谱法对转换结果进行评估,其中男声到女声的转换后的语音到目标语音的MFCC距离比源语音到目标语音MFCC距离平均减小48.8%。相似文献

12.

IBM Voice Conversion Systems for 2007 TC-STAR Evaluation

SHUANG Zhiwei Raimo Bakis QIN Yong 《清华大学学报》2008,13(4):510-514

This paper proposes a novel voice conversion method by frequency warping. The frequency warping function is generated based on mapping formants of the source speaker and the target speaker. In addition to frequency warping, fundamental frequency adjustment, spectral envelope equalization, breathiness addition, and duration modification are also used to improve the similarity to the target speaker. The proposed voice conversion method needs only a very small amount of training data for generating the warping function, thereby greatly facilitating its application. Systems based on the proposed method were used for the 2007 TC-STAR intra-lingual voice conversion evaluation for English and Spanish and a cross-lingual voice conversion evaluation for Spanish. The evaluation results show that the proposed method can achieve a much better quality of converted speech than other methods as well as a good balance between quality and similarity. The IBM1 system was ranked No. 1 for English evaluation and No. 2 for Spanish evaluation. Evaluation results also show that the proposed method is a convenient and competitive method for cross-lingual voice conversion tasks. 相似文献

13.

利用谱包络变换后LPC系数实现频谱搬移

下载免费PDF全文

张辉李波王宝良《空军工程大学学报(自然科学版)》2006,7(6):62-64

频谱包络转换是语音转换中的一项重要内容,基于双线性转换函数进行频谱搬移的方法可以有效的进行谱包络转换,并且基于小语料库训练时仍能得到稳定的转换谱包络。本文基于LPC分析,在求解频谱搬移后的系统单位冲激响应的基础上,提出求解频谱搬移后LPC系数的方法,以此来实现频谱包络的变换,取得较好的效果。相似文献

14.

语音转换分析及相似度改进

双志伟张世磊秦勇《清华大学学报(自然科学版)》2009,(Z1)

该文对现有语音转换方法存在的问题进行分析,提出了一种结合频谱弯曲与单元挑选的音色转换方法。首先利用频谱弯曲来获得弯曲后的源频谱。然后,利用弯曲后的源频谱作为预测目标从目标说话人频谱中进行单元挑选。最后,用挑选出来的目标说话人频谱对弯曲后的源频谱进行部分替换,以提高频谱细节上的相似度。评测结果表明,改进的方法与单纯的频谱弯曲相比能够获得约20%的相似度提高。该文还提出了进一步的改进方向。相似文献

15.

利用说话人自适应实现基于DNN的情感语音合成

智鹏鹏杨鸿武宋南《重庆邮电大学学报(自然科学版)》2018,30(5):673-679

为了提高情感语音合成的质量,提出一种采用多个说话人的情感训练语料,利用说话人自适应实现基于深度神经网络的情感语音合成方法。该方法应用文本分析获得语音对应的文本上下文相关标注,并采用WORLD声码器提取情感语音的声学特征;采用文本的上下文相关标注和语音的声学特征训练获得与说话人无关的深度神经网络平均音模型,用目标说话人的目标情感的训练语音和说话人自适应变换获得与目标情感的说话人相关的深度神经网络模型,利用该模型合成目标情感语音。主观评测表明,与传统的基于隐马尔科夫模型的方法比较,该方法合成的情感语音的主观评分更高。客观实验表明,合成的情感语音频谱更接近原始语音。所以,该方法能够提高合成情感语音的自然度和情感度。相似文献

16.

改进的GMM模型语声转换系统 总被引：1，自引：0，他引：1

申毅简志华杨震《南京邮电大学学报(自然科学版)》2007,27(5):11-15,21

传统的基于GMM模型线性语音转换系统在语音转换阶段,由于转换函数的概率加权组合使合成语音共振峰带宽变宽,谱包络过于平滑.文中提出依据后验概率大小和前后语音的相关性,选择部分转换分量函数进行语音转换.实验表明不仅简化了语音转换,而且经过转换的语音质量也有一定的提高,对语音的实时转换有重要的意义. 相似文献

17.

语音质量客观评价方法研究及实现

方凡泉李心广王桂珍林江豪《广州大学学报(自然科学版)》2011,10(1):65-69

语音质量的客观评价在语言自主学习中具有重大的意义.文章首先介绍了语音质量客观评价过程中语音信号的预处理单元;其次,介绍了不同的语音特征提取算法,比较选择了更符合人耳听觉模型的MFCC特征,并给出特征提取过程及结果;最后,比较当前评价模型(DTW和HMM)的优缺点,并提出了采用HMM模型进行评价的方法,设计系统验证了该方... 相似文献

18.

基于正弦谐波模型的语音变换算法及实现

王浩苏巨诗许胜华岳振军《解放军理工大学学报(自然科学版)》2005,6(6):525-530

介绍了语音变换的相关技术,分析了利用正弦谐波模型实现语音变换的算法及流程。利用正弦谐波模型对语音进行建模和分解,提取语音的基音频率,利用高斯建模和变换实现语音韵律特征的变换;提取出正弦谐波幅度的后10阶系数,作为语音的频谱特征参数,利用矢量量化和码书映射的方法实现语音频谱特征的变换。提出了一种逐词对应的训练参数对齐方法,给出了具体实现的算法流程。对录制的2段语音利用该算法进行了仿真实验,利用ABX测试对实验结果进行了评估。测试结果显示,该算法得到的变换语音在听觉上有89．3％的概率更接近目标说话人语音。相似文献

19.

基于相位调制特征的语音活动检测

尚永强殷未来姜双双王金芳《吉林大学学报(信息科学版)》2016,34(1):29-33

针对现有语音活动检测特征易受各种环境噪声影响而导致检测性能恶化的问题, 提出基于相位调制特征的语音活动检测算法。相位调制特征能充分表征语音动态特性, 与静态特征相比, 更能体现语音和噪声间的差异, 从而保证良好检测性能。与传统美尔频率倒谱系数特征的检测对比实验结果表明, 相位调制特征明显优于美尔频率倒谱系数。相似文献

20.

基于自给式呼吸器的语音减噪改进方法

宋宫琨琨郭业才《科学技术与工程》2015,15(16)

针对传统减噪方法在处理自给式呼吸器通信时语音音质不清晰、噪声干扰严重的问题,提出了一种基于自给式呼吸器的语音减噪改进方法,并进行了实验验证。在该改进方法中,先定义一个新的判决变量为相关函数能量,利用该变量进行语音端点检测,然后根据检测结果,分别对有话段语音信号采取声压差值减噪处理,对无话段噪声信号采用静默处理。实测实验结果表明,对于自给式呼吸器采集到的语音信号,改进方法的准确性与鲁棒性要优于传统语音减噪方法。相似文献