首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对PSOLA算法会引起语音频谱的不连续,从而影响合成语音的质量,提出了一种基于正弦模型的汉语普通话语音基音同步分析和合成算法.首先,将连续的语音信号在时间轴上分为一帧帧短时信号,再把每一帧短时语音信号分解为一系列不同幅值、相位和频率的正弦分量,然后根据频率匹配的原则,对相邻两帧信号的幅度和相位进行插值,得到合成信号的正弦分量的幅值和相位,最后将各正弦分量相加,就得到了合成的语音信号.实验结果证明,该方法合成的语音信号的各个正弦波分量的相位和幅值均能平滑过渡,从而可以克服PSOLA算法带来的回声效应,有助于提高合成语音的自然度.  相似文献   

2.
如何使机器人伴随着音乐舞蹈是一个有趣又有挑战性的课题,为此提出了一种自动生成机器人舞蹈动作序列的方法.采用门控循环单元(GRU)网络分别学习音乐的全局特征与舞蹈姿态关系特征之间的相关性、音乐局部特征与舞蹈动作密度特征之间的相关性,再结合舞蹈动作图,采样并规划出与节拍同步的机器人舞蹈动作.该方法适用于目前商业娱乐机器人平台上提供的规模小、风格多样的机器人舞蹈数据集.将其在优必选Alpha1S机器人平台上进行实验后发现,机器人能够根据算法生成的动作序列演绎出稳定、流畅的舞蹈;调查问卷表明,人们很难区分舞蹈片段是由该算法生成的还是由人类设计的.  相似文献   

3.
为解决传统的图像镶嵌方法在出现局部运动目标的情况下产生的重影现象,提出一种改进的针对运动目标重影去除的方法.对于N帧图像,算法首先通过SIFT特征点聚类和运动特征点剔除方法过滤这些图像特征点,在消除参数累积误差之后,通过三帧差法分离出背景并使用无缝融合方法完成前N-1帧图像的背景融合;然后把最后一帧与前N-1帧的已镶嵌图像进行匹配和融合,得到最后的全景镶嵌图像.实验结果表明:该算法能有效解决全景图像镶嵌中运动目标的重影问题,并保留当前最后一帧图像的运动信息.  相似文献   

4.
在传统的关键帧动画中,动画师对关键帧进行编辑并通过插值生成一段连续的动画.运动捕捉数据的每一帧均可看作关键帧,但是对其直接进行编辑非常繁琐,需要从运动中提取具有代表性的关键帧,简化运动的编辑操作.已有的关键帧抽取方法主要基于一些局部误差度量策略,算法的全局误差难以得到保证.提出了一种基于动态规划的运动捕捉数据的关键帧提取算法,该算法通过曲线拟合技术对密集采样的运动捕捉数据进行减帧,在生成指定数目关键帧的同时保证误差达到全局最小.用户可以利用传统的关键帧技术对减帧后的运动进行编辑.  相似文献   

5.
音乐速度谱图是基于内容的音乐信息检索研究领域的一种中间层次的重要的特征信息,广泛应用于音乐速度估计、节拍跟踪、节奏识别等.本文提出一种新型音乐速度谱图生成算法,该算法首先基于音乐速度创建母原子,构成冗余字典,然后运用匹配追踪算法计算音乐速度的系数,生成音乐速度谱图.该算法生成的音乐速度谱图相对现有的自相关函数法和傅里叶变换法具有更高的音乐速度分辨率、更强的稀疏性.最后分析了该算法的特性,并运用一个简单示例说明了算法的应用.  相似文献   

6.
李基柱 《科技信息》2011,(10):I0260-I0260,I0261
健美操是横跨体育、艺术、教育三大领域,融体操、音乐、舞蹈为一体的具有综合性特点的新兴体育项目。目前大学生的创编能力较差主要表现在:单个动作的规范性不强,成套动作队形变化少,动作衔接不紧凑,过渡动作变化不流畅,音乐和动作不匹配,音乐剪辑不合理等。通过健美操创编能力的培养利于发挥学生的主体性和教师的主导性;有助于培养学生的个性和开拓学生的创造性思维。  相似文献   

7.
哼唱检索作为音乐检索的重要方式,由于其有效性和方便性,引起了广泛的关注.本文提出了一种新的基于语句特征的音乐哼唱快速检索技术,可以实现哼唱音乐的快速检索.该技术将音乐数据库和用户提供的哼唱片段,按自然停顿方式划分音乐语句,使用BDTW算法对音乐语句片段进行音高相似性计算,并允许用户根据自己哼唱情况,对匹配条件进行个性化设置,限制数据库音乐片段和查询序列的局部最大差异长度.另外,对音乐库建立支持音乐语句查询的索引结构DIS,减少了检索时间.实验结果表明所提出的检索方法能够快速有效地返回查询结果.  相似文献   

8.
基于计盒维数和多小波的静脉图像特征提取   总被引:2,自引:1,他引:1  
为提高静脉识别过程中的特征匹配速度,提出了一种基于计盒维数全局特征和多小波的局部特征提取方法.该方法首先采用基于计盒维数法的特征提取技术来提取静脉纹理粗糙度特征作为全局特征,然后通过多小波分解来提取静脉图像的局部特征,分别提出了一维系数编码和多尺度量化编码的方法来描述静脉局部特征.对已有静脉图像的实验表明,提出的特征提取方法有效,并使相应匹配算法识别的准确率得到了提高.  相似文献   

9.
一种基于内容相似性的重复视频片段检测方法   总被引:1,自引:0,他引:1  
针对互联网视频内容的复杂性,选择能够表征视频内容的特征,首先通过LSH哈希算法对特征进行索引,并由此确定视频之间的帧匹配序列,然后对于计算出的帧匹配序列,采用随机抽样一致性算法进行拟合,从而得到有效的帧匹配序列.视频之间的相似度依据有效帧匹配序列的相似度计算,由相似度进行互联网视频片段的消重.实验表明,对于大量内容相似的互联网视频片段,该方法能较好地描述相似性,并能有效提高检测准确率.  相似文献   

10.
提出一种基于特征提取与追踪的视频篡改检测方法.首先对视频序列按照一定帧间隔进行特征提取,寻找出首个篡改帧及其篡改区域;其次采用追踪算法对该篡改区域进行学习,并定位该帧之后的每个视频帧的可疑区域;最后对可疑区域再使用特征提取算法进行相似点匹配,确定出视频篡改帧的位置及其篡改区域.结果证明了方法的有效性和鲁棒性,以及在执行时间上相对于已有算法的优越性.  相似文献   

11.
针对传统浮点型特征描述算法误匹配率高、匹配率低的问题,提出了一种基于尺度空间金字塔与AGAST(adaptive and generic accelerated segment test)快速特征提取相融合的局部二进制特征匹配算法(Agast-Adaboost local binary feature matching algorithm,ALBFMA).该算法首先构建高斯尺度空间金字塔,将AGAST与尺度空间融合并提取特征点,然后用改进的Adaboost算法对特征点进行二值描述,生成特征向量,从而提高该算法的匹配速率和匹配精度.实验结果表明:与已有算法相比,该算法具有匹配精度高的优点,并且对光照、尺度及旋转有良好的鲁棒性.  相似文献   

12.
针对无人机视频数据,提出一种快速逐帧匹配算法。该算法首先使用计算机在每一帧中均匀标记一定数量的点,接着利用视频相邻帧之间的特点使用绝对差值法完成同名点的寻找,之后引入内插理论建立预测模型,缩小了搜索窗口和匹配窗口大小,降低了算法时间复杂度。实验结果表明,该算法可以高效地完成相邻帧之间的匹配。  相似文献   

13.
为了实现旋转摄像头下运动目标的监控,提出了一种动态背景下提取运动目标的方法.在全局运动估计过程中,首先提取当前帧的特征点并将其离散化,然后以特征点为中心在当前帧和前一帧之间进行块匹配,其后用3σ准则除去误差块,从而得到全局运动估计量,并且在VC平台上实现了该算法.  相似文献   

14.
针对人体运动动作图像提取传统方法仅能获取局部最佳解, 提取的特征序列不连续, 导致轮廓提取效果差的问题, 提出一种非刚性人体运动动作图像姿态轮廓提取算法. 首先, 对人体运动动作图像序列中的尺度不变特征变换(SIFT)进行提取预处理, 获取人体特征提取图, 设计一种人体运动序列顺序概率图模型, 以保证特征序列提取的连续性; 其次, 构建人体肢体外观模型, 基于该外观模型采用序列影像高精度轮廓提取算法提取当前人体运动动作帧的轮廓线. 实验结果表明, 该算法能提取连续的特征序列, 提取的人体姿态轮廓精确度较高, 且具有较高的效率和鲁棒性.  相似文献   

15.
提出一种基于稀疏、稠密特征转换的仿射不变特征匹配算法,其中稀疏特征包括坐标,尺度,仿射模拟参数等,稠密特征指基于图像局部区域内光学属性的局部描述符.本文算法在Affine-SIFT算法基础之上,针对在特征提取阶段仅使用稀疏特征提取的缺陷做出了改进.由于稠密信息只有在稀疏参数满一定足检测条件时才能提取到特征,导致本可以匹配到的特征(包括稀疏、稠密参数)无法提取,将通过使用稀疏特征构造新的模拟图像,通过将稀疏特征重新稠密化,并在模拟图像基础上进一步提取稀疏特征,同时可检测到原始图像中检测不到的可匹配特征,最终达到增大特征建立匹配的概率,提升正确匹配数量的目标.经实验验证,本文提出的稀密特征转换算法相比于ASIFT算法能大量增加特征匹配的数量.除针对ASIFT方法提供扩展外,该方法也可用于扩展具有充分稀疏特征参数的其它特征提取和匹配方法,并适用于目标识别、目标分类和三维重建等问题.  相似文献   

16.
利用网络摄像机和图像处理单元设计了一种眼部动作实时识别系统.该系统首先用帧差法检测出眨眼的动作区域,将此区域设置成感兴趣区域,并用图像形态学算法对其进行处理;然后找出眼部轮廓,并以此区域创建模板,再利用此模板对每一帧图像进行模板匹配,找出匹配中的最小值,以得到识别的结果;最后通过实验验证了该算法的有效性.该系统有广泛的应用前景,如实现模拟鼠标的控制等.  相似文献   

17.
为了提高武术散打鞭腿的动作有效指导性,提出基于特征提取的武术散打鞭腿动作视觉图像识别方法。结合帧片段扫描技术进行武术散打鞭腿动作视觉图像采样,采用边缘特征分割方法进行动作视觉特征表达处理,建立动作视觉图像的边缘轮廓特征分析模型,结合模糊度辨识方法进行动作视觉图像的去模糊度处理,提高动作视觉的输出信噪比,建立动作视觉特征分析和自适应特征提取模型,根据对动作视觉特征提取结果实现对武术散打鞭腿动作视觉图像识别。仿真结果表明,采用该方法进行武术散打鞭腿动作视觉图像识别的准确性较高,特征识别能力较好,在指导武术散打鞭腿动作训练中具有很好的应用价值。  相似文献   

18.
对H.264编码的视频流解码出现宏块丢失进行错误掩藏时,使用传统的时空域错误掩藏算法,并不能很好地恢复出原始视频帧,影响了主观观赏效果和客观视频质量.因此,分别对时空域提出了相应的改进算法.时域通过增加参考帧、运动矢量,改进匹配算法等,提高了运动矢量的搜索精确度和运动剧烈视频帧的错误恢复质量.空域通过自适应的选择加权像素平均插值和方向插值,并改进了方向插值算法,明显提高了视频帧的恢复质量,避免了错误边缘的产生.实验结果表明,改进的时空域错误掩藏算法,不仅提高了方向插值的准确性和宏块匹配的精确度,而且可以减少块效应的出现,从而有效地提高了丢失宏块的恢复质量.  相似文献   

19.
多目标跟踪领域中,在背景复杂、目标遮挡、目标尺度和姿态变换等情况下,容易出现目标丢失、身份交换和跳变等问题.针对这些问题,提出了一种基于检测的多目标跟踪算法,使用改进的YOLO人体人脸关联算法,对当前帧待检目标进行分类和位置检测,使用生成对抗网络构建特征提取模型,学习目标的主要特征以及细微特征,再运用生成对抗网络生成多目标的运动轨迹,最终融和目标的运动信息和外观信息,得到跟踪目标的最优匹配.在MOT16数据集下的实验结果表明,提出的多目标跟踪算法具有较高的精确度和鲁棒性,对比目前身份交换和跳变最少的算法,跳变的次数少了65%,准确度提高了0.25%.  相似文献   

20.
目前基于内容特征的视频检索系统,大多采用提取视频关键帧的颜色、纹理、形状等底层特征,来进行视频相识度匹配,这些底层特征是基于全局统计或者人工设计的特征提取方式,存在泛化抽象能力不强、易受光照和噪声的影响等问题,同时,由于未考虑视频帧时序上的关联性,导致视频检索精度偏低。为此,基于深度学习框架,提出了一种视频时空特征提取算法。该算法以关键帧附近16帧图像作为学习源,采用三维卷积神经网络,融合帧的内容特性和时序变化特性,获取4 096维特征向量作为新的视视时空特征描述子。在标准动作视频数据集UCF-101上进行实验,结果表明该特征能显著提高视频检索精度,在查全率为90%的情况下,平均查准率不低于84%,检索效果优于传统视频检索方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号