首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 46 毫秒
1.
音频分割是提取音频结构和内容语义的重要手段,是基于内容的音频分析、检索的基础.提出分层熵检测音频分割算法,采用定长分析窗分层结构遍历音频流,窗内根据熵变化趋势检测跳变点.实验结果表明,该算法避免了ΔBIC分割算法中的硬门限判决和数据累积问题,是一种更加有效的音频分割方法.  相似文献   

2.
为了克服基于贝叶斯信息准则(BIC)的音频跳变点检测方法存在的缺陷,提出了音频跳变点的分割熵检测算法.该方法通过检测音频信号内部信息熵的变化趋势来检测跳变点的声学特征.结果表明:该方法可避免因设定固定门限而导致的漏检和数据积累带来的累积误差,能够准确地切分各种声学特性的音频数据,是一种更为直观和有效的跳变点检测方法,具有很高的灵敏度和鲁棒性.  相似文献   

3.
针对广告编辑手法多样导致的广告单元分割较难的问题,提出了融合音频和文本信息的广告单元分割算法.对广告中的音频数据进行高斯混合模型建模,基于分割熵实现音频跳变点检测.沿着时间轴,结合音频跳变点和基于小波变换和支持向量机的文本检测实现对广告单元切换点的第一轮检测.基于时间间隔进行广告单元切换点的第二轮检测.实验证实该算法对广告单元中音频跳变点检测的查全率和查准率高于80%,对广告单元分割的查全率和查准率约为70%.  相似文献   

4.
利用遗传算法的高效搜索性能和模糊集合理论能较好地描述问题的模糊性和随机性,提出了基于遗传算法的最大模糊熵快速分割算法,将遗传算法和模糊集合理论结合起来应用于灰度图象单闽值和多阈值分割.实验结果证明该方法有效地实现了快速分割,并具有较好的鲁棒性.  相似文献   

5.
视频分割是视频结构化组织的基础,提出一种结合音频和视觉信息的视频分割新方法,即先对视频作基于边变化率的初步分割,然后提取音频的MFCC及其差分系数特征,利用广义似然比(GLR)距离对音频信息进行相似性比较,并检测相应的音频变化点,在此基础上,应用间频分割点对初步的分割进行验证,获得具有一定语义内容的视频段,实验结果表明,方法简单有效,与单一的基于视觉信息的分割方法相比,获得的视频片段语义信息更为完整,同时也避免了分割的过度细碎。  相似文献   

6.
在音频相关的系统中,迫切需要利用语音识别技术对音频流自动识别和分割,以及针对不同的应用需求, 利用消息-动作自动机进行各种复杂控制.为此,介绍了一种新的具有实时性的音频流分割系统的设计思路及其 程序实现.  相似文献   

7.
一种基于多熵阈值图像分割的边缘检测新方法   总被引:1,自引:0,他引:1  
该文提出的熵阈值分割图像边缘检测新方法,在噪声严重的情况下,能够提取出准确连续的物体边缘,实验结果表明这种方法能获得比Sobel算子及Kapur多阈值分割法更为满意的边缘检测结果,这一方法在出版系统中具有一定的实用价值。  相似文献   

8.
为提高医学图像分割的视觉效果,依据人类视觉感知的分层特性,提出了一种新的复合医学图像分割方法.该方法通过提取医学图像的底层特征,利用Fuzzy-ART神经网络作为像素的分类器,对医学图像进行连续两次分割.实验结果表明,该医学图像分割方法能有效地解决局部信息与整体分布边缘淡化等相关问题,达到良好的分割视觉效果.  相似文献   

9.
一种改进的先进音频编码固定码率控制算法   总被引:1,自引:0,他引:1  
国际标准化组织所建议的标准算法在实现先进音频编码(AAC)固定码率时,存在码率不稳定和计算量大的问题.为此,文中提出了一种新的固定码率控制算法.该算法在为当前帧分配比特时,充分考虑比特缓冲池的使用情况和编码复杂度,使比特缓冲池真正起到缓冲作用;同时根据编码所需比特数和感知熵的关系,在量化循环之前进行掩蔽阈值的预调整.实...  相似文献   

10.
如何有效地对海量数据尤其是诸如音频之类的多媒体数据进行分析、存储和检索是一个有待解决的问题.由于原始音频数据的非结构化特性,音频检索受到极大的限制.相对于日益成熟的图像与视频检索,音频检索相对滞后.基于内容的音频检索己成为多媒体检索技术的研究热点.本文对基于内容的音频检索的音频分层分割算法展开分析,提出一种基于压缩域特征音频分割域识别算法.经试验结果显示,此算法由于不依赖于具体的应用阈值,使此算法准确率有较大提高.  相似文献   

11.
光照不均匀往往造成背景亮度不均和灰度分布范围较大,会导致图像分割困难和不准确.考虑图像的边缘信息受光线变化相对不敏感,引入梯度熵信息对Canny算法进行改进提取准确合适的边缘.采用最小二乘法的多项式曲面拟合获得阈值曲面,进而提出了基于梯度熵改进边缘检测的自适应阈值曲面分割算法.对多种背景灰度分布不均匀的图像进行算法验证...  相似文献   

12.
提出了基于图像熵的快速Chan-Vese模型分割算法.该算法利用实时图像熵自适应计算模型能量函数中的拟合参数以提高分割速度,并通过检测熵在曲线形变过程中的变化来判定曲线演化的稳定态.实验表明.针对含噪严重、目标模糊且边缘不连续的红外图像目标检测,所提出的分割算法可以取得精确、高效的分割结果.  相似文献   

13.
音频信号在拼接、重压缩、变速变调、伪装高质量音频等篡改操作中, 经常伴随着重采样的操作. 因此, 检测重采样是音频取证的重要方面. 提出采用二阶差分的方法来检测重采样音频, 从理论上证明了重采样的音频信号经过二阶差分处理后, 频谱上会呈现出明显的离散尖峰, 该方法也适用于常见的非线性插值情况. 运用该特点设计了重采样的自动检测方案, 研究了离散尖峰与音频时长、音频内容、音频格式的相关性. 大量实验结果表明, 该方法能够简单、快速、有效地检测重采样音频.  相似文献   

14.
提出了利用图像局部最大熵进行区域增长的多目标分割方法.以局部熵最大值作为目标种子,运用区域增长技术实现多目标分割,用图像的局部熵值相似性判决准则和图像灰度相似性判决准则对复杂多目标砾石图像进行了实验.实验结果表明,用图像局部熵相似性判决准则的图像分割结果优于用图像灰度值相似性判决准则的图像分割结果.  相似文献   

15.
针对基于粗糙熵的图像分割算法不能满足复杂图像的多类目标提取的需要,本文先利用K-均值聚类算法对图像进行区域分割,再利用基于粗糙熵的方法对分割结果进行目标提取,从而达到多阈值分割的目的。通过对遥感图像进行分割处理,证明了改进后算法的有效性。  相似文献   

16.
针对传统活动轮廓对图像分割鲁棒性较差的问题, 将基于区域的轮廓模型和基于梯度的轮廓模型通过图像熵与图像梯度和进行结合。通过图像熵与图像梯度和建立基于梯度与基于区域结合的活动轮廓模型。将水平集函数嵌入到模型中, 对模型结果进行连续分割, 并进行拓扑变化。采用窄带方法进行快速演化。实验证明, 该方法有较好的鲁棒性和较快的分割速度, 对图像分割理论的发展提供了新的研究途径。  相似文献   

17.
基于二维灰度直方图的模糊熵分割方法   总被引:7,自引:0,他引:7  
传统的基于一维灰度直方图的模糊熵分割方法不能反应图像的空间信息,抗噪声能力差,因此提出了基于二维灰度直方图的模糊熵分割算法.此算法根据像素点灰度值和其邻域灰度均值,建立二维灰度直方图,并在对应目标和背景的像限内构造像素点对目标和背影的隶属度函数,从而去除噪声和边缘像素对图像分割的影响.最后通过求模糊熵的极值,得到二维图像分割点.实验结果证明,该方法具有很强的鲁棒性和抗噪能力,分割效果明显优于一维的方法,而且可以方便地推广到其他一维熵分割中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号