首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
提出了一种空 时快速鲁棒特征(SURF)描述子,并且结合视频词汇概念,应用于人行为识别.这种新的描述子在行为识别应用中能很好地体现视频的时空本质,通过词袋(Bag of Words)模型来表征视频,且在表征过程使用了非硬性权重.实验以瑞典皇家理工学院的行为识别数据集作为测试对象,使用了相关领域传统的分类策略,同时引入了包含二次判断的投票系统.实验结果证明,结合特征描述子和视频词汇的行为识别框架在速度和准确率上均优于已有的一些方法,同时该分类策略在某些行为类型上优于传统的分类方法,能有效地应用于行为识别领域.  相似文献   

2.
基于融合MPEG-7描述子和二次预测机制的视频自动分类算法   总被引:1,自引:0,他引:1  
针对互联网上日益增长的视频数量,提出了一种大量融合MPEG 7描述子并启用二次预测机制的视频自动分类方法.研究了颜色、纹理、形状、运动等9种MPEG 7描述子,从5类视频中提取并融合这些描述子作为视频的整体特征,输入支持向量机(SVM)中进行模型训练和预测.在传统支持向量机的1 1方法中,通过启用二次预测机制来提高分类的准确率.实验结果表明,该方法与其他方法相比有较高的准确率,适合大规模、复杂环境下的视频自动分类任务.  相似文献   

3.
针对暴力视频的检测方法均是单一模态的且效率相对较低等问题,提出文本、视频以及音频3种模态的信息融合算法,构建网络暴力视频识别系统,设计文本以及视音频分类器;将文本分类器当做预分类器完成视频的分类操作,从而获得候选暴力影视,随之运用视音频分类器完成对其的进一步分类;开展实验分析,并与单一模态的分类算法进行对比。结果表明,该信息融合算法显著提升了识别精度,缩减了计算量,改善了分类效果。  相似文献   

4.
基于稀疏编码和多核学习的图像分类算法   总被引:1,自引:0,他引:1  
提出了一种基于稀疏编码和多核学习的图像分类算法.首先从图像中提取Dense-SIFT(Dense Scale Invariant Feature Transform)和Dense-SURF(Dense Speeded Up Robust Feature)2种特征,使用稀疏编码对特征点进行处理,得到一系列高维向量,然后对这些高维向量应用max-pooling算法,将图像表示成单个向量.最后,使用改进的多核学习方法对这些向量进行分类,对于不同的特征,使用不同核的组合以达到最好的分类效果.实验结果表明,该算法作为词袋(BoW)模型的改进,能够提高分类准确率.
  相似文献   

5.
针对中文问句分类缺乏丰富的句法语义特征,提出一种基于词袋绑定的问句新特征自动生成方法.在词袋(BOW)、词性(POS)和词义(WS)等基本特征的基础上,通过将词性、词义等与词袋分别进行绑定,自动获取一类新的问句特征即词袋绑定特征.采用SVM分类器在哈工大中文问句集上实验,结果表明与原来单个的POS、WS等基本特征相比,对应的W/POS、W/WS等词袋绑定特征在分类精度上均获得了显著的提升;而且对这些词袋绑定特征进行启发式组合以后,在77个小类问题类别的总体分类精度达到82.333%,取得了较好的分类效果.说明在基本特征基础上借助词袋绑定操作进一步构造问句新特征的方法简单而有效.  相似文献   

6.
MPEG7是一个用于描述多媒体内容特征的国际标准。该文基于MPEG7设计实现了一个视频内容检索系统。首先,设计基于MPEG7的视频特征存储方法,即研究如何有效解析MPEG7视频描述文档,从中提取视频语义特征,建立视频特征库;然后,设计基于内容特征的视频检索方法,即设计一个有效的内容视频查询接口和相应的视频查询处理方法,以从视频数据库中检索出目标视频;最后,实验评估验证了该视频检索系统的有效性。  相似文献   

7.
针对视频信息具有的多模态性质,提出了融合视音频多种模态特征信息的视频融合分析框架,用以提高视频检索的正确率和效率.该框架根据从视频底层提取出的多种图像特征、音频特征,采用基于图嵌入框架的降维算法MFA降维,根据降维后得到的各种特征向量,训练SVM分类器进行分类,并用改进后的MGR融合算法对SVM分类器输出的序号矩阵进行融合分析.实验结果表明该融合框架融合多种特征提高了分类识别的效率,采用了改进的融合算法降低了计算复杂度,提高了系统的整体性能.  相似文献   

8.
针对语音/音乐分类过程中由于特征参数提取过多造成的维数灾难及分类准确率有待提高等问题,提出了一种基于过零率及频谱的语音/音乐分类算法.该算法在对语音及音乐2类信号进行端点检测及分段预处理后,结合每一音频段的过零率和频谱幅值特性进行分类识别处理,最后通过计算被判别为语音或音乐的概率实现分类.实验结果表明,此算法在音频分类中较同样最多只提2个音频特征且未用分类器算法的准确率平均提高约7.9%,较提取多个音频特征且采用分类器算法的准确率平均提高约5.7%.证明了该算法不仅计算量小,且分类准确率也有所提高.  相似文献   

9.
基于知网语义相似度计算的特征降维方法研究   总被引:9,自引:1,他引:8  
针对文本分类处理中的高维度问题,结合知网语义词典,提出了一种新的特征降维处理方法.通过计算特征词汇之间的语义相似度,将原有特征集分成若干特征词集;同一词集内的特征词语义彼此间相似;而不同词集的特征词彼此间相似度比较小.将同一特征词集内的词汇权重相加,从而突出同义词以及近义词对文本分类的贡献,并可以大大降低文本比较的特征维数.实验结果表明,利用该方法在文本分类中得到了较好的分类准确率和分类性能.  相似文献   

10.
提出了一种结合词袋法的3维尺度不变特征转换(3D-SFIT)算子,并应用于人的动作识别.将运动的人从图像背景分割出来并计算特征算子,用词袋法表征视频,最后采用支持向量机(SVM)对动作进行分类.采用Weizmann动作数据库对本方法进行测试,实验结果表明:3D-SFIT算子能很好地描述视频序列的本质,比传统的描述算子更...  相似文献   

11.
按照MEPG-7的音频特征规范,设计了帧层次和段层次上的音频特征提取算法.在深入分析足球比赛中各类音频信息的不同特点的基础上,通过有针对性地选取特征,构造特征向量,设计并实现了一种基于决策树的层次化分类算法.该算法可以自动将足球比赛中的音频信息分为噪音、解说员语音、哨音、欢呼声和带背景音的解说员语音等5个类别.实验表明:该算法提取的特征有效,分类效果良好.  相似文献   

12.
适应调频同步广播的MPEG-2再复用器PCR修正算法   总被引:1,自引:0,他引:1  
 节目参考时钟(PCR)是MPEG-2系统中音视频解码的时间基准,MPEG-2解码器利用PCR时间信息控制MPEG-2视频解码、显示时间及音视频同步。PCR修正是MPEG-2再复用器设计的关键技术之一。对目前再复用器实现中的PCR修正算法及MPEG-2标准传输流中PCR进行分析研究,提出了一种新的MPEG-2再复用器PCR修正算法。采用该修正方法,可以避免再复用器在再复用过程中对MPEG-2信号进行缓冲后PCR包中标识的PCR值和解码器实际接收到PCR包时的时间值不一致情况的发生;解决了MPEG-2解码时由于不一致引起的PCR抖动和缓冲区溢出问题;使解码器可以利用该PCR信息恢复出编码端的时钟,保持编、解码器时钟同步。采用该修正算法修正的再复用器的音频信号可满足对时间要求更苛刻的调频同步音频广播的要求。  相似文献   

13.
在Clenshaw’S递归算法基础上,采用奇偶双路并行和蝶型单元技术,提出一种高效的MDCT/IMDCT递归结构,将N点MDCT/IMDCT的计算周期降低到N^2/16+2.这个递归结构具有通用性,适用于MDCT和IMDCT的计算,可提高电路结构的有效利用率.同时,其在Xilinx Virtex-Ⅱ Pro FPGA开发板上实现了256点MDCT递归电路.实验结果表明,该递归结构在运算速度、数据吞吐率和硬件利用率方面均取得较大的改进.另外,该MDCT/IMDCT电路结构可以应用在国际音频编码标准MPEG-1,MPEG-2,MPEG-4以及数字音频压缩系统Dolby AC3中.  相似文献   

14.
基于小波变换和支持向量机的音频分类   总被引:1,自引:0,他引:1  
音频特征提取是音频分类的基础,而音频分类又是基于内容的音频检索的关键。使用小波变换和支持向量机的方法对音频进行分类。研究了小波变换域的音频特征提取,分析了这些特征在小波变换域中的意义。把得到的特征向量作为支持向量机的输入,把音频分成纯语音、带背景音乐的语音、音乐、环境音4种类型。实验结果表明,基于小波域的特征计算简单、能够较好地区分不同的音频类型,得到较高的分类精度。  相似文献   

15.
文章提出一种对MPEG-1静态文件进行索引的方案。该方案把MPEG-1静态文件分解成独立的系统信息、音频流和视频流,并建立索引树。根据索引可以快速地对音频流和视频流进行搜索和定位,还可以按照流媒体传输规则打成RTP包,并介绍了一种简便易行的视频容错策略。  相似文献   

16.
17.
针对数字网络视频监控系统的需求,研制了一种基于MPEG-4网络视频服务器.使用基于DM642的MPEG-4实时视频压缩卡压缩采集到的音视频数据,利用环形队列实现服务器实时音视频数据的存储,同时运用多线程技术以及传输机制解决网络数据的传输,从而有效克制了画面不清晰、音视频不同步、马赛克等现象,保证客户监看时音视频实时性和同步性.  相似文献   

18.
传送流无缝拼接技术   总被引:1,自引:0,他引:1  
明确了在MPEG-2传送流(TS)无缝拼接技术中拼接点选择、信息一致性、音视频同步和缓冲区溢出等关键问题,并针对上述问题提出了基于系统层和基于基本层的无缝拼接方案.基于系统层的方案算法简单,计算量小,运算速度快,但对拼接点的选择要求较高,灵活性较差;基于基本层的方案能够实现以帧为单位的无缝拼接,可以随意选择拼接点,但需用到转换编码技术,算法较复杂,计算量较大.实验表明,2种方案都可以实现TS流无缝拼接,得到的拼接流符合MPEG-2标准.  相似文献   

19.
MPEG-2标准在有线数字电视机顶盒中的应用   总被引:3,自引:0,他引:3  
MPEG-2作为一个关于运动图像压缩的国际标准,已经被广泛的应用于视频压缩的各个领域,可以对目前各种级别的视频、音频进行编码. 文章分析了目前正在中国广泛试运行的有线数字电视付费频道业务中所使用的机顶盒对此标准的具体应用.  相似文献   

20.
文章介绍了一种在 TMSC60 0 0系列 DSP芯片上实现 MPEG-1标准的音视频数据合成的软件实现方法 ,详述了音视频信号的同步与实时播放的实现要点 ,同时介绍其相关应用。该实现方法可以满足在嵌入式网络多媒体监控系统中实时编解码并显示的应用需求 ,并可适用于其它嵌入式视频音频的压缩编码系统  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号