首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
"文本为主"的多模态特征融合的新闻视频分类算法   总被引:4,自引:0,他引:4  
视频分类算法通过融合多模态特征提高分类性能.大多数多模态特征融合算法采用统一模式处理不同模态特征,忽略文本与声音/图像特征在视频分类能力和可靠性方面的差异.该文提出一种新闻视频分类算法,采用文本为主,声音/图像为辅的特征融合模式.该算法充分考虑文本特征在内容分类方面的高可靠性,并在适当情况下,辅以声音/图像信息为补充.对10类新闻视频进行分类实验,并与其他两种分类算法对比,表明在提取相同的底层特征情况下,该文算法的平均分类性能最佳.  相似文献   

2.
基于视频区域特征及HMM的体育视频分类研究   总被引:1,自引:0,他引:1  
提出了一种基于视频区域特征的体育视频分类方法.首先将帧分块,对块亮度均值大小进行比较得到块亮度比较编码信息BICC,以及对视频帧各块的颜色分量进行统计得到块颜色直方图;再利用这些特征通过SVM对体育视频进行分类;最后利用一阶HMM对SVM的输出结果进行后处理,得到视频的最终分类结果.实验结果表明,方法对于体育视频分类的效果较好.  相似文献   

3.
在计算机辅助心血管诊断中,其中最重要的步骤就是对超声心动视频的分类。因此提出了基于LSOE和AK-SVM的超声心动视频分类算法。首先为了克服超声心动视频本身存在的低对比度和快速不规则运动问题,提出基于局部时空方向能量(LSOE)对超声心动视频的特征进行提取并将其转换为可描述的中间文件,接着为得到最好的分类效果提出了加性核SVM对其进行学习和分类并得出其分类的准确率。在文献[1]超声心动视频数据集上取得了目前最好的分类效果,超声心动影像的平均分类准确率为75.37%。  相似文献   

4.
目前,各大社交平台和视频点播网站的网络视频数量出现了爆炸式的增长,如何快速准确地对这些网络视频进行归类和管理成为了研究的热点问题﹒为了较好地解决这种分类任务,文中提出了基于描述文本和实体标签的网络视频分类算法,该算法结合了描述文本内容和知识图谱中的实体标签来构造文档-特征矩阵﹒实验结果表明使用了实体标签的视频分类算法性能更好,平均精确率和平均召回率以及平均F1值比未使用实体标签的视频分类算法要高2%以上﹒  相似文献   

5.
针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口(MPEG 7)音频特征(包括音频频谱质心,音频频谱带宽等低层音频特征.)及MPEG 7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率.  相似文献   

6.
基于直方图差分的视频分类方法   总被引:1,自引:0,他引:1  
针对当前视频自动分类算法复杂计算量大等问题,提出一种简单的自动视频分类方法,即基于直方图差分的统计方法。获得每个视频的直方图差分曲线后,调整去掉编辑特效造成的虚假峰,得到每个视频的每秒平均镜头切换次数,以此作为广告视频和非广告视频的分类依据,进行C-均值聚类。实验结果表明,该方法以较少的工作量获得了较好的分类结果。  相似文献   

7.
针对视频检索系统中目标持续移动从而影响检索精度的问题,提出一种基于视频剪辑查询融合时空金字塔匹配(spatio-temporal pyramid matching,STPM)方法.借助基于特征分析和分类的片段编辑检测器将新的视频分割成多个片段,以元数据信息将视频片段存入数据库,利用基于逐帧特征结合弱分类器的boosting算法检测视频片段边界,针对新的查询视频进行分析和线上视频匹配,并利用时空金字塔匹配计算相关反馈值.在中佛罗里达大学(university of central Florida,UCF)数据集和YouTube运动视频上的实验验证了方法的有效性,实验结果表明,方法的平均精度可高达97.6%,相比其他几种较为新颖的匹配方法,取得了更好的检索性能.  相似文献   

8.
为了充分利用短视频资源,提出了基于短视频分类和时长的无载体信息隐藏方法.该方法对短视频内容进行分类,设置特定类别作为取位标志;对短视频时长划分区间,分别用来映射秘密消息、代表传输开始和结束标志、代表用户的正常生活.分析结果表明,该方法具有5 bits/视频的高隐写容量、较高的隐蔽性和鲁棒性.  相似文献   

9.
为弥补特征提取中的语义缺陷,提出了一种利用领域知识规则填补特征与高级语义之间鸿沟的思想,从体育视频中对语义对象进行有效的特征提取,并采用支持向量机元分类器和组合策略对体育视频进行分类的方法.实验表明,该分类方法对大部分体育视频都具有很好的分类效果,平均准确率可达92.23%,优于其他提取特征无语义关联的分类方法.  相似文献   

10.
针对现有体育视频分类方法中采用单个特征或简单组合无法提高分类精确度问题,提出一种颜色和纹理非线性融合的特征提取方法,并进一步设计基于SVM的分类器.主要工作包括:颜色空间转换、颜色索引矩阵定义、颜色共生矩阵定义、颜色纹理提取和多分类算法设计.实验结果表明非线性融合方法比单颜色、单纹理或颜色和纹理的简单融合在体育视频分类上具有更好的类别区分度,分类精确度平均分别提高了9.94%,8.66%,6.90%.  相似文献   

11.
姚捃  郭志林  赵杰 《科学技术与工程》2022,22(22):9721-9727
在实际监控的边缘设备中利用TSN或者3DCNN网络很难实现实时的、相对准确的监控任务。提出一种结合了人体检测和人体属性分析的考场行为识别算法。相对于以提取时空特征作视频分类算法为主流思想的行为识别,利用视频帧以人体检测和人体属性分析结合的行为识别方法更加快速准确。方法借助了多标签学习、注意力机制和特征金字塔等策略来改进任务,同时利用迁移学习对本地采集的数据集进行再训练,实验结果表明达到了主流数据集的良好性能,并在考场环境具有高效性与实用性。  相似文献   

12.
针对基于词语特征的Email分类综合性能(F-score)较低的问题,提出一种基于主题特征的Email分类方法.该方法利用领域知识及统计信息,从Email的词语特征空间中提取主题特征,并利用提取出的主题特征实现Email分类.通过对1080封Email进行分类测试,结果表明,由于主题特征能够更加准确地表达Email的主题思想,因此,与基于词语特征的分类方法相比,该方法在针对Email的全文及标题实现分类时,将平均F-score分别提高了13.16%和17.16%,从而使平均F-score提高到72.37%,基本可以满足实际应用的需求.  相似文献   

13.
针对复杂场景中的人车分类问题, 提出一种基于多粒度感知SVM (support vector machine)的复杂场景人车分类方法。该方法首先对视频场景进行运动区域分析, 结合角点检测方法提取运动区域视觉感知信息, 在时空域中采用Kalman滤波将感知信息进行关联推理, 去除噪声干扰。 再以运动区域质心点为中心, 构造目标的多粒度感知特征, 最后构造2级SVM分类器, 将目标多粒度感知特征向量集输入SVM分类器进行训练及分类, 得到人车分类结果输出。实验结果表明, 该方法取得了良好的分类效果, 人、车全天候平均分类正确率分别达到93.6%以上, 能有效避免光照、色彩、目标大小等变化导致的误分类问题, 适用于智能交通视频的人车分类应用。  相似文献   

14.
为实现视频纹理的有效识别, 提出一种基于 LBP(Local Binary Patterns)和 KNN(k-Nearest Neighbor)的视频纹理识别算法。 该算法将视频纹理视为一个图像纹理集合, 通过多个图像纹理集合的方式表示。 由于可计算任意两幅纹理图像的相似度, 对于两个视频纹理, 可以计算两个图像纹理集合中所有元素之间的相似度, 将这些相似度中的最小值作为这两个视频纹理的相似度, 若要实现视频纹理的识别, 则可通过 KNN 算法实现分类与匹配。 通过在 DynTex 动态纹理数据库中的相关实验, 证明了该算法的有效性。  相似文献   

15.
Deep Web查询接口分类是实现Deep Web在线数据库分类访问的主要方法,本文在研究查询接口特征数据抽取和表示的基础上,通过对查询接口所在Web页的位置来构建对应的接口特征XML文档,根据XML文档中的节点位置不同,分别为不同的查询接口特征赋予不同的分类权重因子,以提高有效特征的分类能力,并采用信息增益算法实现最终分类特征的选择,然后采用KNN分类算法实现查询接口分类,实验结果表明此方法的实际可行性.  相似文献   

16.
为有效对视频数据进行降维并去除特征集合中的冗余信息, 以提高异常事件的检测效率, 从特征提取和选择的角度提出了融合特征区分度和相关性的视频异常事件检测方法。利用视频数据的时空邻域信息进行特征提取。通过分析特征的判别力和相关性进行特征选择, 从而去除特征集合中的冗余信息, 提高异常事件检测的效率和准确性。实验结果表明, 该方法的检测准确率都优于其他传统方法, 能有效地对场景中发生异常事件的区域进行准确定位。  相似文献   

17.
基于未确知测度的视频情感内容识别   总被引:1,自引:0,他引:1  
为有效识别视频情感的内容,基于未确知数学理论,建立了视频低层特征和高层认知情感之间的联系,提出了一种基于未确知测度的新算法.首先,选取能反映情感变化的场景亮度、镜头切变率和色调效能作为视频情感低层特征,介绍了每种情感特征的数据提取方法,并由此构建了视频情感特征向量.其次,构造了视频场景的未确知对象空间和指标空间,并给出...  相似文献   

18.
文本特征选择是自然语言处理中的关键问题。针对文本特征的高维性和稀疏性问题,在过滤式特征选择算法文档-逆文档评率(term frequency-inverse document frequency, TF-IDF)的基础上,提出了用遗传算法对文本特征进行优化选择,使其最大程度地贴合后续的文本分类算法,在保证文本分类精确度的同时,降低特征维度以缩减预测时间。实验显示,该算法与单一的过滤式文本特征选择算法相比,能够有效减少所选文本特征数量(即降低特征维度),能有效提高文本的分类能力。  相似文献   

19.
人脸识别中一种新的Gabor特征提取方法   总被引:6,自引:3,他引:3  
为了有效利用Gabor特征进行人脸识别,提出一种新的Gabor特征提取方法.首先利用类别可分离性判据评价Gabor展开系数的分类能力,选择最有利于识别的Gabor展开系数构造新的Gabor特征、然后对人脸不同局部位置处采样点的分类能力进行评价,选择分类能力最强的位置提取特征点、最后就新的Gabor特征对光照和表情变化的适应性进行测试.实验结果表明,新的特征提取方法能够在小样本条件下有效提高识别率,减少特征数量,并对环境变化具有一定的适应能力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号