首页 | 本学科首页   官方微博 | 高级检索  
     检索      

"文本为主"的多模态特征融合的新闻视频分类算法
引用本文:王鹏,蔡锐,杨士强."文本为主"的多模态特征融合的新闻视频分类算法[J].清华大学学报(自然科学版),2005,45(4):475-478.
作者姓名:王鹏  蔡锐  杨士强
作者单位:清华大学,计算机科学与技术系,北京,100084;清华大学,计算机科学与技术系,北京,100084;清华大学,计算机科学与技术系,北京,100084
基金项目:国家 "九七三" 重点基础研究项目(G1999032704)
摘    要:视频分类算法通过融合多模态特征提高分类性能.大多数多模态特征融合算法采用统一模式处理不同模态特征,忽略文本与声音/图像特征在视频分类能力和可靠性方面的差异.该文提出一种新闻视频分类算法,采用文本为主,声音/图像为辅的特征融合模式.该算法充分考虑文本特征在内容分类方面的高可靠性,并在适当情况下,辅以声音/图像信息为补充.对10类新闻视频进行分类实验,并与其他两种分类算法对比,表明在提取相同的底层特征情况下,该文算法的平均分类性能最佳.

关 键 词:视频分类  特征融合  多模态
文章编号:1000-0054(2005)04-0475-04
修稿时间:2004年2月20日

News video classification using multimodal classifiers and text-biased combination strategies
WANG Peng,Cai rui,YANG Shiqiang.News video classification using multimodal classifiers and text-biased combination strategies[J].Journal of Tsinghua University(Science and Technology),2005,45(4):475-478.
Authors:WANG Peng  Cai rui  YANG Shiqiang
Abstract:
Keywords:videoclassification  feature fusion  multimodal  classifiers  
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号