首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向不均衡数据集的在线式异质媒体网络事件发现
引用本文:赵学武,张新刚,柴鹰,刘广亮.面向不均衡数据集的在线式异质媒体网络事件发现[J].科学技术与工程,2016,16(16).
作者姓名:赵学武  张新刚  柴鹰  刘广亮
作者单位:软件学院 南阳师范学院 河南 南阳; 计算机学院 北京工业大学 多媒体与智能软件技术北京市重点实验室,南阳师范学院 计算机与信息技术学院,河南 南阳,计算机学院 北京工业大学 多媒体与智能软件技术北京市重点实验室,软件学院 南阳师范学院 河南 南阳
基金项目:国家自然科学重点项目(613300194),河南省科技计划项目(142300410044),河南省教育厅科学技术研究重点项目(14A520057,15B520022),南阳师范学院校级项目(QN2015025)
摘    要:随着互联网的发展,网络数据呈现出异质数据多、文本标签化、数据不均衡等特点,这使得传统的基于长文本在线式网络事件的方法逐渐失效。采用改进的Single Pass方法进行在线式异质媒体网络事件发现:首先,通过分析网络数据中的不均衡性,重新设计相似度计算公式;其次,设计滑动时间窗口来提高Single Pass的算法效率;最后在Flickr的SED2014数据集上开展实验。实验结果表明,提出的算法具有有效性和实用性。

关 键 词:在线式  网络事件发现  单遍聚类  异质媒体
收稿时间:2016/1/11 0:00:00
修稿时间:2016/5/27 0:00:00

Heterogeneous Media Online Web Event Detection For Imbalanced Datasets
Institution:Beijing Municipal Key Laboratory of Multimedia and Intelligent Software Technology,College of software,Nanyang normal University,Henan Nanyang
Abstract:With the development of Internet, the web data has present the characteristics of heterogeneous, text tagging and imbalanced data, which leads to the failure of the traditional online event detection method based on long text. In this paper, we adopt the improved Single Pass Algorithm to detect online heterogeneous media web events. On one hand, we redesign the similarity calculation formula based on the imbalanced data. On the other hand, we design the slice-windows to improve single pass algorithm runtime. The result on SED2014 dataset shows the effectiveness and practicality of our algorithm.
Keywords::online  web events detection  single pass  heterogeneous media
本文献已被 CNKI 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号