首页 | 本学科首页   官方微博 | 高级检索  
     检索      

大数据背景下的恐怖主义信息传播途径分析
引用本文:孙学诚,陈前,唐家骏,石小川.大数据背景下的恐怖主义信息传播途径分析[J].吉林大学学报(信息科学版),2019,37(1):88-95.
作者姓名:孙学诚  陈前  唐家骏  石小川
作者单位:武汉大学 计算机学院,武汉,430072;武汉大学国家网络安全学院,武汉,430072
基金项目:国家社会科学基金青年基金资助项目( 16CXW034)
摘    要:为加强对互联网以及社交媒体的恐怖主义信息的甄别和处理,利用数据的爬取和分析甄别,分类恐怖主义信息。通过scrappy 框架以及gensim 工具包对数据进行爬取,得到了4 个数据集,并且进行LDA( Latent Dirichlet Allocation) 主题模型的建立,分别得到恐怖主义信息传播在4 个不同领域中的主题分类,以及主题间的关系。实验表明,通过爬取可以有效鉴别出不同的恐怖主义信息主题,以及其在传播中的作用。

关 键 词:恐怖主义  大数据  网络爬虫  主题分析

Analysis on Spread of Terrorism through Media in Era of Big Data
SUN Xuecheng,CHEN Qian,TANG Jiajun,SHI Xiaochuan.Analysis on Spread of Terrorism through Media in Era of Big Data[J].Journal of Jilin University:Information Sci Ed,2019,37(1):88-95.
Authors:SUN Xuecheng  CHEN Qian  TANG Jiajun  SHI Xiaochuan
Institution:a. School of Computer Science; b. School of Cyber Science and Engineering,Wuhan University,Wuhan 430072,China
Abstract:Improving screening and addressing terrorist information in social media becomes a critical topic of research. Our study uses data crawlers and screening analysis to classify different terrorist information. Through scrappy framework and genism tool pack,we obtained the relevant data from four datasets. After constructing a LDA ( Latent Dirichlet Allocation) theme model,we then classified several themes in four different area that played major roles in propagating terrorism,and investigated the interconnected relationship between these themes. The experiment indicates that the model can effectively distinguish different themes of terrorism information and the role it played in propagation.
Keywords:terrorism  big data  web crawler  theme analysis  
本文献已被 万方数据 等数据库收录!
点击此处可从《吉林大学学报(信息科学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(信息科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号