首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 65 毫秒
1.
提出了一种基于开源云计算平台Hadoop的网络热点话题发现方案.该方案采用MapReduce分布式并行计算架构处理海量、复杂数据,通过将命名实体词作为文本的特征项,并采用标题和正文的双向量表示文本.实验结果表明:随着参与并行计算节点数的增加,话题聚类所有的时间显著下降,因而网络热点话题发现的速度得到明显提高.  相似文献   

2.
传统热点检测算法仅从单一的某个维度衡量话题的热度,导致热点话题检测精度低,在对突发性热点话题进行检测时尤为明显。针对此问题,提出一种多维度热点话题度量模型。该模型对话题进行筛选,得到一个热点话题初始集,再融入话题热度的影响力因子,计算各个话题的综合权值,将话题的综合权值按照一定的权重与多维度热点话题度量模型进行有效融合,得到一种基于微博多维度及综合权值的热点话题检测模型。通过使用真实的微博数据进行实验对比分析,实验结果表明,提出的多维度热点话题度量模型在对突发性热点话题的检测中,其准确率(Precision)、召回率(Recall rate)和F1值(F-measure)3个评估指标相比传统算法有了较大提高;利用该模型对突发性热点话题进行跟踪,通过与官方指数进行对比,该模型能有效跟踪其发展趋势。  相似文献   

3.
如今网络的重要性也与日俱增,如何有效管理网络成为了企业内重要的管理课题。迈向高速网络时代,随着网络带宽增加与各种不同网络应用程序的使用,中国企业经过了网元管理、运行管理,迈向第三个阶段:性能/流量管理阶段。本文分析了异常流量分析与网络性能管理系统的工作原理,详细讲解了该系统设计原理和功能特点,同时结合当前各个行业的中国企业性能/流量系统需求特点,提出了网络性能管理系统有广阔的发展空间。  相似文献   

4.
网络舆情安全是社会安全的重要组成部分,识别和追踪热点话题是治理突发事件网络舆情的基础。现有研究具有网络舆情事件表征不全面、对于热点话题的识别和追踪局限于语义信息等问题。该研究基于社交、内容、话题、情感4个维度构造超网络模型,并引入时间特征作为网络的连接关系,用于定量表征时序的网络舆情事件;将话题节点在超网络中的中心性及中心性变化率作为话题热度的度量指标,实现热点话题发现及演化跟踪;应用“甘肃白银马拉松”微博舆情案例对模型和指标进行验证分析。研究结果表明:该时序超网络模型能够清晰表征突发网络舆情事件,中心性及中心性变化率指标能够准确识别和跟踪热点话题,并为实时态势研判预警、舆论引导等提供指导。  相似文献   

5.
基于模糊聚类的网络论坛热点话题挖掘   总被引:3,自引:0,他引:3  
为解决单个帖子线索的多话题性问题,识别聚类中的孤立点,提出一种基于模糊聚类的网络论坛(BBS)热点话题挖掘算法.采用模糊聚类进行话题识别,使得一个帖子线索可以隶属于多个话题,而对于隶属度远小于类内平均隶属度的帖子线索,则当作孤立点来处理.此外,还给出了一种面向BBS文本的特征表示方法,并结合隶属度给出基于模糊划分的话题热度评分公式.实验结果验证了该算法的有效性.  相似文献   

6.
针对舆情话题演化中的话题漂移和衍生效应,提出基于时序主题信息的舆情话题演化分析方法并通过加入时序标签,对舆情热点话题内容和强度的演化过程进行了可视化.实例证明,该文提出的话题追踪算法能够有效探测出各阶段的舆情热点话题、分析舆情演化趋势,为突发事件发展态势的预测提供理论借鉴.  相似文献   

7.
随着互联网和彝文信息化的快速发展,彝文网络上充斥着大量的敏感信息,极大的影响了我国边疆的舆情信息安全.但彝文信息技术的发展与中英文相比还比较滞后,因彝文语言结构复杂、彝语分布环境广泛等原因,彝文的信息采集和文本分词等技术还不够成熟,这对涉外彝文网页的敏感内容监管带来巨大的挑战.为解决彝文网络信息的安全传播和舆情稳定,试图提出彝文敏感内容分级模型,并结合自研的彝文爬虫及分词等技术.构建一种面向彝文网页的敏感内容分级的算法模型和演示系统,相比于同类的民族语言舆情分析系统,不仅可实现敏感词的识别和过滤,还具有敏感内容分级、敏感源地址追踪等功能.通过人工评测与分析,该系统对敏感内容的分级可达到48%的准确率,敏感词的识别率为80%.  相似文献   

8.
针对内容分发网络(CDN)中复制服务器的动态部署要求,基于主动网络技术设计了一种主动内容分发网络模型(ACDN).将主动节点部署于客户节点与Web服务器之间,并通过插件来提供主动节点的动态可编程能力,从而使网络能根据Web服务器、网络的运行状态或用户自定义的规则,动态、快速地部署复制服务器.结合遗传算法的单亲交叉算子和单亲变异算子,提出了复制服务器的位置优化算法.按请求频度确定兴趣度,以此保证复制服务器与Web服务器的内容一致性.仿真结果表明,ACDN能满足实际Web应用的响应时间的要求,同时为ACDN所设计的3种算法不仅能满足内容分发的性能要求,还能应用于传统的CDN网络.  相似文献   

9.
为了提高网络热点话题变化趋势的预测精度,提出一种布谷鸟搜索(CS)算法优化支持向量机(SVM)参数的热点话题变化趋势预测模型(CS-SVM).首先获取热点话题的时间序列,然后将SVM参数作为一个鸟巢位置,通过CS算法模拟布谷鸟种群寄生繁衍机制找到最优参数,最后根据最优SVM参数建立热点话题变化趋势预测模型,并采用仿真实验对模型性能进行测试.结果表明,相对于对比预测模型,CS-SVM提高了热点话题变化趋势预测精度,可以准确刻画热点话题变化趋势,是一种理想的复杂、多变热点话题变化趋势预测工具.  相似文献   

10.
流量工程是ISP中最难处理的问题之一。ISP要求现有的IP网络具有流量工程管理的能力,并要求IPoverATM方式下的流量工程在纯IP结构的网络中也能得到体现。MPLS正是一种ATM和纯IP网共存情况下提供流量工程,并且避免两个分立网络的技术。但是考虑到成本等因素,对MPLS流量工程的研究很难用真实的物理设备进行,一般采用网络仿真软件降低研究成本。介绍使用NS2网络仿真软件对MPLS流量工程的仿真技术,并提供了一种低成本的研究方法。  相似文献   

11.
英国近代文学史上的伟大作家查尔斯·狄更斯以通俗小说家的地位雄踞文坛。他的作品采用报纸连载的形式出版 ,选材广泛 ,涉及到社会的各个方面 ,溶通俗性和思想性于一体。他尊重公众的道德感 ,有强烈的平等意识 ;他的小说语言通俗易懂 ,他的重要艺术手段之一———幽默也是贴近人民生活的幽默。  相似文献   

12.
采集了某一时段国内某著名网站上针对某一指定话题的帖子,按时间周期构造了一个关于新增帖子数量的时间序列,利用混沌时间序列预测方法中的加权零阶局域预测法预测了该序列的变化趋势.仿真结果表明该预测趋势与实际趋势在短期内是基本一致的;短期预测误差明显小于长期预测误差.  相似文献   

13.
概述了网络舆情内容分析的流程以及内容分析阶段需要完成的工作,详细介绍了基于知识技术的网络舆情内容分析系统框架的构建路径,即将知识技术引入网络舆情内容的分析过程,将信息预处理、信息聚类和分类、倾向性分析等关键技术手段与知识组织、知识表示、知识获取和知识挖掘等相关成果充分融合,将本体论和语义计算等技术与舆情分析相结合,建立基于知识技术的网络舆情内容分析框架,以提高网络舆情内容分析的准确度. 实验结果表明,基于知识技术的网络舆情内容分析系统达到了理想效果.  相似文献   

14.
近年来,网络流言引发的公共危机事件频发,政府微博的出现为消除网络流言的负面影响提供了新途径。通过多案例研究的方法验证了政府微博与网络流言的关系以及政府微博对网络流言的作用,指出政府微博应对真假流言时效果并不明显,政府微博并不能担负起遏制网络流言的重任,并据此提出了相关建议。  相似文献   

15.
分析了互联网舆情分析处理的主要内容及面临的主要问题,并给出了一个实验室的互联网舆情分析处理系统的解决方案。  相似文献   

16.
基于交通信息提取的区域交通状态判别方法   总被引:1,自引:0,他引:1  
为了准确判别区域路网的交通状态,提出了基于交通信息提取的区域交通状态判别方法.在分析区域路网交通流宏观特性的基础上,结合区域路网的拓扑结构与交通流特征,提出区域交通状态判别指标体系,并基于可拓学建立了区域交通状态判别模型.以一个主干道区域路网为例,验证了路网交通状态判别方法的有效性.该交通状态判别方法可应用于在线交通状态分析和历史数据库交通运行特征的提取,为交通管理决策提供了基础信息.  相似文献   

17.
为了提高网络舆情监测的时效性与准确性,改进了Nutch信息采集的方法,加入了URL分析、判重、页面时限等功能,提高了舆情采集的效率。利用《综合电子政务主题词表》构建了舆情监测领域本体,加入了辖区知识进行了扩展,提出了语义扩展的舆情监测算法。实验结果表明,舆情监测的准确率和召回率都有明显提高。  相似文献   

18.
针对网络上各种信息混杂、信息传播速度快、有害信息混杂其中、网络舆情治理难的问题,为及时搜索网络信息提供一个搜索服务平台。实现了基于ElasticSearch为搜索引擎,提供通过关键字搜索舆情信息的服务,并使用JavaWeb技术进行功能的实现。该平台同时具有实用性和可扩展性,对于类似的搜索平台有着借鉴意义。  相似文献   

19.
阐述了开发智能化的网络舆情监测和分析系统的重要意义,介绍了基于高校BBS帖子信息的舆情监测系统主题监测功能的研发情况,提出了一个实现该功能的流程图,并详述了实现这一功能所运用的技术以及今后需要攻克的技术难题。  相似文献   

20.
雾霾对人体健康、生态环境及交通运输等方面影响重大,雾霾来临时,人们会在微博等媒体上表达对雾霾的关注。微博中蕴含了网民对雾霾的关注话题及心理反映,通过微博掌握微博网民对于雾霾的相关反应,有助于城市管理者有针对性的调节雾霾情形下的舆论宣传和资源调配。考虑到微博文本中相同词语共现频率越高就越倾向于表达同一主题,采用基于社区的共词网络法挖掘微博话题,首先,采集2017年冬季以"雾霾""空气"等为关键词的微博数据,利用TF-IDF(term frequenly-inverse document frequency)算法对预处理之后的微博数据提取关键词,并获取关键词间的共现关系,然后基于共现关系构建共词网络,根据Louvain算法探测话题社区,最后,以中国雾霾污染最严重的华北地区、华东地区、东北地区7个典型城市为研究区,结合关键词节点的Pagerank值,分析各城市共词网络话题社区的差异程度。实验结果表明,不同城市对于雾霾事件的关注既有相同点也有差异性。研究结果对雾霾情形下城市差异化管理具有一定的理论指导作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号