首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 546 毫秒
1.
研究结合社交媒体特点,充分考虑标签文本和内容文本信息,融合了传统的LDA话题模型对社交文本信息进行话题聚类,从而实现了对社交数据的话题发现,与此同时,文章提出了基于关键词图模型构建话题特征,并结合支持向量机模型进行文本情感极性判别。研究在开放微博数据集和COAE2014公开评测数据上进行了相关实验,实验证明了有效的关键词图模型能进一步克服中文语义的模糊性和歧义性。  相似文献   

2.
为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。  相似文献   

3.
使用隐狄利克雷分布(LDA)进行话题检测时,话题模型产生的话题存在语义上的分层现象;LDA建模产生的话题会出现语义上概括较广的泛话题;话题数目超参数K的设定通常根据人的经验.这些将造成建模结果出现包含多个子话题的混合话题情况.针对上述问题,文中基于层次聚类算法,使用一种文档特征词序列对LDA模型分类结果粒度过粗、热点话题检测结果泛化所导致的舆情监控价值较低的情况进行子话题检测.首先对LDA模型建模结果进行优化,对话题-单词分布与文档-单词分布两个矩阵进行过滤;然后对重叠话题进行检测与合并,采用文档间紧密度度量方式发现泛话题与混合话题;最后通过层次聚类算法对话题下的文本进行二次聚类,得到话题下的子话题.实验结果表明:该算法对子话题的检测能够在更深层次上体现出热点话题的特性,便于舆情监控分析;与Single-Pass算法和K-均值聚类算法相比,该算法获得的结果更具有有效性;K的选取策略对基于层次聚类的子话题检测算法具有鲁棒性.  相似文献   

4.
针对当前主要的CTM模型只能分析公共话题的缺陷,提出一种PCCMix混合模型来实现跨文本集的话题分析.该模型把多个文本集中的话题划分为公共话题和文本集特有话题,首先根据文本数据建立这两类话题在所有词上的概率分布,再使用期望最大化算法进行模型的参数估计.实验结果表明,该模型不仅能够发现公共话题在不同文本集中的差异,而且能分析各文本集特有的话题.模型能更精确地对文本建模,具有良好的性能.  相似文献   

5.
传统的社团发现算法大多存在划分效果和复杂度相矛盾的问题,为了解决该问题,提出一种新的单社团结构评价标准——社团密合度(group density).在此基础上,设计了一种基于凝聚思想的社团发现算法,该算法通过不断融合小社团,使网络的社团结构向平均社团密合度最大的方向发展,并使用模块度检测算法的划分结果.通过与经典的GN,Fast Newman,LPA等算法对多个数据集进行实验对比,验证了本文算法在获得较好的划分效果的同时具有较低的时间复杂度.  相似文献   

6.
针对微博话题易漂移的特点,利用向量空间模型和LDA模型进行微博话题漂移检测.主要通过Gibbs采样算法获取每条微博中词汇的概率分布,基于词汇的概率分布进行微博间相关性度量,采用动态常数法实现话题边界标识,在话题域中计算词汇信息熵并抽取话题词,生成话题向量空间模型,通过话题向量空间模型在离散时间序列模型下的话题词序列比对,实现话题的漂移检测.通过实验发现,基于VSM和LDA模型相结合的微博话题漂移检测是一套行之有效的方法.  相似文献   

7.
基于局部扩充的重叠社团检测算法由单个节点或团出发,不断添加新的节点而获得最终的社团划分,但现有算法均为每次添加一个节点,没有充分考虑所添加节点的局部信息,从而影响了社团检测结果的准确性.为此,文中提出了一种基于单步添加团的重叠社团检测算法,该算法从一个团开始,通过不断添加此团邻居内适应度增值最大的团,使算法在局部扩充时不仅考虑了所添加节点与已有社团的连接紧密性,而且考虑了所添加节点内部的连接情况.在真实网络和计算机生成网络上的实验结果表明,与现有基于局部扩充的重叠社团检测算法相比,文中算法可以更准确地检测出复杂网络中的重叠社团.  相似文献   

8.
社区挖掘是复杂网络研究的核心内容之一.基于局部结构建模的重叠社区发现方法由于可利用局部先验知识,具有适应网络动态环境,建模速度快,可多角度呈现局部结构特征等优点,当前已成为大规模网络发现研究的前沿热点.从理论发展沿革与现实应用的视角,介绍重叠社区发现研究近来的相关研究进展.通过分析重叠社区发现研究存在的关键问题,给出基于局部结构特征的重叠社区挖掘研究框架,并对几类典型的重叠社区发现方法展开分析比较.然后进一步阐述和探讨如何面对现实超大规模网络、多态异构网络、不确定性数据、动态演化结构等方面面临的巨大挑战.最后总结并展望了基于局部结构的重叠社区发现研究的未来方向和前景.  相似文献   

9.
为了发现论坛数据中感兴趣的话题并对话题进行演化跟踪,文中首先利用潜在狄利克雷分配(LDA)模型将文本由词汇空间降维到主题空间,然后采用聚类算法在主题空间对文本集进行聚类,并利用文中提出的热点话题检测方法得出热点话题.基于发现的热点话题,文中提出了基于在线LDA(OLDA)话题模型的论坛热点话题演化跟踪模型(HTOLDA),该模型只选择热点话题进行先验传递,并通过设置同一话题相邻时间片的语义距离来判断话题的状态.实验结果表明,HTOLDA模型对各个时间片的论坛数据集的建模能力优于OLDA模型,并能够有效地对论坛中的热点话题进行演化跟踪.  相似文献   

10.
社团发现常用于挖掘复杂网络中的隐藏信息,如功能模块和拓扑结构.为提高复杂网络中社团结构挖掘的质量,提出一种基于加权树的层次社团划分算法HCD_WTree(Hierarchical Community Detection Algorithm Based on Weighted Tree).首先,结合邻域重叠比和节点的度中心性来度量节点间关系强度,基于该度量将原无权网络转换成加权网络;接着,对网络进行简化,得到加权树;最后,基于层次社团挖掘方法,根据边权依序裁剪加权树,得到层次的社团结构,并结合模块度函数获得最优的社团划分结果.在公用数据集上的实验结果表明,与现有的社团挖掘技术相比,HCD_WTree算法能够更准确地划分复杂网络中的社团结构.  相似文献   

11.
微博用户之间通过关注行为形成复杂的微博网络关系圈子。高校图书馆微博关系研究是从社会网络分析视角来对图书馆微博网络关系圈子之间的关注与被关注关系进行分析。UCINET软件是目前较为流行的社会网络分析软件,它具有强大的矩阵分析功能,在高校图书馆微博关系研究中发挥了很好的作用。详细讨论了如何利用UCINET软件,选择一定的社会网络分析方法进行数据分析,揭示高校图书馆微博网络内部结构,以便为其微博建设提供建议。  相似文献   

12.
大数据中网络节点拓扑结构复杂且具有明显的不稳定性,当前网络节点拓扑不稳定性评估模型大多依据社会网络分析方法理论,从不同角度表示具有不同拓扑结构特性的网络元件,获取的评估结果不充分、不可靠。为此,提出一种新的大数据中网络节点拓扑不稳定性评估模型,通过节点收缩法对大数据中网络节点重要性进行评估。针对大数据中网络节点拓扑不稳定性的评估,结合风险函数丰富熵的内涵,将事件的风险函数在效用系数空间中的平均值看作网络的效用风险熵,依据得到的效用风险熵对效用风险熵权重进行计算。将节点收缩法和效用风险熵权重结合在一起,重新考虑权重的影响,给出新的大数据中网络凝聚度,得到大数据中网络节点拓扑不稳定性评估模型。实验结果表明,所提方法评估可靠性很高。  相似文献   

13.
防止敏感数据泄露是网络服务商面临的主要问题,随着网络的逐渐发展,该问题变得越来越复杂,传统数据防泄漏方法通常通过关键词搜索实现,虚警率高,整体性能低下。为此,提出一种新的arp攻击后网络数据防泄漏方法,通过动态指纹检测对arp攻击后存在网络隐患的敏感数据进行初步检测,通过概率检测降低计算开销和内存。针对指纹比对,在随机选择的一组整数上对字符串进行检测,将检测点和Bloom滤波器关联,给出通过概率检测进行网络数据泄露检测的详细过程,从而防止arp攻击后网络数据泄露。实验结果表明,所提方法不仅精度高,而且整体性能强。  相似文献   

14.
随着社交媒体网站的日益普及,用户倾向于加入多个社交网络,作为社交媒体中的一项新兴工作,将社交网络的多个用户身份关联起来具有重要意义。通过研究目前有代表性的用户关联模型,提出了一个基于综合信息的用户关联模型(BiALP),该模型通过节点表达的方法学习网络的内在结构信息、属性信息和内容信息,以源网络和目标网络的节点表达为特征,以已关联用户对作为带标签数据,采用二分类监督学习的方式学习源网络与目标网络之间的关联关系。大量实验表明,BiALP模型与目前有代表性的其他用户关联模型相比效果有明显的提升(35%),能够实现更精确的用户关联。  相似文献   

15.
随着网络的发展和人们沟通方式的扩展,社交网络影响了人们的生活,改变了人们传播与分享消息的方式,吸引了越来越多的人关注和研究社交网络。社交网络即社交网络服务,源自英文SNS(social network service)的翻译,社交网络有多种表现平台,比如QQ、微博、Facebook和微信。本文主要研究微博这一新兴的社交平台,研究微博的主要目的是搞清用户之间的种种关系。当代人一般认为,微博中存在5种关系即关注关系、提及关系、转发关系、评论关系以及好友关系。由于社交网络中人数众多,关系错综复杂,因而产生的社交数据和传统的数据相比具有数据量大、结构复杂、语义丰富等特点,针对这种情况,依据用户之间的关系,提出了一种基于三元闭包的社区划分算法。该算法首先设初始社区为空,在所有的顶点中,选择度最大的顶点作为初始顶点;然后求初始顶点与其邻接顶点的三元闭包数和顶点属于该社区的概率PS,取它们最大的邻接顶点加入初始顶点所在社区,形成新的社区,继续迭代,当剩余的顶点很少时,可以使用会员闭包和三元闭包这种归集算法把剩余的顶点划分到不同的社区,直到把整个社区划分完毕;最后以图形这种直观、形象的方式把每一个社区表示出来。在该算法中,三元闭包数、顶点属于某社区的概率、扩张度的差是评估复杂网络中顶点划分的关键。该方法综合了顶点全局重要性的特点,即在复杂网络中,三元闭包数越大,它们处在一个社区的可能性就越大;顶点的会员闭包越大,该顶点就会越优先被划分;扩张度的差是确定第i个社区是否被划分完毕的关键。社交网络的研究不仅可以帮助人们了解网络结构、分析网络结构特性、探测分析网络的社团结构,而且还可以把虚拟世界中这种关系链接到现实世界中,即把虚拟关系转化成利润,为企业提供有价值的关系网络,从而挖掘出潜藏在社交网络背后的巨大的经济价值,具体体现在:1)帮助企业找到潜在的商机,比如分析某个用户的评论和发表内容,可知他的消费能力、喜好和最近的购买习惯,从而知道他购买自己产品的概率;2)危机预警,根据用户的消息内容可以知道他对自己产品的满意度;3)带动了消息的传播速度和广度。企业可以利用这一点,为自己的产品更好地做宣传。通过与宽吻海豚网和Zachary空手道俱乐部的社区网络作比较,证明了该算法的有效性和可行性。  相似文献   

16.
许冉  王文彬 《科技促进发展》2021,17(9):1664-1672
本研究利用数据抓取与人工搜集相结合的方式获得研究资料,构建了企业关联网络;结合节点的网络结构属性和企业经济属性,利用熵权法确定指标权重,应用理想解相似排序法(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)对网络节点进行重要性排序,识别网络中的关键节点,并以河南省生态水利行业为例进行了实证分析。研究发现政企合作模式下企业关联网络具备复杂网络特征,与单一利用网络结构属性的识别方法相比,TOPSIS综合评价方法效率更高,评价结果更具科学性和严谨性。政企合作模式(Public and Private Partnership,PPP)下企业通过共同参与项目或与同一政府合作的方式产生关联关系,并构成复杂网络。系统性风险可能在PPP企业关联网络上扩散,并通过枢纽节点快速影响网络全局。如何迅速有效地识别网络中的关键节点,对行业风险管理具有重要意义。  相似文献   

17.
涂师师  贾贞 《广西科学》2013,20(1):75-78,81
选取新浪微博中标签为桂林理工大学(桂林理工大学片区)的部分注册用户关系数据,构建一个基于微博的局域社交网络,应用社会网络分析UCINET软件对该社交网络的基本结构特性、网络成员的派系、地位等做了实证分析,并通过一条微博转播的实际数据验证了分析结果的可信性.  相似文献   

18.
 针对传统社会网络分析模型存在的不足, 根据可拓学中的基元理论, 结合社会网络分析理念及方法, 研究一种新的复杂社会网络分析模型。利用多维物元表示复杂社会网络的整体特征、节点属性和网络分析测度, 丰富节点的现实涵义;利用多维关系元表示节点之间的关系, 充分体现网络中关系的多重性;利用多维事元表示网络结构及环境变化的细节信息, 构建了复杂社会网络的多维可拓基元分析模型。通过实例分析, 验证了该模型的实用性及优越性。  相似文献   

19.
基于复杂网络的统计信息数据挖掘的研究   总被引:1,自引:0,他引:1  
统计信息是区域可持续发展中重要的信息资源,涵盖了人口、农业、工业、经济等各类数据.从大量的统计信息中挖掘出更多有价值的信息,从而得到决策支持依据.通过统计信息数据挖掘的研究,从理论和仿真两方面探讨复杂网络理论在统计学研究中应用的一种.阐述基于统计数据构建社会经济系统网络的概念和复杂网络的度及其分布、平均路径长度、集群系数和介数等统计性质,挖掘这些性质在社会经济网络中的统计规律和性质,并给出复杂网络研究在决策和管理中的指导意义.  相似文献   

20.
重叠社区发现是复杂网络挖掘中的重要基础工作,可以应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等多种网络的数据分析,从而服务智慧交通、传染病防治、舆情分析、新药研制和人力资源管理等领域.传统的单机运算架构已经难以满足各类大规模复杂网络的分析和计算要求.人工智能领域的研究人员提出将社区发现应用到网络...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号