首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
现有的微博社交网络社区挖掘方法多是基于网络结构进行,忽略了节点本身行为的重要性,并且不能同时实现对大规模复杂网络结构适应性和社区挖掘的高效性。为缓解上述问题,提出了一种基于网络距离和内容相似度的微博社交网络社区划分方法,该方法在考虑微博社交网络结构的同时兼顾了网络中节点的历史微博内容,通过对历史微博数据的分析提高社区划分的精确度。文中对Louvain算法和其模块性的修改使用,保证了该方法能够处理大规模网络数据,同时又能保证社区挖掘的效率。实验证明,该方法能够高效地挖掘微博网络社区结构,对学术研究和商业应用都有十分重要的意义。  相似文献   

2.
基于相似度的加权复杂网络社区发现方法   总被引:2,自引:0,他引:2  
针对加权复杂网络中的社区结构发现问题,本文定义基于权重关系的相似度,并在此基础上定义了节点中心度和归属度,改进GN算法的模块度评价函数,提出一种基于相似度的中心聚类算法(SCC).该算法通过计算节点间的相似度,选取合理的中心度大的节点作为社区中心节点,最后基于节点归属度来聚集从而形成社区;同时,提出了用相似度代替边介数的改进GN算法SGN.通过理论分析,并在数据集上进行实验验证,结果表明SCC算法与WGN算法、SGN算法相比,速度和精度上均有较大改善.同时与I2C算法相比,社区的划分有效性更好.  相似文献   

3.
为实现加权网络的准确划分,发现真实的社区结构,提出一种基于模块度和共邻节点相似性的层次聚类社区划分方法IEM.首先,定义两节点间基于共邻节点的相似度.之后,基于该度量快速聚合当前节点和与其关联紧密度最强的邻居节点以形成初始社区,并进行社区扩展.最后,以最大化网络模块度为目标进行社区合并以优化划分结果.算法通过形成初始社区、扩展社区、合并社区三步,实现了加权网络合理有效的社区划分.以加权模块度作为社区划分质量的评价标准,在多个数据集上的实验结果表明,IEM算法优于加权CN、加权AA、加权RA.同时,与CRMA算法相比,IEM算法对加权网络社区划分的有效性和正确性更高.  相似文献   

4.
基于近年来发展的社区发现概率模型的可解释性,对现有的性能较好的基于节点中心度和流行度的社区划分链接模型PPL进行扩展,给出了一种新的可以结合节点内容的组合模型PPL-IX2。该模型不但可解决节点属性的选择问题,并可充分利用节点间的链接关系。实验结果表明,新给出的PPL-DC模型优于单纯的链接模型及已有的链接和内容相结合的组合模型。  相似文献   

5.
以微博用户推荐算法中相似度计算为研究对象,根据微博用户关注信息的特点,分析了关注用户的流行度的不同程度,以及这种程度差异对相似度计算产生的影响,在此基础之上提出了一种加入流行度制衡因子的相似度计算方法.可通过流行度制衡因子,在计算用户相似度时,适度减少(增加)流行度偏高(偏低)的用户对计算结果的影响.实验结果表明:加入流行度制衡因子的用户相似度计算具有更好的推荐效果.  相似文献   

6.
社区发现是复杂网络研究的基础,其目的是发现网络的真实结构,对于分析复杂网络的拓扑结构、理解其功能和寻找其潜在的性质具有重要的意义.Palla,Yong和James等人分别提出了CPM、LINK算法,此类算法基于网络拓扑结构或边密度发现复杂网络中的社区,性能较好,但不足是计算出的社区存在过度重叠问题.如何设计新算法,避免社区发现的过度重叠问题,是一个亟待解决的重要问题.本文基于加权边相似度,提出了一种社区发现算法LINKw,可以高效发现社区结构,与其他算法相比,本算法能更好地解决社区过度重叠问题.  相似文献   

7.
针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果.  相似文献   

8.
传统的社区发现算法能够找出网络中所有的社区,其时间复杂度取决于网络的规模.挖掘大网络中的全局社区结构因为时间复杂度高而难以实现,局部社区发现作为一种不需要知道网络的整体结构,从给定的节点逐步向外扩展,寻找该节点所在社区的方法,在大网络时代具有重要的应用意义.目前这方面的研究已经获得广泛关注,并提出了很多局部社区发现算法.针对已有局部社区发现算法需要人工设置参数、准确率低的问题,提出一种新的局部社区发现算法.首先,提出一种加权邻居节点的共同邻居相似度指标,用于计算网络中两个节点间的相似度;然后,基于该相似度指标,给出一种新的局部社区质量度量指标,在保证社区度量指标不下降的前提下,不断选择与当前局部社区嵌入度最大的节点加入到局部社区,逐步找出给定节点所在的社区;最后,在真实网络和仿真网络数据集上进行了实验.实验结果表明,该算法能有效地挖掘出给定节点所在的局部社区,相比具有代表性的Clauset,LWP,GMAC等局部社区发现算法有更高的准确率.  相似文献   

9.
给出了一种基于网页内容相似度和网页之间链接关系的社区发现方法.该方法不仅考虑了网页之间的超链接关系,而且着重考虑了网页在内容上的相似度并克服了传统社区发现算法忽略网页内容的局限性,使发现的社区在内容上更相关.在原始社区的基础上对其进行动态添加,将网络中新出现的与原始社区中的网页存在链接关系同时与主题相关的网页加入到原始社区.实验表明,此方法可以有效地应用于网络的社区发现,使发现的社区在内容上更相关.  相似文献   

10.
通过研究微博社区的结构特征和用户交流模式,提出了一种基于微博用户交互行为的社区发现方法.该方法借鉴引文分析理论中的著者互引分析和著者耦合分析,分析微博社区内用户的交互行为,考虑到不同交互行为体现了对微博的不同兴趣度,给不同的交互行为赋予了不同权重,进行相似度计算,并利用用户相似度进行社区发现.实验结果显示,本文提出的方法可以有效地进行社区发现.  相似文献   

11.
社交网络社区Leader 选举,即识别社区内影响力最大用户,是社交网络结构分析重要任务之一,在识别意见领袖、增进社区融合等方面具有重要的理论和应用研究价值.传统的社区Leader 选举技术如UserRank和PeopleRank,主要基于社交网络链接分析实现,忽略了用户本身属性的相似度度量.因此得到的社区Leader不能有效保证其社区代表性.本文提出了一种新的用户关系建模方法,将传统的链接分析和用户属性相似度度量融合,有效识别具有代表性的高影响力用户.实验结果表明,提出的方法不仅可以选举出社区内部具有代表性的高影响力Leader 用户,还可以通过社区Leader 选举使得社区内其他用户的查询效率得到有效提高.  相似文献   

12.
基于相似度的离群模式发现模型   总被引:5,自引:0,他引:5  
提出了基于相似度的离群模式发现模型,该模型主要利用知识属性集分析离群点,既能够处理离群点的数值属性,又能够处理其类别属性;通过组间相似度从中发现离群模式,不仅回避离群点数量少的缺陷,还利用了离群点的隐含语义.给出了在银行结售汇交易数据上进行的实验分析结果,模型发现了某地区的3个可疑模式,该结果为金融犯罪分析提供有利线索;利用不同子空间角色划分,可以发现个人、地区等不同对象间的异常资金流动;模式发现算法具有线性时间复杂度,在实际应用中具有较好的性能.结果表明模型能检测出可疑资金流动序列,为反洗钱工作提供有意义的线索.  相似文献   

13.
随着Web服务数量的剧增,Web服务发现是目前面向服务的体系架构中的重要部分。并且成为Web服务研究的一个热点.笔者提出了一个基于语义匹配的服务发现方法.首先,在标准WSDL中进行本体相关的语义扩充,将服务操作中必要的信息进行语义映射,包括:Web服务操作名称以及服务操作的输入消息和输出消息.其次提出了一个基于消息语义相似度二分匹配的Web服务发现方法.实验表明该方法提高了服务发现的查全率和查准率,且具有良好的可伸缩性.最后得出结论:该方法使用WSDL标准规范而不是特定的Web服务语言或模型,因而易于实施;该方法提高了计算机自动发现服务的效率.  相似文献   

14.
聚类方法的核心是如何度量事物间的邻近性。介绍了邮件特征的向量表示形式、构建了邮件特征矩阵,并使用变形后的极值分布函数模型拟合了邮件间通信特征信息;在此基础上提出了一个新的邻近性度量方法(ex-treme value distribution similarity,EVS),用以指导邮件社区划分;使用微聚类-宏聚类邮件社区划分算法验证了该方法的有效性。实验表明,在测试数据集上,相比余弦、PCC等经典的邻近性度量方法,以EVS作为划分依据的邮件社区划分算法能够更加有效地发现高质量的邮件社区。  相似文献   

15.
目的针对常用的向量空间模型忽视了文本中的词序和结构信息,影响文本相似度计算的准确度的缺点,提出新的文本案例相似度计算方法。方法将文本表示粒度由词提高到句子,加入词序信息。结果提出了句子向量空间模型及基于该模型的文本案例相似度计算方法。结论这种方法更符合人类理解的模式,提高了文本案例相似度计算的准确度。  相似文献   

16.
17.
社区结构是复杂网络研究中的重要领域,也是复杂网络的重要特征之一,发现网络中的社区结构在理解网络功能方面起着重要作用。通过对国内外异质网络社区发现文献进行深入研究,较为全面地对现有异质网络社区发现算法进行了归纳总结。首先,通过对国内外异质网络社区发现文献进行归纳,给出异质网络社区发现的基本概述,明确异质网络社区发现领域相关问题的基本定义。其次,介绍了异质网络社区发现算法及主要评价指标,利用不同网络结构以及算法对现有方法进行分类概述。最后,对异质网络社区发现算法的发展趋势进行了总结与展望,提出未来可以将研究重点集中在以下几个方面:1)探索基于异质网络的社区发现评价标准,以推动该领域的快速发展;2)设计更加通用的算法模型,解决由先验知识引起的未知社区数量问题;3)开展更多关于动态网络的研究。  相似文献   

18.
为快速、 准确地对日益复杂的大规模社会网络进行社区划分, 提出一种基于相似度投票的改进算法替代Louvain算法的底层划分, 解决了Louvain算法在底层划分收敛速度较慢, 并出现大量重复计算的缺点, 使社区划分更迅速. 由真实社会网络数据实验结果可见, 与Louvain算法相比, 改进算法在保持模块度基本不变的情况下, 效率显著提高, 划分的社区数更少、 社区结构更紧凑.  相似文献   

19.
陈大亨 《科技信息》2011,(8):I0099-I0099
本文通过研究属性相似度以及组合权重的分析,提出区间属性相似度计算方法,基于相似度离差信息的客观赋权法将主观权重和客观权重加以组合,以组合权重来计算实例的全局相似度。  相似文献   

20.
针对文本、语义、关键词等方法计算主观题相似度的不足,提出一种基于相似度组合的方式构建主观题评分模型。该模型可根据评分逻辑,灵活地调整阀值,综合Word2vec算法、Doc2vec算法和TF_IDF算法的优势,提高主观题的相似度。实验表明,与人工评分对比,提出的评分模型得到的评分方差及偏差率都较小,稳定性较好,更贴近人工评分结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号