首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
基本随机游走相似性指标由于其转移概率仅由当前节点的度决定,影响链路预测效果.鉴于此,在MH (Metropolis-Hasting)算法的基础上,充分利用邻居节点的度信息,并采用将当前节点的自环率按邻居节点的度值加权分配给邻居节点的方法重构转移概率矩阵,再融合重启随机游走(Random Walk with Restart,RWR)相似性指标,提出一种改进MH的链路预测算法.首先,根据当前节点与邻居节点的度信息重新定义节点间的转移概率;然后,将新的转移概率重构成概率矩阵;最后,融合RWR相似性指标进行链路预测实验.结果表明,新算法相较于RWR、CN (Common Neighbors)等7种基准算法在AUC指标上均有提升,在排序分指标上也有所改善;AUC指标上最高可提升3.98%,排序分指标上最高下降1.92%,提升了链路预测的准确性.  相似文献   

2.
网络链路权重评价是网络运维管理的重要依据?将马尔科夫链的转移概率引入到网络链路权重评价中,从概率的角度来衡量相邻节点的可达性;充分考虑链路?节点的故障性,将网络中任意两相邻节点的通信过程近似为马尔科夫过程,基于此,提出了基于马尔科夫链模型的网络链路权重评价方法?根据网络的关联矩阵得到1步概率转移矩阵,进而求得网络的多步马尔科夫转移概率矩阵,直至所有节点概率可达,通过累加相邻节点间概率来衡量链路可达性?通过算例分别分析了串联网络?桥式网络和复杂网络的链路权重评价问题?分析表明,该方法不仅能准确评价网络链路的权重,而且还解决了删边或缩边方法难以分析串联网络的问题,具有计算量小?易编程实现的特点?  相似文献   

3.
随机游走是一种应对推荐应用中用户规模庞大、数据稀疏等问题的有效方法.鉴于社交网络用户间亲密度差异、反向社交影响力等因素对基于随机游走的推荐具有积极影响,提出了一种引入频繁项挖掘来计算用户社交亲密度,进而优化转移概率矩阵,并与局部反向游走相结合的随机游走改进模型.此外,为了有效利用用户属性信息,提出了一种用户潜在好友关系推断的贝叶斯推理模型,并与随机游走改进模型协同应用,进一步提升了好友推荐性能.真实数据集上的对比实验验证了提出算法的有效性.  相似文献   

4.
熵与大偏差及保险定价   总被引:2,自引:2,他引:0  
为了更加合理的解决保险定价问题,引入信息论中的熵和概率理论中的大偏差,对一般保费计算方法进行了修正.结果表明:最大熵原理只考虑了具有最大熵的概率分布,而在大偏差框架中,考虑了所有的概率分布,此时的熵描绘了随着实验次数的增加,概率分布的收敛情况;若只知道概率分布的不完全信息,最小化叉熵,得到最小叉熵优化模型,模型的解可调整保费.调整后的保费计算方法既建立在经验概率分布基础上,又不完全依赖经验概率分布,具有更好的实用性.  相似文献   

5.
为了有效评估网络可靠性,通过计算网络节点对的可靠性,提出了一种利用节点有序排列的随机图模型来计算网络系统中节点对可靠性的新方法.该方法使用基于滑动窗口技术的递归算法,滑动窗口由数个连续节点构成.首先通过在单步中计算出窗口包含的所有节点的连通概率,其次窗口向前滑动一个节点,此过程重复,直至窗口到达最后的节点,此时的连通概率即可计算网络系统的节点对可靠性.仿真结果表明,该方法尤其适用于邻近节点间距很小的网络.算法最主要的优点在于降低计算复杂度.  相似文献   

6.
针对ad-hoc现存的问题,基于贝叶斯网络提出一种ad-hoc网络中评估节点可信度的模型.根据节点在网络的属性,利用贝叶斯网络,动态地计算节点可信度,模型可以根据节点关注的属性不同,调整贝叶斯网络子节点概率分布表,从而实现灵活的可信评估策略.结合贝叶斯网络,用概率统计的方法计算节点的可信度,该方法使用贝叶斯网络计算,评估节点的当前状态在历史通信记录的基础上的可信概率.仿真结果表明,本方法能够动态反映节点可信程度,及时地发现恶意攻击.  相似文献   

7.
针对基于社交网络的事件推荐覆盖性和准确性不够高的问题,提出了基于用户相似度Si-user Walker算法.该算法利用基于事件的社交网络特征,将线上用户群组数据抽象为图,以重启随机游走算法为基础,改变了传统的完全基于图的拓扑结构进行随机游走的策略.根据地理位置划分事件类型,提出了新的用户相似度计算方法,然后根据用户相似度矩阵作为随机游走的转移概率,既保留了图的传递性,又保证了图节点游走的真实性.与其他推荐算法在真实的数据集上实验表明,该算法在均方根误差、准确率及覆盖率上均得到提升.  相似文献   

8.
时序网络因为其复杂的动态结构和非线性拓扑特征,一直都是复杂网络和链路预测研究的重点.因为网络结构会动态变化从而导致常用的基于静态网络的方法不再高效适用.本文基于图嵌入方法,提出了一种适用于时序网络的链路预测算法,其核心是改进链路预测中粒子的随机游走过程,使其基于网络结构特征进行有偏向转移.其次,考虑到时序网络中历史信息的影响,在有偏向转移的基础上定义一种粒子的全局转移概率,这种转移概率重点计算最近时刻的信息同时也会考虑历史信息.经过实验例证,本文提出的方法较传统基准指标有较大的提升.  相似文献   

9.
语义相似性度量能够提高信息检索的准确性和效率,已成为文本处理中的一个核心任务.为解决一词多义等词汇歧义问题,提出一种基于低维向量组合的语义向量模型.该模型引入了知识库与语料库的多语义特征的融合,主要的语义融合对象包括连续的分布式词向量和从WordNet结构中的语义特征信息.首先利用深度学习技术中的神经网络语言模型,预先从文本语料中学习得到连续的低维词向量;然后从知识库WordNet中抽取多种语义信息和关系信息;再将多语义信息融入词向量进行知识扩展和强化,生成语义向量,从而实现基于向量空间的语义相似性度量方法.在基准测试集上的实验结果表明,该方法优于基于单一信息源(知识库WordNet或文本语料)的语义相似性度量方法,其皮尔森相关系数比基于原始词嵌套向量的方法提高了7.5%,说明在向量特征层面上的多语义信息的融合有助于度量词汇间的语义相似性.  相似文献   

10.
针对微博话题易漂移的特点,利用向量空间模型和LDA模型进行微博话题漂移检测.主要通过Gibbs采样算法获取每条微博中词汇的概率分布,基于词汇的概率分布进行微博间相关性度量,采用动态常数法实现话题边界标识,在话题域中计算词汇信息熵并抽取话题词,生成话题向量空间模型,通过话题向量空间模型在离散时间序列模型下的话题词序列比对,实现话题的漂移检测.通过实验发现,基于VSM和LDA模型相结合的微博话题漂移检测是一套行之有效的方法.  相似文献   

11.
基于随机游走和聚类平滑的协同过滤推荐算法   总被引:1,自引:0,他引:1  
协同过滤是电子商务推荐系统中被广泛采用的技术,然而数据稀疏性会影响协同过滤的推荐质量.本文针对数据稀疏问题提出一种基于随机游走和聚类平滑的两阶段协同过滤推荐算法.离线阶段:计算项目间相关性,提出了一个新的方法即通过加权累加各步转移概率对项目间相关性进行描述.根据得到的项目相关性矩阵对项目聚类,利用聚类信息对未评分数据进...  相似文献   

12.
提出一种新的网络表示学习算法DWLTI,它是可以同时考虑网络的结构信息和节点的文本属性信息的低维向量表示.DWLTI模型是一种基于deepwalk方法的能够适应有限文本信息的新模型.它通过采用合适的数据融合形式,同时最大化随机游走获得的节点序列和文本内容的词语序列的共现概率.通过应用两棵哈夫曼子树,使得即使只有少量部分节点拥有自身的文本信息,这些稀疏信息也能被充分利用.最后在真实网络数据集上进行节点分类实验,评估学习到的节点表示的质量.实验结果表明,利用有限文本信息的DWLTI优于多种经典基线模型.  相似文献   

13.
通过改进结构熵提出了一种复杂网络复杂性的度量方法.在提出的度量方法中将结构熵与密度相结合,导出了一个新的量用于衡量复杂网络的复杂性.这个量考虑了节点的度、介数以及网络密度等因素.提出的方法用于度量一个构造的ER随机网络和三个实际网络的复杂性.结果表明通过结构熵与网络密度的结合,网络的复杂性能够被有效的度量.  相似文献   

14.
PageRank算法是目前被广泛应用的一种度量网页重要性的方法,它根据网页之间的链接结构来给每个网页打分。从数学的角度来解释,PageRank可以被看作是一个马尔可夫随机游走模型,依据网页下一步的链出信息计算网页的转移概率。受计算机象棋算法设计中一个很成功的策略:“多看几步”的启发,改进和推广了经典PageRank算法,提出了更为一般的N-stepPageRank算法,它在计算网页的转移概率时利用了网页N步的链接信息。经典PageRank算法是N-stepPageRank算法N=1时的特殊情形。TREC标准数据集上的试验表明,N-stepPageRank算法能够有效地提高网页搜索的精确度,MAP指标比经典的PageRank的提高超过15%。  相似文献   

15.
网络嵌入,或者称为网络表示学习,旨在将网络中的节点映射到表示空间中,生成低维稠密的向量,从而在保留网络结构信息的前提下对网络中的节点进行表示,而后通过已有的机器学习方法解决诸如链接预测、节点分类、社团发现和网络可视化等下游任务.随机游走算法可以很好地探索网络中节点的局部结构,然而之前的基于随机游走的表示学习算法只能为节点产生一种角色嵌入,没有考虑到和不同邻居进行交互时节点扮演的不同角色嵌入.因此,提出一种基于路径相互关注的网络嵌入算法,使用节点随机游走产生的上下文信息,通过注意力机制为每个节点生成上下文相互关注的节点嵌入.在真实数据集上的实验结果表明,与三个经典的网络嵌入算法相比,该算法具有更好的表现.  相似文献   

16.
针对异质网络表示中传统元路径随机游走无法准确描述异质网络结构,不能较好地捕捉网络节点内在的真实分布问题,提出基于变分推断和元路径分解的异质网络表示方法HetVAE.该方法先结合路径相似度的思想,设计了一种节点选择策略对元路径随机游走进行改进,再通过引入变分理论对原始分布中的潜在变量进行有效采样.最后,通过设计个性化的注意力机制,对由分解获得的不同子网络的节点向量表示进行加权,再将其进行融合,使最终的节点向量表示具有更丰富的语义信息.通过在DBLP、AMiner、Yelp这3个真实数据集上进行多组不同网络任务的实验,验证了模型的有效性.在节点分类和节点聚类任务上,与对比算法相比,微观F_1值和标准化互信息分别提升了1.12%~4.36%和1.35%~18%,表明HetVAE能够有效地表征异质网络结构,学习出更符合真实分布的节点向量表示.  相似文献   

17.
选取EMD(earth mover’s distance)作为度量概率数据相似性的标准.EMD具有抗噪性好,对概率分布间的微小偏移不敏感等优良特性,但却具有三次方的复杂度.针对此问题,提出EMD-kJoin算法,在相似性搜索方面,基于线性规划的对偶理论为概率数据构建索引,避免不必要的EMD求精计算;在处理流程方面,以复杂度较低的范围查询为主要操作,并逐步缩小搜索阈值.通过使用真实数据集对EMD-k Join进行测试,证明EMD-k Join极大提高了基于EMD的概率数据top-k相似性连接操作的执行效率.  相似文献   

18.
通过观察现有链路预测算法在社交网络推荐系统中的表现,我们发现一些预测算法不能很好的满足特定网络的需求.受现有链路预测算法的启发,本文提出了一种基于热传导的随机游走链路预测算法,算法中加入了基础节点,使得算法效率更高.实验结果表明,基于热传导的随机游走链路预测算法在社交网络推荐系统中的表现优于基于节点相似性的链路预测算法.  相似文献   

19.
许多成功的社区发现算法已经被广泛应用于复杂网络社区发现任务中.随着数据复杂性的增加,网络中节点间的关系也呈现多样化的特点,因此提出一种基于信息熵的节点稳定性度量方法,衡量网络中节点在社区划分中的稳定性;并在此基础上提出一种基于节点稳定性的社区发现算法(Node Stability-based Algorithm,NSA).首先得到网络的t种社区划分,计算各节点的标签熵,选择熵小于一定阈值的节点作为网络的稳定节点集S;然后,利用所得到的稳定节点集S从原网络中抽取一个包含S的连通子图Gs,使Gs中节点的不稳定性尽可能低;在连通子图Gs上进行社区发现,得到初始聚类结果,再计算其他未聚类节点与初始类簇的距离,确定其社区归属,得到最终聚类结果 .在四个带标签真实网络数据集和八个不带标签的真实网络数据集上,与LPA,Infomap,Walktrap,BGLL,LPA-S等经典算法的比较实验表明,所提出的NSA算法能够较好地进行社区发现,在NMI和模块度等方面表现良好.  相似文献   

20.
句子间语义相似性的计算已成为自然语言处理领域的重要研究内容,如何有效地对句子建立语义模型已成为释义识别、文本相似性计算、问答和文本蕴涵等自然语言处理应用的基础任务.文中提出了一种并行的卷积神经网络模型,该模型的两个卷积网络不仅对句子对中的单个句子建立句子向量表示,还对句子经卷积池化后的特征进行相似性度量,并获得句子间的相似性特征.采用释义识别及文本相似性两项任务进行模型性能的实验评测,结果显示,该模型能够较好地表示句子语义信息,其释义识别F1值相比基准实验提高了7.4个百分点,语义相似性评测的皮尔森相关系数比逻辑回归方法有7.1个百分点的提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号