首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 703 毫秒
1.
基于改进PageRank算法的微博用户影响力评估   总被引:1,自引:0,他引:1  
为筛选微博网络和消息传播中的意见领袖,综合分析微博用户属性、行为和微博消息的传播特性,把用户的影响力因素分为:用户潜在影响力和微博传播影响力,据此构建用户影响力评估指标.进而提出基于改进RankPage算法的微博用户影响力评估算法.通过采集新浪微博某一话题下的数据计算用户的影响力,验证了方法的有效性和合理性.  相似文献   

2.
社交网络服务每天产生大量涉及众多话题的信息,并在影响力各异的用户群体推动下广泛传播。在IP(influence passivity)算法的基础上,提出了一种综合话题相似性与信息时效性的影响力用户发现算法EIP(extended influence-passivity)。该算法在转发网络上考虑用户间话题的相似性以及博文信息时效性,更加精准地建模和计算用户的影响力和消极性。基于新浪微博上爬取的约10万用户数据集上的实验验证,EIP影响力度量算法优于IP和TwitterRank等现有方法。  相似文献   

3.
利用新浪微博的微群信息,在蚁群算法的基础上,提出了一种基于群体智慧思想的排序模型(ACOR),通过结合用户的偏好及电影热度对电影进行综合排名.同时考虑了微博中的情感因素,分析用户对电影的情感倾向并计算其情感值.最后,根据群体形成的情感积累值对热议的电影排序.实验结果表明:该模型更符合用户的偏好,并具有一定的实时性,可以有效地为用户提供相关电影信息.  相似文献   

4.
新浪微博数据挖掘方案   总被引:27,自引:0,他引:27  
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。  相似文献   

5.
该文受用户认知研究启发,探究新浪微博平台中多图推文的图像位置与布局对图像内容向用户互动参与行为转化过程的影响.使用基于单图推文数据训练的XGBoost模型预测多图推文中各张图像所具有的"用户参与潜力",通过相关分析、Z检验、OLS回归分析验证图像位置、布局与用户参与的关系.研究结果表明,在新浪微博平台的多图推文中,图像...  相似文献   

6.
针对云南省基层党建综合服务平台经典用户相似度算法结果精确度低的问题,提出一种党员用户关系评价模型.首先基于用户间的微博文本、位置、共同好友、交互、背景设计适用于该平台的相似度优化算法,然后利用最大似然估计方法综合5个维度的相似度结果,得到最终的党员用户关系评价模型.以平台真实数据对模型进行性能分析,结果表明,与基于网络距离和内容的相似度算法、基于微博的相似度算法相比,提出的优化算法及最终模型在准确率、召回率和F1值上均有较大提升.  相似文献   

7.
目的研究新浪微博数据采集问题。方法利用新浪微博API接口和本文设计的网络爬虫模型进行数据采集。结果与结论实验证明两种方法都可以在较短时间内收集到较多用户资料,但在过滤去重方面,本文设计的算法在时间上更为高效。  相似文献   

8.
为了高效地分析挖掘新浪微博社交网络信息传播过程中的关键节点,以Hadoop云计算系统作为存储和处理平台,在X-RIME大规模社会网络分析工具开源框架基础上,针对社交网络中使用HITS(hypertext induced topic selection)链接分析算法挖掘关键节点时,未能体现节点和连接的社会属性问题进行改进.新算法充分考虑了社交网络节点和边的社会属性,对HITS算法节点和边的社会属性权值进行优化计算,提出适合社交网络特点的加权HITS算法.通过Hadoop云平台分别运行加权HITS算法和传统HITS算法对新浪微博社交网络数据进行分析.实验结果表明,加权HITS算法比传统HITS算法具有更高的执行效率和结果区分度,加权HITS算法更适合于大规模社交网络信息传播过程中关键节点的分析挖掘.  相似文献   

9.
微博类社交网络中信息传播的测量与分析   总被引:1,自引:0,他引:1  
为了更好地掌握在线社交网络中信息传播的特征规律和用户行为,以新浪微博为代表对社交网络中的信息传播进行了较大规模的测量、统计和分析,提出了一种三角和算法用于探测用户粉丝数阈值。该算法根据散点分布的统计规律来估计使微博热度达到某一值的粉丝数的临界值,发现为使微博热度大于10,用户粉丝数应大于150。其他测量分析结果表明:新浪微博具有很强的"名人效应",用户频繁地发帖并不能引起较大的关注,热门微博的热度几乎都以激增方式增长。这些结论对网络营销和网络监管具有参考价值。  相似文献   

10.
为了解决余弦相似度算法进行数据清洗时重复与相似的数据会使计算量呈几何级增长的问题,提出了基于N-Gram和动态滑动窗口的改进余弦相似度算法.首先通过计算每条数据的N-Gram值,并对数据进行相似度排序,然后定义初始滑动窗口,其窗口值根据N-Gram值的方差动态调整,最后在每个窗口中根据相似度与阀值判断相似数据.实验结果表明,改进的余弦相似度算法在运行速度上有大幅度提高,数据清洗准确率也得到提升,且该算法适用于海量数据的情形.  相似文献   

11.
基于位置的服务(location based services, LBS)为人们日常生活带来极大便利的同时也严重地威胁到用户的隐私.为了在保护用户位置隐私的同时降低用户的查询代价,提出了一种基于安全索引的位置隐私保护方法(location privacy protection method based on secure index, LPPMSI).LPPMSI不需要用户搜集数据信息,数据拥有者为虚假位置信息建立安全索引.用户能够安全、快速地检索到虚假位置信息,服务器再执行基于虚假位置的LBS.并且还提出了基于滑动窗口的候选位置选择算法,有效减少候选位置选择时间.实验结果表明,LPPMSI在不改变隐私保护能力的前提下,不需要用户花费大量时间搜集数据分布及查询概率信息.  相似文献   

12.
针对现有的社交网络用户推荐方案中主要考虑个体相似性问题以及节点角色无层次差别的问题,提出一种基于相似社团和节点角色划分的推荐方案。在传统的用户相似度计算基础上,从社团结构和属性两方面,综合考虑社团间联系的紧密程度和社团用户兴趣爱好相似程度,提出一种社团相似度的计算方法;其次,从用户节点所在的社团内部和外部2个维度度量节点间紧密度,并据此度量节点的社会影响力,进而将它们划分成不同角色,实现用户推荐的差异化。通过新浪微博真实社交数据对方案进行验证,实验结果表明,该方案适用于存在社团现象的社交网络层次化用户推荐,并具有良好的推荐效果。  相似文献   

13.
应用Python爬虫程序,通过新浪API端口爬取了新浪微博2012年的地点签到数据,共计5 028 980条。将这些数据按城市划分,共分为340个地级以上的城市或地区。通过统计发现,签到次数最多的3个城市为北京、上海和广州,说明微博用户更多地活跃在这三个城市。进一步通过相关性分析发现,这些城市的微博用户签到流量和当地GDP呈一定的相关性,说明经济发展水平会影响用户的旅行行为。此外,本文还按照用户的出行流量对各大城市进行了聚类划分,进一步印证了经济发达城市对微博用户签到的吸引会高于其他经济欠发达的城市。  相似文献   

14.
为了提高移动用户位置预测的精度,提出了基于并行模式挖掘和路径匹配的移动用户位置预测方法,对传统的FP-GROWTH算法作了并行化处理,优化了节点负载分配方法,在Spark平台下挖掘用户移动频繁模式.改进了基于索引的路径相似度算法,提出基于路径最短距离的相斥度算法,提高了对轨迹数据缺失的适用性.在真实的用户轨迹数据集上实验表明,提出的基于轨迹相斥度预测方法相比马尔可夫模型和卡尔曼滤波模型拥有更高的预测精度,预测精确度平均提升7%左右.  相似文献   

15.
基于滑动窗口最长公共子序列Wi Fi指纹定位算法   总被引:1,自引:0,他引:1  
针对基于Wi Fi瞬时指纹定位算法中由于RSS信号的时变特性引起的Wi Fi定位精度差问题,提出了一种基于滑动窗口最长公共子序列指纹定位算法.该算法将时间序列的RSS信号指纹转化为基于滑动窗口的数据模型,增加了指纹特征信息,提高比对准确性.通过计算请求定位数据与样本的最长公共子序列来获得样本点的相似性,解决由于窗口伸缩或滑动窗口中个别采样点无信号引起的比对不准确问题,从而提高了定位的精确性和鲁棒性.实验结果表明,所提定位算法的结果明显优于瞬时指纹定位算法.  相似文献   

16.
基于用户移动行为相似性聚类的Markov位置预测   总被引:1,自引:0,他引:1  
由于采集点丢失或出现新用户等原因,GPS轨迹数据往往具有稀疏性,使得基于单个用户数据的位置预测准确率较低.针对这种情况,提出了基于移动行为相似性和用户聚类的Markov位置预测方法.首先,基于Voronoi图和原始GPS轨迹进行区域划分,位置预测基于区域轨迹进行;其次,提出了同时考虑用户转移特性和用户区域特性的移动行为相似性计算方法;再次,根据移动行为相似性对用户进行聚类,并在聚类的用户组上采用一阶Markov模型进行位置预测,提高了位置预测的准确性.真实GPS轨迹数据上的实验表明了所提出方法的有效性.  相似文献   

17.
针对网络上机器用户大量散布谣言, 发布虚假信息, 误导网民舆论, 严重影响网络环境的问题, 以微博中的机器用户为研究对象, 结合其自动化程度高、伪装能力强、信息发布有针对性的特点, 从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标, 利用信息熵、内容重复率等8个指标构建微博用户的特征向量, 通过随机森林算法设计微博中机器用户的识别模型。最后, 在真实的新浪微博数据集上进行验证, 结果表明本模型识别机器用户的准确度达到96.7%, 可以有效地区分微博中的机器用户和普通用户。  相似文献   

18.
现有研究集中于不带有时间空间信息或带有固定时间空间信息的活动序列相似度计算,没有从不同层次来度量用户行为序列的相似性,为了实现对用户行为多粒度多视角的动态认知,提出一种基于序列比对算法Needleman-Wunsch的多粒度时空序列比对算法(multi-granular spatiotemporal sequences alignment,MGSSA),扩展了NW算法的得分函数以结合时间、空间信息,通过粒度调控实现了从不同的粒度来计算时空事件序列的相似度.实验证明,多粒度时空序列比对算法MGSSA是有效且可行的.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号