首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
基于社交网络大数据的研究视角,选取全国348个城市之间一年的跨城市社交媒体地理位置签到数据,采取优化粒子群(PSO)方法,使用引力模型,逆向推导该系统中空间相互作用的距离衰减函数以及各城市的节点吸引力。通过引入经济发展水平、产业结构、人口规模和结构、旅游竞争力、教育水平5个方面的12项变量,经过因子分析和回归分析,探究这些变量对节点吸引力的影响作用。结果表明,社交媒体签到系统中的交互流量符合距离衰减的幂律函数,与其他交互系统相比,其距离衰减系数偏小,说明全国尺度的城市间人的移动受距离影响不明显。对全国城市节点吸引力及其排名的进一步分析发现,与旅游竞争力、城市发展成熟度、人口规模这几个维度相关的因子对社交媒体签到系统中的城市节点吸引力有显著的影响。研究结论将为更好地理解人类签到和移动行为,为进一步了解复杂网络系统中节点吸引力的内涵做出一定的理论和实际贡献。  相似文献   

2.
针对目前城市功能区划分大多依靠人工完成,且未充分使用城市中时空数据的问题,提出一种基于时空语义挖掘的城市功能区识别方案.首先,选取某城市矩形区域为研究样本,并以建筑物为划分依据将研究样本划分为有效的基础区域;然后,对各基础区域内的新浪微博位置签到数据及POI(Points of Interest)数据进行时空语义挖掘,采用狄利克雷多项式回归(DMR)主题模型生成区域的功能性向量;最后,通过向量聚类,依据POI类别比例完成区域的功能性识别.实验结果表明,本方案相比基于POI密度的k-means聚类方案和基于潜在狄利克雷分布(LDA)主题模型的城市功能区识别方法具有更高的准确性,位置签到数据所表征出的人们活动模式可以揭示城市功能区之间的差异,在城市地理空间分析上具有良好的效果.  相似文献   

3.
正在信息高度发达的时代,移动网络社交平台带给我们的便利毋庸置疑,鼎盛期时,几乎人手都有一个微信账号、QQ号、微博账号……然而,大量的网民数据信息所引发的问题也接连发生,2014年8月,新浪微博运营方发现在脉脉产品内,大量非脉脉用户直接显示有新浪微博用户的头像、名称、职业和教育等信息。在此之前,新浪微博和脉脉一直有合作,用户可以通过新浪微博账号和个人手机号注册登录脉  相似文献   

4.
新浪微博数据挖掘方案   总被引:27,自引:0,他引:27  
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。  相似文献   

5.
微博正逐步成为公共信息传播的主要媒体,高效地获取微博数据则显得至关重要,分析微博数据有助于研究者及时了解舆情信息.由于传统网页爬虫无法获取完整的微博信息,微博API又有诸多限制,因此针对新浪微博,设计了一种基于P2P技术的微博爬虫系统.该系统避免了新浪API的功能和连接限制,使用基于模拟登录的网页爬虫,根据用户的地理位置信息划分任务,实现连续高效的数据采集.通过与其他架构的试验比较,证明本系统具有良好的性能,能为舆情分析提供数据支持.  相似文献   

6.
现有的微博好友推荐算法没有充分考虑网络关系结构,导致发现的邻居群合理性较差。针对这个问题,围绕微博用户群聚规律和社交网络特点展开研究,提出一种基于核心用户对发现的微博好友推荐算法;该算法首先将任意两个具有相互关注关系的用户封装成用户对的形式并计算各用户对之间的交互行为相似度,然后通过密度和距离两个参数发现核心用户对以及划分合理的邻居类簇,最后根据制定的推荐规则向用户进行好友推荐。结果表明,相比传统的协同过滤方法,该算法明显提高了微博好友推荐的精度,核心用户对发现、类簇的合理划分以及推荐规则的制定能够缓解数据稀疏和冷启动带来的问题。  相似文献   

7.
微博类社交网络中信息传播的测量与分析   总被引:1,自引:0,他引:1  
为了更好地掌握在线社交网络中信息传播的特征规律和用户行为,以新浪微博为代表对社交网络中的信息传播进行了较大规模的测量、统计和分析,提出了一种三角和算法用于探测用户粉丝数阈值。该算法根据散点分布的统计规律来估计使微博热度达到某一值的粉丝数的临界值,发现为使微博热度大于10,用户粉丝数应大于150。其他测量分析结果表明:新浪微博具有很强的"名人效应",用户频繁地发帖并不能引起较大的关注,热门微博的热度几乎都以激增方式增长。这些结论对网络营销和网络监管具有参考价值。  相似文献   

8.
基于改进PageRank算法的微博用户影响力评估   总被引:1,自引:0,他引:1  
为筛选微博网络和消息传播中的意见领袖,综合分析微博用户属性、行为和微博消息的传播特性,把用户的影响力因素分为:用户潜在影响力和微博传播影响力,据此构建用户影响力评估指标.进而提出基于改进RankPage算法的微博用户影响力评估算法.通过采集新浪微博某一话题下的数据计算用户的影响力,验证了方法的有效性和合理性.  相似文献   

9.
以网络爬虫方式获取新浪微博用户属性信息及微博内容数据,利用数据挖掘技术从中发现微博用户间的多种显式和隐式关系.在此基础上,提出一种基于半监督学习的用户兴趣匹配预测算法,参照仓室模型的传播个体状态划分方法,基于传播个体间的兴趣匹配度界定各状态之间的转移过程和转移概率,进而构建基于用户兴趣匹配的网络舆情传播模型.研究结果表明,该模型能够较好地描述社交网络中的舆情传播规律,重现网络舆情在社交网络中的真实传播过程链.  相似文献   

10.
微博中僵尸粉的大量出现,不仅对微博影响力计算与社交网络关系分析带来了新的挑战,而且对用户带来了社交诚信危机。首先对微博僵尸粉进行概念上的定义;其次通过用户个人信息、用户微博内容和用户链接关系分析僵尸粉与普通用户之间的不同特征,并训练了一个基于C4.5决策树的僵尸粉分类系统;最后使用新浪微博数据对系统进行评估,结果显示该系统对微博僵尸粉有92.8%的判别准确率与92.8%的召回率。  相似文献   

11.
针对现有的社交网络用户推荐方案中主要考虑个体相似性问题以及节点角色无层次差别的问题,提出一种基于相似社团和节点角色划分的推荐方案。在传统的用户相似度计算基础上,从社团结构和属性两方面,综合考虑社团间联系的紧密程度和社团用户兴趣爱好相似程度,提出一种社团相似度的计算方法;其次,从用户节点所在的社团内部和外部2个维度度量节点间紧密度,并据此度量节点的社会影响力,进而将它们划分成不同角色,实现用户推荐的差异化。通过新浪微博真实社交数据对方案进行验证,实验结果表明,该方案适用于存在社团现象的社交网络层次化用户推荐,并具有良好的推荐效果。  相似文献   

12.
针对社交网络用户个人信息难以获取、公开信息不完整、不通用甚至内容虚假的问题,选择了普适性强,且能客观、真实反映用户行为习惯的位置数据作为相似性分析依据,对新浪微博、滴滴打车进行位置数据采集,形成两个高价值且具有国内网民特色的数据集作为实验对象.提出了一种基于时间滑动窗口模型的轨迹相似性匹配算法,通过调整时间窗口和位置距离优化算法F值,实现不同网络平台用户的相似性分析.以对新浪微博和滴滴打车的用户位置数据为例进行验证,实验结果证明了地理位置为虚拟身份相似性判断的正相关影响因子,且判断相似性的平均F值超过90%.   相似文献   

13.
目的自动从新浪微博中抓取含指定关键词的相关微博,通过对抓取的微博进行分析,得到相关舆情热点。方法首先通过多线程爬虫,自动爬取含有指定关键字的微博,将其保存于数据库中,再采用基于字符串匹配的逆向最大匹配法对微博进行分词,计算各分词项的TF-IDF权重作为文本聚类的输入数据,最后用k-means算法进行聚类分析,得出舆情热点。结果与结论这种方法能自动从新浪微博中抓取含指定关键词的相关微博,通过聚类分析,每一族的微博内容具有较高的一致性和共同的主题,由此可迅速找出热点舆情,对及时了解和引导舆情具有积极的意义。  相似文献   

14.
在移动互联网技术的发展下,新媒体应运而生且迅速发展,其特点呈现出与传统媒体时代不同的特质,新媒体面向的对象大众化,内容多样丰富化,信息传递飞速化,其中新浪微博作为典型的新媒体平台,除了搭建起熟人、半熟人的沟通渠道外,也可被陌生人所关注,涉及领域范围广且还能够实现互动交流,具有高效开放性。近年来,创业类意见领袖纷纷将新浪微博作为传播的渠道,他们的言论行为都在某种程度上影响着粉丝们,进而推动创业教育和创业学习的发展。本文选取10位创业类意见领袖(Key Opinion Leader, KOL),对他们近五年新浪微博发文内容及发文量,更新频率、关注点等行为特征进行研究,对其微博数据进行量化分析,发现创业类意见领袖的特征有所差异,并针对大学生和创业者提出利用新浪微博进行创业学习的建议。  相似文献   

15.
针对网络上机器用户大量散布谣言, 发布虚假信息, 误导网民舆论, 严重影响网络环境的问题, 以微博中的机器用户为研究对象, 结合其自动化程度高、伪装能力强、信息发布有针对性的特点, 从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标, 利用信息熵、内容重复率等8个指标构建微博用户的特征向量, 通过随机森林算法设计微博中机器用户的识别模型。最后, 在真实的新浪微博数据集上进行验证, 结果表明本模型识别机器用户的准确度达到96.7%, 可以有效地区分微博中的机器用户和普通用户。  相似文献   

16.
通过对使用新浪微博的204名大学生的调查, 发现线上社会支持、社交媒体使用和社交自我效能感之间显著相关, 它们之间的关系因社会支持类型的不同而各有特点: 把社会支持看成一个整体时, 社交媒体上的社交互动在线上社会支持对社交自我效能的影响中起调节作用, 随着社交媒体的社交互动增多, 线上社会支持对社交自我效能感的正性影响越来越显著; 而从线上社会支持的归属感维度讲, 社交媒体上的社交互动在线上社会支持和社交自我效能感之间起完全中介作用, 归属感促使大学生更多地在社交媒体上进行社交互动, 由此提升其社交自我效能感。研究结果可为理解人们为什么喜欢使用社交媒体以及线上行为如何影响线下心理与行为提供启示。  相似文献   

17.
利用新浪微博的微群信息,在蚁群算法的基础上,提出了一种基于群体智慧思想的排序模型(ACOR),通过结合用户的偏好及电影热度对电影进行综合排名.同时考虑了微博中的情感因素,分析用户对电影的情感倾向并计算其情感值.最后,根据群体形成的情感积累值对热议的电影排序.实验结果表明:该模型更符合用户的偏好,并具有一定的实时性,可以有效地为用户提供相关电影信息.  相似文献   

18.
Weibo is the Twitter counterpart in China that has attracted hundreds of millions of users. We crawled an almost complete Weibo user network that contains 222 million users and 27 billion links in 2013. This paper analyzes the structural properties of this network, and compares it with a Twitter user network. The topological properties we studied include the degree distributions, connected components, distance distributions, reciprocity,clustering coefficient, Page Rank centrality, and degree assortativity. We find that Weibo users have a higher diversity index, higher Gini index, but a lower reciprocity and clustering coefficient for most of the nodes. A surprising observation is that the reciprocity of Weibo is only about a quarter of the reciprocity of the Twitter user network. We also show that Weibo adoption rate correlates with economic development positively, and Weibo network can be used to quantify the connections between provinces and regions in China. In particular, point-wise mutual information is shown to be accurate in quantifying the strength of connections. We developed an interactive analyzing software framework for this study, and released the data and code online.  相似文献   

19.
涂师师  贾贞 《广西科学》2013,20(1):75-78,81
选取新浪微博中标签为桂林理工大学(桂林理工大学片区)的部分注册用户关系数据,构建一个基于微博的局域社交网络,应用社会网络分析UCINET软件对该社交网络的基本结构特性、网络成员的派系、地位等做了实证分析,并通过一条微博转播的实际数据验证了分析结果的可信性.  相似文献   

20.
社交媒体话题检测一直是个热点问题,由于社交数据杂乱异构,且具有时效性,语义模糊性等特点,话题检测也是个难点问题.研究利用复杂网络对社交文本数据进行建模,并结合一种基于极大团凝聚层次聚类的重叠社团发现方法实现了社交话题的检测.文本数据建模中,通过自定义突发系数量化话题词,即把话题词看作具有时域分布偏好的关键词,并通过自定义相关系数连接话题词,构建话题网络.为使自定义系数更适用于动态数据环境,实验结合真实数据进行了适应性测试优化系数.文章把采用EAGLE重叠社团发现方法在公开数据集上评测,根据Q函数值显示结果明显优于当前一些重叠社团发现策略,研究对采样的60万条青少年社交数据进行了话题分析并可视化了分析结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号