首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 234 毫秒
1.
针对社交网络用户个人信息难以获取、公开信息不完整、不通用甚至内容虚假的问题,选择了普适性强,且能客观、真实反映用户行为习惯的位置数据作为相似性分析依据,对新浪微博、滴滴打车进行位置数据采集,形成两个高价值且具有国内网民特色的数据集作为实验对象.提出了一种基于时间滑动窗口模型的轨迹相似性匹配算法,通过调整时间窗口和位置距离优化算法F值,实现不同网络平台用户的相似性分析.以对新浪微博和滴滴打车的用户位置数据为例进行验证,实验结果证明了地理位置为虚拟身份相似性判断的正相关影响因子,且判断相似性的平均F值超过90%.   相似文献   

2.
以新浪微博为研究对象,基于微博主题及用户特征,提出社交网络中的用户转发行为预测算法.首先,基于互信息理论,从已发生转发行为的用户的微博内容中提取特征,通过分析给定用户的微博内容与特征之间的相关程度,预测用户是否会对给定主题的微博发生转发行为;然后通过研究用户性别、粉丝数、关注数、微博数与用户转发行为的关系,选取合适的用户特征描述,并基于贝叶斯模型预测给定用户对微博的转发概率.最后,结合以上2种算法的预测结果,得到给定用户对某主题微博的转发行为预测.该预测算法对研究网络舆情传播及微博营销具有重要意义.  相似文献   

3.
以新浪个人微博用户为研究对象,建立了一个"关注"与"被关注"的有向网络.将节点度、紧密度、介数和K-壳4个社会网络指标应用到微博有向网络,研究了个人微博用户网络中节点的中心性,得到网络中重要性用户,分析了他们在信息传播中的作用和在网络中所表现出来的特性,体现出该用户的兴趣爱好.研究了社会网络指标与度之间的相关性,体现出网络各指标之间的关系.研究结果有助于识别个人微博用户网络的关键节点,进而分析信息在个人微博用户网络中的传播.  相似文献   

4.
基于改进PageRank算法的微博用户影响力评估   总被引:1,自引:0,他引:1  
为筛选微博网络和消息传播中的意见领袖,综合分析微博用户属性、行为和微博消息的传播特性,把用户的影响力因素分为:用户潜在影响力和微博传播影响力,据此构建用户影响力评估指标.进而提出基于改进RankPage算法的微博用户影响力评估算法.通过采集新浪微博某一话题下的数据计算用户的影响力,验证了方法的有效性和合理性.  相似文献   

5.
针对微博群落的识别与形成演化机理的获取问题,提出一种基于超图的微博群落感知方法.归纳微博用户的交互关系,提出以用户为节点、交互关系为边的微博用户交互关系超图模型;分析微博用户交互环境的情境特征,通过FP-TREE方法挖掘用户交互与情境特征的关联规则;根据关联规则对超图模型进行划分,得到具有相同情境的微博群落.以新浪微博为例进行了模拟验证,结果表明该方法能够感知导致微博群落形成的情境特征,且较传统数据挖掘方法能够更加准确地识别微博群落.  相似文献   

6.
新浪微博数据挖掘方案   总被引:27,自引:0,他引:27  
随着新浪微博用户群体的增长,新浪微博的数据获取是微博研究首先需要解决的问题。该文提出了基于新浪微博API与基于页面解析的新浪微博数据获取方案。程序逻辑控制API调用方法与频率,获取JSON对象并解析实现高效数据获取。同时将传统的网络爬虫结合网页解析技术结合API同时使用,解决了因API接口开放不完善,且因在返回结果数量上限与调用频率方面的限制,导致不能有效实现新浪微博数据的全面获取的问题。经过实验测试,通过2套方案的结合可以实现新浪微博数据高效全面的获取。  相似文献   

7.
近日,新浪微博与中网(knet.cn)的“可信网站”验证合作正式上线。今后网站通过中网“可信网站”验证后.如果选择开通新浪官方微博,可以快速获得机构认证,实现一次认证跨平台应用。目前,新浪微博的注册用户已突破3亿。中网与新浪微博建立合作后.通过中网“可信网站”验证网站,在开通新浪官方微博的同时可以获得新浪微博机构认证实现了一次认证全网通用,  相似文献   

8.
以新浪微博名人堂用户所形成的用户关系网络为研究对象,利用复杂网络的分析方法对该网络的度分布、小世界现象、度相关性等多个方面进行了分析.研究结果表明:该网络在度分布上存在背离幂律分布的现象,网络有效直径较短,各节点度之间不存在明显的相关性、网络不具有层次性等特点.  相似文献   

9.
基于复杂网络的微博用户关系网络特性研究   总被引:1,自引:0,他引:1  
以新浪、腾讯、搜狐三大微博注册用户为研究对象,根据用户之间的关注关系构建了复杂网络,分别给出了该网络的度分布、聚集系数以及平均路径长度等统计特征,得出微博用户关系网络具有无标度特性以及小世界效应.  相似文献   

10.
微博正逐步成为公共信息传播的主要媒体,高效地获取微博数据则显得至关重要,分析微博数据有助于研究者及时了解舆情信息.由于传统网页爬虫无法获取完整的微博信息,微博API又有诸多限制,因此针对新浪微博,设计了一种基于P2P技术的微博爬虫系统.该系统避免了新浪API的功能和连接限制,使用基于模拟登录的网页爬虫,根据用户的地理位置信息划分任务,实现连续高效的数据采集.通过与其他架构的试验比较,证明本系统具有良好的性能,能为舆情分析提供数据支持.  相似文献   

11.
正在信息高度发达的时代,移动网络社交平台带给我们的便利毋庸置疑,鼎盛期时,几乎人手都有一个微信账号、QQ号、微博账号……然而,大量的网民数据信息所引发的问题也接连发生,2014年8月,新浪微博运营方发现在脉脉产品内,大量非脉脉用户直接显示有新浪微博用户的头像、名称、职业和教育等信息。在此之前,新浪微博和脉脉一直有合作,用户可以通过新浪微博账号和个人手机号注册登录脉  相似文献   

12.
《上海信息化》2011,(7):94-94
中国电信与新浪在北京签署合作协议,双方将基于新浪微博产品开展深度合作。本次合作是中国电信积极倡导并实践平台能力开放的重要一步。中国电信天翼用户将可以使用中国电信通行证帐号登录新浪微博。中国电信成为率先向新浪开放用户认证服务的电信运营商,  相似文献   

13.
多策略中文微博细粒度情绪分析研究   总被引:1,自引:0,他引:1  
针对中文微博用户的情绪分析问题, 提出一种基于多策略融合的细粒度情绪分析方法。首先采用朴素贝叶斯算法对微博的有无情绪分类问题进行研究, 然后构建有情绪微博的21维特征向量, 最后采用SVM和KNN算法对微博进行细粒度情绪分析。以新浪微博作为实验对象, 结果表明多策略集成方法好于单一分类 算法。在多策略集成方法中, “NB+SVM”方法略优于“NB+KNN”方法。  相似文献   

14.
微博中僵尸粉的大量出现,不仅对微博影响力计算与社交网络关系分析带来了新的挑战,而且对用户带来了社交诚信危机。首先对微博僵尸粉进行概念上的定义;其次通过用户个人信息、用户微博内容和用户链接关系分析僵尸粉与普通用户之间的不同特征,并训练了一个基于C4.5决策树的僵尸粉分类系统;最后使用新浪微博数据对系统进行评估,结果显示该系统对微博僵尸粉有92.8%的判别准确率与92.8%的召回率。  相似文献   

15.
宏观微观     
<正> 5000万11月16日,新浪召开微博开发者大会。在大会上,新浪发布了针对开发者的一系列扶持策略,承诺其平台将全面开放。同时宣布携手五大顶级风投,正式启动中国微博开发者创新基金。据了解,目前新浪微博用户数已达5000万,新浪微博用户平均每天发布超过2500万条微博内容。在用户每天发布的所有微博中,有38%来自于移动终端。  相似文献   

16.
通过微博话语对新浪微博相关用户进行的身份分析显示,Bucholtz和Hall的身份分析体系适用于微博话语身份的分析,即微博话语身份同样满足浮现原则、定位原则、指示性原则、关系性原则及部分原则。新兴的微博话语身份建构研究因其顺应了微观层面的交际者身份建构研究这一趋势以及注重实证分析,展现了不容忽视的学术研究价值与研究空间。  相似文献   

17.
为清晰而明确地掌握社交媒体使用与用户信息窄化的关系及其作用程度,选取典型的社交媒体之一新浪微博(N = 7 825),分析微博使用度、活跃度、影响度的现实指标所伴随的用户信息窄化.从两方面实证考量用户内容在多种使用指标中的信息窄化.结合配对样本t检验的结果显示,微博媒介的使用程度越高的用户层级,其语义上的自我相似度越高,内容类型的分布均衡程度和丰富程度越低.  相似文献   

18.
微博中僵尸粉的大量出现,不仅对微博影响力计算与社交网络关系分析带来了新的挑战,而且对用户带来了社交诚信危机。首先对微博僵尸粉进行概念上的定义;其次通过用户个人信息、用户微博内容和用户链接关系分析僵尸粉与普通用户之间的不同特征,并训练了一个基于C4.5决策树的僵尸粉分类系统;最后使用新浪微博数据对系统进行评估,结果显示该系统对微博僵尸粉有92.8%的判别准确率与92.8%的召回率。  相似文献   

19.
目的研究新浪微博数据采集问题。方法利用新浪微博API接口和本文设计的网络爬虫模型进行数据采集。结果与结论实验证明两种方法都可以在较短时间内收集到较多用户资料,但在过滤去重方面,本文设计的算法在时间上更为高效。  相似文献   

20.
针对网络上机器用户大量散布谣言, 发布虚假信息, 误导网民舆论, 严重影响网络环境的问题, 以微博中的机器用户为研究对象, 结合其自动化程度高、伪装能力强、信息发布有针对性的特点, 从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标, 利用信息熵、内容重复率等8个指标构建微博用户的特征向量, 通过随机森林算法设计微博中机器用户的识别模型。最后, 在真实的新浪微博数据集上进行验证, 结果表明本模型识别机器用户的准确度达到96.7%, 可以有效地区分微博中的机器用户和普通用户。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号