共查询到20条相似文献,搜索用时 883 毫秒
1.
针对网络上机器用户大量散布谣言, 发布虚假信息, 误导网民舆论, 严重影响网络环境的问题, 以微博中的机器用户为研究对象, 结合其自动化程度高、伪装能力强、信息发布有针对性的特点, 从行为模式、微博内容、用户关系和发布平台4个维度分析机器用户的特征指标, 利用信息熵、内容重复率等8个指标构建微博用户的特征向量, 通过随机森林算法设计微博中机器用户的识别模型。最后, 在真实的新浪微博数据集上进行验证, 结果表明本模型识别机器用户的准确度达到96.7%, 可以有效地区分微博中的机器用户和普通用户。 相似文献
2.
3.
从微博的内容属性和社交网络的信息传播规律特征出发,将微博文本与用户关注关系结合作为用户兴趣分类的标准,从而使提取的用户兴趣的更加准确、有效。借助建立的用户兴趣分类模型解决用户兴趣分类问题,选取新浪微博作为研究对象,应用LDA算法进行主题提取,应用LibSVM算法进行分类。实验证明,该方法分类时增加了对用户信息的全面性应用,而且与其他方法相比有更高的分类准确率。 相似文献
4.
以新浪个人微博用户为研究对象,建立了一个"关注"与"被关注"的有向网络.将节点度、紧密度、介数和K-壳4个社会网络指标应用到微博有向网络,研究了个人微博用户网络中节点的中心性,得到网络中重要性用户,分析了他们在信息传播中的作用和在网络中所表现出来的特性,体现出该用户的兴趣爱好.研究了社会网络指标与度之间的相关性,体现出网络各指标之间的关系.研究结果有助于识别个人微博用户网络的关键节点,进而分析信息在个人微博用户网络中的传播. 相似文献
5.
微博类社交网络中信息传播的测量与分析 总被引:1,自引:0,他引:1
为了更好地掌握在线社交网络中信息传播的特征规律和用户行为,以新浪微博为代表对社交网络中的信息传播进行了较大规模的测量、统计和分析,提出了一种三角和算法用于探测用户粉丝数阈值。该算法根据散点分布的统计规律来估计使微博热度达到某一值的粉丝数的临界值,发现为使微博热度大于10,用户粉丝数应大于150。其他测量分析结果表明:新浪微博具有很强的"名人效应",用户频繁地发帖并不能引起较大的关注,热门微博的热度几乎都以激增方式增长。这些结论对网络营销和网络监管具有参考价值。 相似文献
6.
《江苏大学学报(自然科学版)》2016,(3)
微博正逐步成为公共信息传播的主要媒体,高效地获取微博数据则显得至关重要,分析微博数据有助于研究者及时了解舆情信息.由于传统网页爬虫无法获取完整的微博信息,微博API又有诸多限制,因此针对新浪微博,设计了一种基于P2P技术的微博爬虫系统.该系统避免了新浪API的功能和连接限制,使用基于模拟登录的网页爬虫,根据用户的地理位置信息划分任务,实现连续高效的数据采集.通过与其他架构的试验比较,证明本系统具有良好的性能,能为舆情分析提供数据支持. 相似文献
7.
8.
微博中僵尸粉的大量出现,不仅对微博影响力计算与社交网络关系分析带来了新的挑战,而且对用户带来了社交诚信危机。首先对微博僵尸粉进行概念上的定义;其次通过用户个人信息、用户微博内容和用户链接关系分析僵尸粉与普通用户之间的不同特征,并训练了一个基于C4.5决策树的僵尸粉分类系统;最后使用新浪微博数据对系统进行评估,结果显示该系统对微博僵尸粉有92.8%的判别准确率与92.8%的召回率。 相似文献
9.
10.
本文通过对基于新浪微博的"985工程"高校图书馆账号的调研,分析了发文量、发文内容等与粉丝数的关系,提出了高校图书馆微博运营的意见和建议。 相似文献
11.
微博中僵尸粉的大量出现,不仅对微博影响力计算与社交网络关系分析带来了新的挑战,而且对用户带来了社交诚信危机。首先对微博僵尸粉进行概念上的定义;其次通过用户个人信息、用户微博内容和用户链接关系分析僵尸粉与普通用户之间的不同特征,并训练了一个基于C4.5决策树的僵尸粉分类系统;最后使用新浪微博数据对系统进行评估,结果显示该系统对微博僵尸粉有92.8%的判别准确率与92.8%的召回率。 相似文献
12.
为清晰而明确地掌握社交媒体使用与用户信息窄化的关系及其作用程度,选取典型的社交媒体之一新浪微博(N = 7 825),分析微博使用度、活跃度、影响度的现实指标所伴随的用户信息窄化.从两方面实证考量用户内容在多种使用指标中的信息窄化.结合配对样本t检验的结果显示,微博媒介的使用程度越高的用户层级,其语义上的自我相似度越高,内容类型的分布均衡程度和丰富程度越低. 相似文献
13.
社交网络服务每天产生大量涉及众多话题的信息,并在影响力各异的用户群体推动下广泛传播。在IP(influence passivity)算法的基础上,提出了一种综合话题相似性与信息时效性的影响力用户发现算法EIP(extended influence-passivity)。该算法在转发网络上考虑用户间话题的相似性以及博文信息时效性,更加精准地建模和计算用户的影响力和消极性。基于新浪微博上爬取的约10万用户数据集上的实验验证,EIP影响力度量算法优于IP和TwitterRank等现有方法。 相似文献
14.
微博产品的问世,预示着一个媒介新时代的来临。新浪微博的商业价值将体现在危机公关、舆论炒作以及网络推广方面。盈利模式的关键是企业的价值创造活动,有效的价值创造活动必须是能持续的创造出差异化的产品和服务。保障盈利的前提和基础是海量的用户和用户对于新浪微博的粘性及忠诚度。目前微博营销的模式至少有以下几种:活动营销、植入式广告、客户服务的新平台、品牌宣传。 相似文献
15.
基于改进PageRank算法的微博用户影响力评估 总被引:1,自引:0,他引:1
为筛选微博网络和消息传播中的意见领袖,综合分析微博用户属性、行为和微博消息的传播特性,把用户的影响力因素分为:用户潜在影响力和微博传播影响力,据此构建用户影响力评估指标.进而提出基于改进RankPage算法的微博用户影响力评估算法.通过采集新浪微博某一话题下的数据计算用户的影响力,验证了方法的有效性和合理性. 相似文献
16.
学生的情感教育一直是教育界的研究热点和难点,由于学生个人情感的隐秘性,教师很难获取学生的情感状况.研究通过学生大量使用的社会交互网站中的文本信息分析学生的情感状态,核心是针对学生常用情感词构建情感词典,根据学生大量使用新词、伪词的特点,结合新浪微博提供的情感符号,以现有情感词典为基础,在动态更新的新浪微博大数据中应用文本相似度计算方法,扩充情感词典,构建符合学生语言特点和新浪微博风格的学生情感词典.词典包括情感极性和强度,为基于学生微博文本的情感感知和进一步的情感教育奠定基础. 相似文献
17.
18.
微博客的信息组织建设及对图书馆的启示 总被引:1,自引:0,他引:1
微博客是信息时代新兴代表讯息系统,已在各行各业得到了广泛的应用,以新浪微博客为例,分析了新浪微博客的微博广场、个人及互动信息组织方式,认为微博客以人为中心,以信息快速获取为信息组织目的,以浏览和搜索为主要信息获取方式,认为这种模式对社会信息服务机构的图书馆而言有一定的借鉴意义. 相似文献
19.
20.
针对当前微博影响力度量算法中多集中于用户行为属性,忽略博文、结点本身价值的问题,从微博用户信息出发,以线性加权模型为基础,综合分析用户的行为属性、博文相似度、节点相似度,创建影响力评价指标体系。利用Page Rank算法思想,提出了基于用户行为和博文内容的用户影响度量模型(user influence measurement rank,UMR)。通过采用新浪微博真实数据集测试,计算用户的影响力,验证了UMR算法在博文内容的基础上,能客观地反映用户的交互行为,消除僵尸用户对排序的影响,因而更科学、更合理。 相似文献