首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
从帖子和用户两个角度对网络论坛的人类行为动力学特征进行实证统计和分析.对帖子属性的统计分析发现,帖子的回复次数、吸引的不同用户数均服从幂律分布,而帖子的浏览次数分布没有明显的规律性;帖子的浏览次数和回复次数之间存在明显的正相关性,且二者的比值大于等于10.对用户发帖、回帖行为的统计分析发现,用户发帖数、回帖数、回复的不同主帖数均服从幂律分布,说明网络论坛用户行为具有很强的异质性,大多数用户很少发帖或回帖,关注范围也比较小,只有少数活跃用户经常发帖或回帖,关注面非常广;还发现单个用户单日回帖数以及单个用户针对单个主帖的回复数也均服从幂律分布,存在少数用户在个别日子里发表大量回帖和少数用户针对少量主帖发表大量回帖的现象.这些结论对于在线用户行为建模具有重要的指导意义,也为网络舆情监控和网络水军发现提供了新的思路.  相似文献   

2.
本文基于在线电影点播的实证数据库进行研究,根据电影评分将电影划分为不同的集群,对集群内人们电影点播的时间特性进行统计力学研究,发现偏离泊松分布而用幂函数能够很好的拟合,并进一步对电影的点播率进行统计分析,发现存在任务驱动和兴趣驱动的人类行为模式,电影点播现象存在马太效应。  相似文献   

3.
很多因素可以引起页面的发送请求,使用统计事件间隔的方法来过滤掉非正常访问的过程,并且对比事件间隔和时间间隔的分布规律,对用户浏览网页的行为进行分析.研究国内某高校局域网日志,统计结果显示:这个高校局域网用户访问网页的事件间隔分布也具有明显的规律性,且和用户访问网页的时间间隔分布表现出了明显的差异.  相似文献   

4.
对帕菲克国际健身俱乐部全体会员近27个月的登陆信息进行了实证分析,统计结果表明:无论是全体会员、分组会员还是个体会员,其登陆系统的间隔时间均近似于幂律分布;通过按照活跃程度对俱乐部会员进行分组,发现各分组群体的间隔时间分布尽管仍呈现幂律特性,但其幂指数却各不相同,且与活跃程度之间存在一定的联系;针对某个时间段的统计结果...  相似文献   

5.
用户在线行为的记忆性研究有助于揭示用户在线行为特性,构建更准确的在线行为预测模式,对基于在线行为的网络安全防御和信息推荐都具有重要的意义。基于收集的某高校网关日志数据,首先分析了用户在线行为中的记忆特性。研究发现用户的在线行为具有较强的记忆性,其分布服从高斯分布。其次,定义了用户在线行为的记忆长度,统计发现其在个体水平和群体水平上都呈现幂律分布,表明用户的在线行为存在长期记忆。据此建立了马尔科夫过程模型,仿真重现了用户上网行为的记忆性特征。研究结果表明用户的在线行为不仅具有记忆性,而且这种记忆性可以为用户在线行为模式的构建提供指导。  相似文献   

6.
经验表明高频时间序列的分布常是“肥尾”型的,而非传统建模中的“薄尾”型的正态分布.为体现“肥尾”现象,ARCH类模型广泛应用于金融时间序列的建模中.使用极值理论和极值指数估计量的性质,在大样本的情况下得到序列分布“肥尾”现象的检验方法、  相似文献   

7.
关于记忆对人类动力学影响的讨论   总被引:1,自引:0,他引:1       下载免费PDF全文
通过考察Vázquez提出的人类动力学记忆模型,对Vázquez关于人类动力学记忆模型的时间间隔分布的正确性提出质疑.  相似文献   

8.
报道一个实时在线答疑教学系统的定量动力学模型.通过对此模型的分析,研究同步式答疑教学在远程教育中的可行性.可以预期这个模型的进一步修正和完备,将展示更加丰富的复杂行为。  相似文献   

9.
本文阐述了分形分布的定义,给出了分形分布的性质,并对中国股票市场收益率分布进行了分布拟合与检验,结果表明沪深两市的收益分布均不是正态分布,而是具有典型的尖峰厚尾特性.同传统的正态分布相比,分形分布能够较好地刻画金融市场的实际特征.  相似文献   

10.
人类行为、复杂网络及信息挖掘的统计物理研究   总被引:3,自引:2,他引:1       下载免费PDF全文
通过实证统计与理论模型分析相结合对复杂系统进行研究是一种全新的认识和探索.建议从人类行为的统计特性、复杂网络同步与复杂神经网络、信息挖掘与复杂网络链路预测3个方面,基于大量的实证统计和分析,结合有效的动力学模型,针对人类自身行为的规律特性、社会个体之间的相互作用、神经系统的动力学演化、信息的有效推荐和网络演化的有效预测等重要问题,运用统计物理理论进行全方位的探索,深入挖掘各种决定复杂系统演化过程的基本机制与规律.  相似文献   

11.
通过实验设计,由受测者在指定的电子商务网站上购买指定的商品,并对购物全过程进行录像;采集用户网络购物效率的指标,应用信息熵对商品名称复杂度进行衡量,研究商品名称信息熵对用户网络购物时输入关键词时间、输入关键词数量、购物时间、重新搜索次数、搜索结果排序和浏览商品的数量的影响;进而,通过问卷调查,研究用户感知商品名称复杂度、商品熟悉度以及输入商品关键词难易度对以上用户网购效率指标的影响;最后,对商品名称的定义提出了改进建议.  相似文献   

12.
在线评级系统由于水军和恶意打分者的存在而无法对物品给出客观评价,因此,建立一个基于打分行为的声誉度量模型对于在线评级系统的健康发展至关重要。现有的用户声誉度量方法仅依靠用户评分和商品质量之间的差异进行计算,忽略了用户的行为模式。将用户的评分偏差和行为模式相结合,提出了一种新的声誉度量方法,该方法不仅考虑了用户打分频率的极值,还考虑了用户打分总次数。在两个实证数据集上的实验结果表明,新方法对随机打分的识别准确率相较于经典算法最高可以提高17%,对于解决冷启动和鲁棒性问题具有更好的表现。  相似文献   

13.
在分析网络水军灌水行为的基础上,提出一种网络论坛水军账号快速检测算法.该算法包含3步:首先通过统计分析网络论坛单日回帖情况,确定可疑区间;然后根据用户单日回复行为构建用户协作网络,并依据删减后的用户协作网络的聚类情况确定高可疑时段;最后通过高可疑用户的回帖时间特征分析判定其是否为网络水军.该算法采用"层层逼近"的策略,分3次排除正常用户和数据,不断缩小计算范围,具有计算量小、计算速度快的特点.利用该算法对"新浪网-娱乐论坛-影视世界版块-影行天下子版块"2010年全年的数据进行分析,实验结果表明,该算法不仅能有效发现网络论坛的单个水军账号,还能发现网络水军军团账号并确定炒作内容,准确率高.  相似文献   

14.
网络上的话题纷杂多样而人们的注意力有限,势必导致多话题之间竞争稀缺的用户注意力资源,这种竞争关系影响了网络话题的传播和舆情的形成。已有的研究大多只针对单一话题的传播,该文研究了在线社会网络上多话题竞争的传播规律,提出多话题传播竞争特性的测量方法。从话题和用户这2个层面设计了话题竞争的资源数变化规律、话题竞争激烈程度、用户注意力的转移规律及话题相关性等的测量方法,提出了话题资源数波动率、话题竞争激烈度和用户注意力转移率等定量测量指标。通过对新浪微博真实数据的测量发现:多话题竞争中用户资源总数基本稳定,用户的注意力大部分是从老话题转移到新出现的话题且发生在同类话题间。这些测量结果为建立多话题传播模型提供了基础。  相似文献   

15.
在联机签名校验中,动态时间规正(DTW)方法是一种常用的校验算法,在非线性时间对齐的基础上给出两个签名间的距离并进行判决,这样做经验的成份较多,缺乏统计基础。该文提出了签名的特征点统计模型,利用DTW算法在序列匹配的基础上从签名中提取到多个特征点,将每个特征点的变化情况描述为多维统计特征的概率分布,在所有特征点具有同样协方差分布的假定下得到具体的概率分布参数。按照此模型推导出了在最小风险准则下对签名进行真伪判决的判决准则。采用此方法对一个公共的签名样本库进行了真伪校验测试,得到了4.41%的等误率。  相似文献   

16.
针对目前网络教学视频内容质量评价以主观方法为主,缺乏客观的质量界定标准的问题,提出一种基于用户观看行为的网络教学视频质量评价方法.该方法首先采集单个用户观看某个网络教学视频的行为数据,并对数据进行标准化处理;然后根据视频质量评价标准,实现数据标签化;再通过全连接神经网络,利用Softmax划分单个用户对网络教学视频内容质量的分类;最后,将所有用户观看该视频的分类加权平均后得到对该视频的综合评价.测试结果表明,该模型评价教学视频的准确率为79.5%,分类效果明显,具有较高的实用价值.  相似文献   

17.
为了从在线社会网络中识别关键用户,并对用户的关键性进行量化排序,提出URRank算法,通过模拟人类社会的投票行为,综合考虑用户自身的活跃度和用户间的关注与互动关系,经过迭代计算,量化用户的关键性.以新浪微博的部分抓取数据为例,通过比较现有几种关键用户排序算法发现,URRank算法能够避免其他算法存在的被欺骗及片面性问题,识别出具有高认知度和高覆盖度的关键用户.  相似文献   

18.
在线评分系统中的恶意或随机打分为准确评价在线用户声誉带来了极大的挑战.对3种基于迭代的经典在线用户声誉评价算法的鲁棒性进行了细致研究.实验先将不同数量用户打分随机化,再以均方根误差为指标衡量其余用户声誉值受影响程度.实验共在3个数据集中进行,在MovieLens和Netflix两个经典实证数据集上的实验结果表明:系统中1%~60%的用户进行随机打分时,基于关联分析的CR算法始终保持很好的鲁棒性;基于打分迭代的IARR算法的均方根误差略有增大,最大值达到0.22,但整体波动较小;而改进的基于打分迭代的IARR2算法的均方根误差最大值达到0.695,其鲁棒性的较大波动是因算法受高声誉用户的影响较大.在Douban数据集上的结果表明:在打分数据稀疏情况下,CR算法也能保持很好的鲁棒性.  相似文献   

19.
针对现有搜索行为分析方法只能分析单一类型搜索行为,无法有效获取用户兴趣的问题,提出多种搜索行为联合分析方法.通过使用M5模型对页面停留时间、鼠标点击次数、页面重访问次数及滑块移动次数4种类型的用户行为进行联合分析,从多个角度获取用户行为信息用于分析用户兴趣,并实现了对多种搜索行为构成的高维数据进行联合分析,同时满足了在线行为分析中对结果计算的实时性要求.实验表明该方法可以提供比Belkin方法更高的行为分析质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号