首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
何庆  龚静 《科技资讯》2014,(33):11-12
在移动互联网迅猛发展的时代,电信运营商对用户上网日志等非结构化数据的处理、分析和挖掘变得尤为重要,传统的基于小型机和关系型数据库的数据处理系统已经无法满足海量非结构化数据的及时处理需求,相对传统做法,搭建X86集群、利用云计算技术对海量非结构化数据进行处理,具有高效、低成本、易扩展等方面的巨大优势。另外,用户上网日志中包含着大量的个性化信息,如何充分挖掘和分析这些信息,对电信运营商在移动互联时代实现精细化运营至关重要。该论文主要以用户WAP日志为例,详细阐述如何利用云计算技术处理海量的非结构化数据,进而去挖掘和分析用户上网行为。  相似文献   

2.
基于日志分析的用户搜索行为研究   总被引:1,自引:0,他引:1  
用户行为分析是改进搜索引擎的重要依据,为了更好地理解中文搜索用户的检索行为,在引入分词的基础上对搜狗搜索引擎在一个月内的真实查询日志进行了分析,对查询语言、查询长度、rank和网页深度与点击次数四个方面的用户行为进行分析。所得结论对改进中文搜索引擎的设计和更准确地评测检索效果都有较好的指导意义。  相似文献   

3.
深入研究信任管理和行为信任的模型及方法,设计基于贝叶斯网络的信任预测和控制算法,综合利用聚类和分布密度函数设置算法参数,建立可量化的证据与信任等级之间的对应关系,算法可预测多属性下的行为信任等级.深入IIS和.Net底层实现可配置的信任管理插件,形成用户行为日志,为预测和控制算法提供证据, 免除了一般Web日志的清洗工作.实验数据表明算法的应用提高了服务器各项性能,并约束了用户的商业行为.  相似文献   

4.
提出一种用户性格预测与群体画像方法。该方法将数据挖掘、机器学习和画像技术相结合,首先改进了传统TF-IDF算法没有考虑文章结构的问题,提高网页主题挖掘的准确率;其次根据大五类性格构建"性格-主题-关键词"(PTK)模型,归结不同用户的兴趣属性特征和性格属性特征,并结合用户的基础属性对用户进行综合画像;然后运用K-means方法将拥有相同属性特征的人群进行聚类,描绘在社会中拥有相似特征人群的群体面貌;最后通过实验证明,该方法使用改进的TF-IDF方法对网页文本进行挖掘效果要优于LDA主题模型,而且可以有效对用户的性格进行预测与群体画像。  相似文献   

5.
针对当前用户画像工作中各模态信息不能被充分利用的问题,提出一种跨模态学习思想,设计一种基于多模态融合的用户画像模型。首先利用Stacking集成方法,融合多种跨模态学习联合表示网络,对相应的模型组合进行学习,然后引入注意力机制,使得模型能够学习不同模态的表示对预测结果的贡献差异性。改进后的模型具有精心设计的网络结构和目标函数,能够生成一个由特征级融合和决策级融合组成的联合特征表示,从而可以合并不同模态的相关特征。在真实数据集上的实验结果表明,所提模型优于当前最好的基线方法。  相似文献   

6.
基于国内某大型期刊数据库的用户查询日志, 探讨了高校用户使用学术期刊数据库的基本行为特征, 包括用户访问时间分布、使用特殊检索的比例、检索词的长度分布等。分析了不同类型高校用户的检索策略, 结果显示: 不同类型(理工类、师范类、农林类和医学类)高校用户的检索策略存在相应差异; 但不同办学层次(“985”高校、“211”高校等)高校用户的检索策略相差不大。最后, 通过IP数据的地址判断, 提取了高校用户的性别、专业和学历等人口统计学变量, 分析了这些变量对用户检索行为的影响, 提出高校用户检索策略的影响因素模型。  相似文献   

7.
针对学生学习质量持续跟踪并支持个性化评价问题,文章研究基于用户画像技术的评价方法.从技术角度出发,主要讨论了用户画像数据的采集、数据的处理、画像模型的构建等技术,在此基础上讨论了学生学习趋势的预测应用.综合利用多源异构数据,对学生用户进行个性化建模,实现了数据驱动的学习质量评价,因此,本研究对提高学生学习质量具有一定的实用价值.  相似文献   

8.
本文叙述了如何编写程序和设置网络以适应不同类型上机的需要.  相似文献   

9.
随着我国旅游业发展和人们对旅游服务需求的不断增多,旅游景点的精准推荐不仅可以节约用户大量的时间,还能够提升用户的消费体验,为此本文提出一种基于情境聚类扩展用户画像的旅游景点推荐方法。基于用户情境数据进行情境聚类,构建出扩展的用户画像模型;根据群体用户画像反映的用户特征,结合情境标签设置个体用户情境特征属性,再融合关联规则和相似度计算为用户推荐个性化的景点。实验结果表明,相较于传统的关联规则Apriori推荐算法或加权Apriori推荐算法,基于情境聚类扩展用户画像的旅游景点推荐方法具有更优的推荐结果。  相似文献   

10.
根据1999年《中国Internet发展状况统计报告》,我国拨号上网的计算机有63万台,占上网计算机总数的84.7%.我国拨号上网的用户数有149万,占上网用户总数的71.0%.我国每月上网时间5~20小时的用户占上网用户总数的31%,每月上网时间20~40小时的用户占上网用户总数的29%,每月上网时间40小时以上的用户占上网用户总数的36%.我国在家中上网的用户占上网用户总数的44%.因此,1999年3月信息产业部对邮电资费进行的调整在社会上掀起了较大的波澜,社会各界对此反响强烈,引起了许多ISP、ICP和网民的激烈讨论.浙江省是上网用户数最多的省市之一,仅次于北京、广东、江苏而位居全国第四,拨号上网的用户数约有5.5万.本文从杭州市的现行收费情况出发,分析了拨号上网的计费模型,提出了拨号上网用户选择合适的上网模型的方法.  相似文献   

11.
该发明提出了基于浏览器的用户行为采集方法,所述方法包括:在用户经由前端浏览器触发预先确定的目标监测事件时,采集所触发的目标监测事件的信息;构造异步请求,并经由所述前端浏览器将所述异步请求发送至后端服务器,其中,所述异步请求包含所采集的目标监测事件的信息;所述后端服务器在接收到所述异步请求后记录所采集的目标监测事件的信息,用于后续的统计和分析。该发明所公开的基于浏览器的用户行为采集方法能够完整地获取前端的用户行为轨迹。  相似文献   

12.
用户成长值反映用户粘性,预测用户成长值有助于实现精准营销。聚焦用户成长性画像研究,针对用户原始数据记录复杂多样、难以提取有效特征的问题,通过散点图分析挖掘影响用户成长值的因素,提取行为特征和相对稳定的时间特征,并对比基于树的特征筛选算法和L1范数进行特征筛选。针对已标注成长值的用户数据不足问题,改进COREG算法,通过半监督学习模型丰富训练数据,提高模型的预测准确度,同时降低原算法的时间复杂度,最后采用模型融合整合不同模型的优势。在CSDN博客平台提供的SMP CUP 2017数据集上进行实验,结果表明,建立的模型有效地提高了泛化能力和预测准确度。  相似文献   

13.
14.
PageRank算法根据网络链接来计算网页的重要度,虽成功用于网页搜索,但仍存在着许多不足,如网页垃圾、无效链接等,不能很好地描述用户真实行为等问题.通过对成千上万网络用户真实行为数据的分析,提出了以半马尔科夫过程来模拟用户浏览行为,将其平稳概率分布作为页面重要度计算的测量方法.同时考虑网页内容和长度对停留时间的影响,结合传统链接分析法,使新网页被重视,旧网页能得到恰当的排名.实验结果证明,该方法比PageRank算法的查询结果满意度提高约24%,能更好的计算网页页面的重要度.  相似文献   

15.
身份认证技术是电子商务系统的重要环节。本文根据电子商务系统用户的特点,将网络入侵检测技术的思想引入用户身份验证,提出了基于用户行为模型的身份验证方案。该方案选择用户消费习惯、用户浏览时间以及用户键盘输入特性作为数据源,根据综合验证算法计算值与阈值对照,对用户身份进行验证。本文全面阐述了该身份验证方案的基本思想、测量点的选择和取值、以及综合验证算法等关键问题和解决方案;重点介绍了基于AHP方法的用户消费习惯模型的建立过程,以及利用该模型计算某种商品和用户期望值向量的相似度算法。  相似文献   

16.
现有的智能电视操作系统(TVOS)资源分配多依赖于操作系统本身对任务的资源分配方案,而系统对任务的调度是尽力而为(best-effort)的,以最大化系统的吞吐量为目的,这种资源调度分配方案在实时或多媒体应用系统存在不能保障应用的服务质量(QoS).为此,在研究TVOS用户行为模型的基础上,量化了用户对应用的偏好,并结合应用QoS模型提出了两种资源分配算法RA_DP和RA_PLSH.实验结果表明,基于动态规划的RA_DP算法能够求出问题的最优解,可作为算法间比较的参考,但算法时间复杂度很高;基于资源定价的局部搜索启发式RA_PLSH算法可在短时间内求出问题的近似最优解,与其他启发式算法相比更适合于智能电视资源的实时分配.  相似文献   

17.
栗波  余志 《科学技术与工程》2021,21(20):8670-8679
在学校、医院、商场等公共生活服务场所周边路段上经常发生的交通拥堵具有特殊性:是由特定事件触发特定出行者短时间扎堆聚集所导致的一种特殊类型的交通拥堵,这类拥堵的成因及治理对策具有重要的研究价值.利用自动车辆识别(automatic vehicle identification,AVI)技术对出行者的长、短期交通行为进行重构,探究导致公共生活服务场所周边路段的拥堵原因及拥堵责任划分方法.基于AVI数据建立了个体长、短期交通行为画像方法,通过多层卷积神经网络和层级聚类模型精确定位出导致公共生活服务场所周围路段拥堵的主要责任车辆.针对同一路段上的不同车辆,依据其长、短期出行行为特征,进行个性化精准管理,是在有限资源限制条件下解决公共生活服务场所周边拥堵问题的有效途径.选取安徽宣城市第六中学门前的常发路段拥堵作为研究对象.结果 表明:对于经过案例学校门前路段的所有出行者来说,只需对其中0.5%~0.7%的致堵车辆采取重点管理措施就可以有效缓解学校门前路段的拥堵问题.  相似文献   

18.
网络行为识别一直是网络安全中的研究热点,随着网络中数据量的海量增大以及数据的非线性等问题的影响,对于网络行为识别的特征提取和识别技术提出更高的要求。文章提出了一种基于堆叠自动编码器的网络行为识别方法,该方法通过构建堆叠自动编码器和SOFTMAX分类器的深度学习框架,结合无监督的预训练和有监督的全局微调,优化堆叠自动编码器的特征提取性能,实现了网络行为特征的深度提取,从而对高校流量数据中上网行为进行分析识别。  相似文献   

19.
用户画像是一个人的虚拟表示,它是基于一系列数据的模型.基于手机感知数据从年龄、性别和人格特征三方面构建用户画像.通过使用手机中的传感器和事件监听器来采集滑屏解锁场景、手机基本信息、应用程序使用情况和屏幕状态场景中的数据.此外,随机森林回归和随机森林分类模型分别用于估计年龄和检测用户的性别.支持向量回归机(support vector regression,SVR)算法用于识别人格特征.通过84个用户进行实验来评估该模型.实验结果表明,我们的方法在年龄估计中的均方根误差为4. 369,在性别检测中实现了91. 70%的精度.对于人格特征的识别,开放性、尽责性、外倾性,宜人性和神经质的均方根误差分别为0. 290、0. 351、0. 465、0. 302和0. 452.  相似文献   

20.
分析了用户访问Web站点的浏览日志,度量用户的浏览行为.实验从实际获得的Web日志着手,进行Web日志的挖掘,提取用户浏览Web的行为特性数据.通过时间阈值进行会话的划分,选取合适的数据预处理,归一化后生成数据模式向量,引入人工神经网络中的自组织特征映射(SOM)模型,对用户访问倾向聚类,对用户浏览的偏爱度进行度量,为Web站点的进化提供依据.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号