首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
Web上的信息量正以惊人的速度增加,人们迫切需要能自动地从Web上发现、抽取和过滤信息的工具,即如何从数以亿计的页面中发现需要的内容、如何从大量的访问中发现固有的模式和关联.马尔科夫模型的网页浏览预测,仅仅从用户的浏览网页本身出发,预测用户的下一步链接,并不能捕获到用户的真正兴趣.本文提出基于隐马尔科夫模型的网页浏览路径预测,并将其与基于马尔科夫模型的方法进行对比.根据已知的浏览序列判断用户的类别,当浏览序列长度很短时,本文方法的预测准确性比马尔科夫模型低.这是由于序列长度过短,系统获取判断的信息少,增加了对用户错误分类的可能性.随着浏览序列长度逐渐增加.系统捕获的用户浏览信息越来越多,进而能够折射出用户的兴趣所在.预测准确率也逐步增加.当浏览序列长度大于或等于8时,预测准确率已经到达80%.提高了浏览兴趣预测的准确率.  相似文献   

2.
受移动设备内存空间和处理器性能的限制,传统的链接预测方法(如传统马尔科夫方法)不再适于移动设备浏览导航。本文以马尔科夫模型为基础,提出基于马尔科夫链和频繁项挖掘相结合的移动设备链接预测模型。将扇形交互界面的思路引入链接预测领域,有效缩小了用户的视觉搜索时间,提高了模型交互效率。移动设备上的实验结果表明,本文提出的预测模型在保证高覆盖率和低复杂度的同时,可以达到较高的预测准确率和预测效率。  相似文献   

3.
对用户的Web浏览行为进行分析,既可以使用户减少等待时间,同时也能减轻网络负载.依据Web网站的层次结构特点,首先设计了基于Hash表的反向索引结构来提高数据的预处理速度;在此基础上,利用分层思想构建了基于马尔科夫模型和贝叶斯定理的Web用户浏览行为预测模型.给出了模型的设计思想、相关定义、模型框架以及模型中所涉及的关键构建方法等.最后,对模型进行了实验分析,结果表明在适当的预测准确率前提下,模型能够有效减少在预测时所需的候选网页数量,并大幅提升预测效率.  相似文献   

4.
在电子商务环境下,提出一种基于Web日志抽取用户兴趣模式的混合挖掘模型MMA(mixed mining algorithm),该模型克服了单纯挖掘浏览模式或关联规则的不足,综合考虑用户的浏览和购买行为,能够有效捕获用户兴趣,获得潜在的商机,并为用户提供个性化的服务.  相似文献   

5.
吴泓润  许斐  李申展 《科技信息》2011,(19):I0101-I0102
针对现有用户兴趣模型在模型建立和更新阶段的缺陷,文章设计了一种基于用户浏览内容和浏览行为的隐式自反馈用户兴趣模型。采用短期和长期兴趣来建立和表达用户兴趣,并采用基于时间窗口机制来更新短期兴趣,时间遗忘机制来更新长期兴趣。同时发现用户的关联兴趣,克服单集模式下的不足,更加全面的反映用户的多方面兴趣。  相似文献   

6.
PageRank算法根据网络链接来计算网页的重要度,虽成功用于网页搜索,但仍存在着许多不足,如网页垃圾、无效链接等,不能很好地描述用户真实行为等问题.通过对成千上万网络用户真实行为数据的分析,提出了以半马尔科夫过程来模拟用户浏览行为,将其平稳概率分布作为页面重要度计算的测量方法.同时考虑网页内容和长度对停留时间的影响,结合传统链接分析法,使新网页被重视,旧网页能得到恰当的排名.实验结果证明,该方法比PageRank算法的查询结果满意度提高约24%,能更好的计算网页页面的重要度.  相似文献   

7.
建立了一个时间序列预测模型。以三次指数平滑模型为基本预测模型,并基于马尔科夫链定义了误差修正模型--条件马尔科夫链。条件马尔科夫链的特点在于将传统马尔科夫链中的一步状态转移概率矩阵变成条件一步状态转移概率矩阵,即在条件马尔科夫链的状态转移概率矩阵中,每个元素的意义为:在已知t-1时刻的状态下,t时刻的状态转向t+1时刻状态的概率:即P{(E_t→E_(t+1))/E_(t-1)}。在文章中以新疆货运量为实验对象,通过对新疆货运量这一指标用三次指数平滑模型,用三次指数平滑模型结合马尔科夫链和三次指数平滑模型结合条件马尔科夫链三个模型进行预测,结果显示,经过条件马尔科夫链修正后的预测结果误差最小,证明文中模型可以有效提高预测精度。  相似文献   

8.
一种考虑用户兴趣转移特征的协同预测模型   总被引:1,自引:0,他引:1  
大多数预测模型使用用户属性或社交关系信息来优化预测结果,然而真实系统中用户的属性或社交关系信息往往很难获得,或者取得的是虚假信息,从而导致用户行为表达不准确或模型不具有普适性.另外,几乎所有使用用户特征的模型仅考虑用户兴趣本身的度量,而忽视兴趣的变化这一重要特征.因此,本文提出一种考虑用户兴趣转移特征的协同预测模型.该模型根据用户连续行为序列构建用户兴趣转移特征和用户行为演变网络,利用用户兴趣转移特征计算用户相似性,进而搜索最近邻集合,利用用户行为演变网络筛选候选集,最后设计最频繁项提取算法来产生预测结果,从而构建用户行为的预测模型.在真实的新闻浏览日志、交互式网络电视视频访问日志和微软服务器日志上的实验表明该预测模型是有效的.  相似文献   

9.
为了分析网络用户的浏览行为特征,实现科学平台的网络个性化服务,用广义频繁子序列挖掘算法,该算法挖掘Web服务器日志中的用户浏览路径,设计科学平台用户的浏览模式,为用户提供主动式信息服务.经过对日志文件的预处理,得到用户会话文件,然后采用广义频繁子序列挖掘算法对用户浏览模式进行识别.实际应用表明,这种广义频繁子序列识别方法能够有效地发现用户的兴趣所在,从而更好地为用户在线浏览提供帮助.  相似文献   

10.
个性化推荐系统中,设计用户的兴趣模型是一个关键问题.通过分析web环境下用户的特点和浏览行为,提出了一种新的基于向量空间模型的混合模型,并根据用户对页面的访问次数,浏览速度和驻留时间来更新模型.模型便于实现,且更新及时,简单.  相似文献   

11.
基于FLAAT模糊的WEB挖掘算法   总被引:1,自引:0,他引:1  
为了挖掘出较完全的兴趣模式,提出一种新的结构类型——FLAAT,它可发现那些被忽略的用户浏览偏爱路径。同时引进模糊集来处理停留在网页上的时间,以形成语义术语使挖掘出的用户浏览偏爱路径更自然、更易理解。实验表明,该算法能准确地反映用户的浏览兴趣,且系统的可扩展性较好。  相似文献   

12.
为了更加准确地预测共享单车的需求量,制定合理的调度优化方案。针对共享单车骑行数据的周期性、非线性和随机性的特点,提出了季节性灰色Markov模型来预测共享单车需求量。在此基础上,根据双层规划模型结果来制定调度优化方案。在季节性灰色Markov模型中,首先将原始数据带入季节性GM(1,1)模型得到预测结果,然后用Markov模型对预测的残差进行修正,得到最终的预测值。在双层规划模型中,上层目标为运营商的调度成本,下层目标为调度中心的调度时间,双层规划模型用GUROBI求解器求解。最后将两种模型应用于纽约市17个Citi Bike共享单车站点的算例分析。数值计算结果表明:季节性灰色Markov模型在17个站点从周一到周五的需求量预测的平均绝对百分比误差(mean absolute percentage error,MAPE)为10.68%,预测精度较高。利用双层规划模型制定的调度优化方案能确定调度中心数量、位置,调度范围和调度路径,可以在满足用户需求的同时使调度成本和调度时间最优。研究提出的需求预测模型和调度优化方案可以为共享单车运营部门和交通管理部门提供有效的参考。  相似文献   

13.
一种高效的个性化中文分词词典   总被引:1,自引:0,他引:1  
Web个性化服务的核心技术之一是准确描述用户兴趣的用户模型,通过用户行为来挖掘用户兴趣是这一领域研究的重要手段.该文为了对Web个性化服务中用户浏览文档进行分析研究,采用了一种新型的个性化分词词典,通过实验证明是切实可行的,并且极大提高了系统的效率.  相似文献   

14.
在线机票预订网站上的用户查询量变化是真实的民航市场需求变化的反映.通过对机票查询数据进行分析,可以准确地预测航班需求,以利于民航业做出快速的市场反应.提出了一种基于深度时空卷积神经网络的民航需求预测模型(DSTCN-FRP),将用户查询量时间序列数据转换成航线网格图,设计多层卷积神经网络来捕捉用户需求与查询数据之间的时间和空间依赖,同时加入节假日等外部因素,最后得到未来一段时间内的民航需求量.在某在线订票网站的真实查询数据集上进行了实验,结果表明:DSTCN-FRP模型优于其他现有的预测方法,其MAE比其他方法降低了15%~50%,RMSE降低了12%~28%.  相似文献   

15.
预取技术通过在用户浏览当前网页的时间内提前取回其将来最有可能请求的网页来减小实际感知的获取网页的时间。传统的Markov链模型是一种简单而有效的预测模型,但同时存在预测准确率偏低、存储复杂度偏高等缺点。提出了访问模式树(APT)算法,证明该法能有效减小存储空间。  相似文献   

16.
基于兴趣相似性的Web用户聚类   总被引:8,自引:0,他引:8  
按照访问兴趣对用户进行聚类分析是Web挖掘的一项重要内容. 在用户访问兴趣度量中综合考虑网页内容和浏览路径因素;在聚类分析中,依据访问兴趣定义提出新的相似度计算方法. 利用传递闭包法对用户进行聚类. 算法可以提高用户聚类的准确性,试验结果验证此算法是有效的.  相似文献   

17.
不同性别的用户对产品的看法与品位存在着差异,特别是在欣赏与时尚相关的产品上,性别对用户判断的影响显得尤为重要。根据电子商务中在线商品的浏览记录,采用支持向量机(support vector machines, SVM)对所选取的7个特征建立模型,并进行性别判断。经过模型分析和训练,准确率可达79.21%。同时讨论了网络购物与实体店购物的区别,并对SVM进行了核函数对比及其它性能的研究,从理论和实际应用上为核函数的选取和SVM的选用提供参考。  相似文献   

18.
We propose an algorithm for learning hierarchical user interest models according to the Web pages users have browsed. In this algorithm, the interests of a user are represented into a tree which is called a user interest tree, the content and the structure of which can change simultaneously to adapt to the changes in a user's interests. This expression represents a user's specific and general interests as a continuurn. In some sense, specific interests correspond to shortterm interests, while general interests correspond to longterm interests. So this representation more really reflects the users' interests. The algorithm can automatically model a us er's multiple interest domains, dynamically generate the in terest models and prune a user interest tree when the number of the nodes in it exceeds given value. Finally, we show the experiment results in a Chinese Web Site.  相似文献   

19.
灰色马尔可夫模型在煤矿安全事故预测中应用   总被引:6,自引:0,他引:6  
灰色马尔可夫模型是将灰色系统理论和马尔可夫链理论相结合建立的预测模型,它不仅充分发挥了灰色预测模型和马尔可夫预测模型的优点,而且,因为马尔可夫链理论的引入,有效地解决了灰色预测模型对于随机波动性较大的数列预测精度低的问题.并且,通过对煤矿千人负伤率预测的实际应用表明,灰色马尔可夫预测模型完全能满足预测精度的要求.  相似文献   

20.
杨建辉  易慧琳 《河南科学》2013,(11):2029-2034
将EMD(经验模式分解)方法应用到股票价格趋势的预测中,找出影响股票市场波动的关键因素,旨在提高预测的精确性。通过EMD方法将上证指数日收盘价数据分解为不同频率的数据段,重组为高频序列、低频序列和趋势序列,运用高阶自回归和GARCH模型对分解出来的各序列进行拟合和预测,避免各个分段预测过程中的误差累积,最后对预测数据重组,得到样本外数据的预测序列。结果表明,该模型具有较好的预测效果,能给投资者提供更为合理的股票投资意见,同时为趋势预测研究提供借鉴。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号