首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
本文提出一种基于ARMA(Auto-Regressive and Moving Average Model)最优模型选择的流量预测方法。该方法建立流量序列对应的ARMA模型集,利用OPTICS和K-Means两种聚类算法对序列分类。通过对基于模型集的最佳预测结果和序列分类的分析,建立序列分类与模型之间的对应关系,并利用对应关系选择针对序列类型的最优模型预测。实验表明该方法预测结果具有良好的精确度和稳定性。  相似文献   

2.
Web流量预测一直是数据中心网络的热点问题,对于提高网络服务质量具有重要意义。由于Web流量具有非线性、自相关性和周期性等复杂特点,对其准确预测有很大的挑战性。为充分挖掘出Web流量的可预测信息,同时使预测模型具有充分的可解释性和可配置性,本文提出一种基于Prophet和深度自回归(DeepAR)的组合预测模型。其中,Prophet是基于时序分解的加性模型,对Web流量的趋势、季节性周期、节假日信息进行建模。同时,使用基于概率预测的DeepAR模型对Prophet残差隐含的自回归信息建模,捕获长短期依赖关系,以减低Prophet残差的方差,并充分捕获Web流量的自回归信息。在真实的Web流量数据集上进行验证实验,结果表明在RMSE和MAE两项评价指标上均优于对比模型,验证了该组合模型的有效性。  相似文献   

3.
针对M IT L inco ln L ab数据集评测方法中背景超文本传输协议(hypertex t transfer protoco l,HTTP)流量在用户建模和流量模拟时会造成偏差,提出了一种基于用户轮廓的W eb流量模拟方法。该方法在应用层进行数据采集并对用户行为特征进行建模生成用户轮廓知识库,模拟时可根据不同网络环境特征扩展生成虚拟用户轮廓。实验分析表明,该方法能同时兼顾流量模拟的扩展性和真实性,生成的数据集流量特征与实际网络相吻合,用于入侵检测系统评测时能有效降低误报率指标。  相似文献   

4.
针对 Web应用挖掘中聚类算法中的问题 ,提出加权 Web访问模式聚类算法 .该算法利用服务器日志库中保存的网页访问次数信息 ,提高了聚类的客观性和准确性 .  相似文献   

5.
通过处理和研究Web日志,得到多数用户感兴趣的页面URL和具有相近访问爱好的用户群体,对站点的结构是否适合用户作出判断并进行相应的调整,从而实现对用户的个性化服务.  相似文献   

6.
在分析Web内容挖掘特征的基础上,提出一种基于XML技术的Web内容挖掘模型.利用HITS算法确定权威Web页面,利用HTMLTidy工具将非XML文件经过数据清洗后转换成结构良好的XMI。文档,结合互联网上传统科技论文的自动抽取系统实例,采用文本聚类分类技术进行面向XML文档数据的数据挖掘.实验结果表明,该模型工作良好,可以自动、有效地提取网页内容.  相似文献   

7.
分析了用户访问Web站点的浏览日志,度量用户的浏览行为.实验从实际获得的Web日志着手,进行Web日志的挖掘,提取用户浏览Web的行为特性数据.通过时间阈值进行会话的划分,选取合适的数据预处理,归一化后生成数据模式向量,引入人工神经网络中的自组织特征映射(SOM)模型,对用户访问倾向聚类,对用户浏览的偏爱度进行度量,为Web站点的进化提供依据.  相似文献   

8.
将改进的蚁群聚类算法应用于Web使用挖掘中,可对Web事务进行聚类,以便了解Web用户的兴趣以及它们之间的联系,从而为用户提供个性化的服务。同时定义一个Web会话为一个带权值的多维向量,也定义了两个会话间的相似度度量。实验表明在广西大学网站抽取的会话数据集上执行蚁群聚类算法得到的聚类是稳定的。结果显示该算法执行得很好,能找到没有噪音的聚类。  相似文献   

9.
基于Web内容挖掘技术的应用研究   总被引:1,自引:0,他引:1  
针对不同类型的Web内容数据,提供了相应的挖掘技术,使用户能快速、高效地获取具有价值的情报信息,并对Web内容挖掘的技术发展、应用趋势做出了分析。  相似文献   

10.
阐述了基于浏览器/Web服务器/数据库服务器三层结构的应用是当前信息系统应用的主要模式,而Web服务器和数据库服务器之间的连接是其关键技术,并对CGI、Web API、RAD和Java/JDBC 4种连接方法进行了重点介绍。  相似文献   

11.
文章深入分析了远程数据库的访问,指出了传统访问方法的不足:客户端代码依赖于远程数据库的实现细节、容易受到防火墙阻挡及结果文档不适合自动处理。针对这些不足,给出了一种基于XML的远程数据库访问方法。最后给出一个实例,并对这一方法进行了简单的实现。实验结果表明:该方法具有良好的适应性和扩展性。  相似文献   

12.
为了便于用户浏览网页信息,基于全置信度关联分析,提出了一种网页层次聚类的方法。该方法采用向量空间模型表示网页文档,将文档看成事务,文档的词汇视为事务中的项,根据关联挖掘算法发现文档之间的强关联规则产生基本类,然后利用图划分的算法完成网页文档的层次聚类。在关联规则产生过程中采用全置信度量发现强关联模式,规则的产生不受支持度阈值设置的影响,即使支持度闽值设置为零,也能发现强关联模式,有效地消除了弱相关的交叉支持模式。  相似文献   

13.
基于NT的Web服务器的安全问题及策略   总被引:1,自引:1,他引:0  
文章从NT系统存在的漏洞、黑客的入侵方式和入侵检测三个方面深入分析了基于NT系统的Web服务器的安全 问题,并提出了可行的解决办法.  相似文献   

14.
为提升交通流预测精度,深层次地挖掘交通流数据的时空特征,提出一种基于双向长短时记忆网络(Bi-LSTM)的城市交通网格集群流量预测模型。将所获得的网约车轨迹数据集网格化;考虑人为确定集群个数对结果的影响,用贝叶斯信息准则进行参数估计确定集群数,利用高斯混合模型对交通状况相似的网格进行聚类得到不同交通网格集群;利用集群内部交通网格的输入时间序列的相互影响设计多对多模型,构建Bi-LSTM模型预测不相交集群上的流量;以经典多元线性回归模型(MLRA)作为对照组进行实验验证,采用平均绝对误差(MAE)、均方根误差(RMSE)、平均绝对百分比误差(MAPE)和动态时间规整(DTW)这四类评价指标对预测结果进行综合评价,验证基于Bi-LSTM模型的城市交通网格集群流量预测的可行性。实验结果表明:MLRA模型和Bi-LSTM模型对城市交通网格集群流量的预测值小于真实值,早高峰时段尤为明显;各交通网格集群的交通状态态势相似,集群的簇内相关性较强,两类模型均可实现较好的流量预测效果,Bi-LSTM表现更优; MLRA和Bi-LSTM预测模型的精度MAE、RMSE、MAPE分别为3.2011、4.4009、0.3187,3.0687、4.2943、0.3045,Bi-LSTM与MLRA相比,模型精度分别提高了4.14%、2.40%、4.46%,说明所构建的Bi-LSTM交通流网格集群流量预测精度高、误差低,要优于MLRA模型,表现出较好的泛化性能; MLRA和Bi-LSTM的DTW结果分别为52938.6356、54815.1055,构建的Bi-LSTM模型较MLRA模型各自工作日和节假日时间序列相似性DTW结果提高3.42%,表现出更好的鲁棒性。利用城市交通流量的特点和交通轨迹数据网格化的优点,基于Bi-LSTM模型的城市交通网格集群流量预测与MLRA交通流量预测模型相比,具有精度高、误差低的特点。同时,DTW指标方面,基于Bi-LSTM对城市交通网格集群流量模型与真实流量变化趋势一致,表现出较好的鲁棒性。  相似文献   

15.
为提高分布式非结构化对等网络中Web服务发现的效率和稳定性,设计了一种以Web服务提供者的服务内容为评价依据的对等联盟演化机制.根据该机制,服务提供者依据各自提供的Web服务内容之间的相似程度,自发形成联盟.每个提供者维护的同盟表用来保存部分盟友列表,从全局形成服务联盟.服务提供者根据盟友关系将Web服务的描述信息发布...  相似文献   

16.
针对传统单纯聚类算法实现网页推荐精确度欠缺的问题, 提出一种基于Web日志挖掘的个性化网页推荐模型, 并实现了相应的网页推荐算法, 算法结合聚类分析和关联规则挖掘, 能有效实现网页推荐. 实验结果表明, 在保障网页页面推荐覆盖率的条件下, 该方法有较高的精确度、 有效性和实用性.  相似文献   

17.
A new method for Web users fuzzy clustering based on analysis of user interest characteristic is proposed in this article. The method first defines page fuzzy categories according to the links on the index page of the site. then computes fuzzy degree of cross page through aggregating on data of Web tog. After that, by using fuzzy comprehensive evaluation method, the method constructs user interest vectors according to page viewing times and frequency of hits. and derives the fuzzy similarity matrix from the interest vectors for the Web users. Finally. it gets the clustering result through the fuzzy clustering method. The experimental results show the effectiveness of the method.  相似文献   

18.
现场监控是自动控制中非常重要的一级,一般的监控方式无非是使用通信线缆或者现场总线把信息传送给控制室或者执行机构.随着工业以太网在控制网络中的运用,通过Web进行控制已经成为可能,而且可以和办公自动化系统无缝连接,实现工业现场-控制台-办公室的统一信息结构.本文对基于嵌入式Web进行现场监控系统的开发进行了讨论.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号