首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 154 毫秒
1.
Web日志挖掘可以发现访问者兴趣和需求, 提出了一种改进的以访问时间、点击次数以及访问路径共同刻画用户的访问兴趣的Web日志挖掘算法. 首先以Web日志为基础构建相关矩阵, 使用平均访问时间相似度和访问路径相似度共同度量用户访问兴趣的相似程度, 最后采用直接聚类去除相交项的聚类算法将相似用户和相关URL聚类. 实证分析结果表明该算法能较好地解释用户的实际访问兴趣, 从而为网站提供相应的运营建议.  相似文献   

2.
高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P-CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果.UCI数据集和计算机合成数据集实验表明:高维数据并行聚类算法P-CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性,是有效可行的.  相似文献   

3.
一种基于自组织特征映射网络的聚类方法   总被引:7,自引:0,他引:7  
针对传统聚类算法不能有效地处理大数据集和高维数据集的问题,提出了一种基于自组织特征映射网络的聚类方法。该方法能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变,而且无需监督,能自动对输入模式进行聚类。给出了应用该方法的具体步骤和加速自组织过程的若干改进方法,通过仿真实验证明该算法的有效性。  相似文献   

4.
为改善大规模Web3D场景的加载效率,提出一种基于DR(Dead reckoning)预测的大规模Web3D场景预加载机制,结合DR航迹预测的算法和基于历史路径的兴趣路径聚类算法,将航迹领域中路径预测和交通领域中路径聚类应用到虚拟场景加载领域中,提出一种Web3D场景的预加载机制。实验与研究表明,通过该算法实现的预加载机制可以显著地提高数据的传输效率,优化大规模Web3D场景的加载速度,有效地提高用户在Web3D场景中的漫游体验,为优化大规模Web3D场景的加载机制提出了新思路。  相似文献   

5.
一种基于会话聚类算法的Web使用挖掘方法   总被引:1,自引:0,他引:1  
Web使用挖掘作为数据挖掘的一个重要任务,有助于了解用户群体的特征,从而为其提供个性化服务.提出了一种基于用户会话聚类的Wei使用挖掘算法.首先,对Web日志预处理采用基于时间窗的用户会话识别方法,提出了一种基于三元组的用户会话表示方法,并在此基础上给出了基于网页语义相似性的会话处理方法,该方法能够在保持用户兴趣不变的情况下有效降低会话维度;其次,提出了一种基于时间及频次的用户会话相似性度量方法;最后,设计了一种两阶段PS-KM会话聚类算法,先用PSO方法进行全局搜索再转入基于K-means方法的局部聚类过程.仿真表明了算法的有效性.  相似文献   

6.
针对非均匀类簇密度聚类问题,从商空间粒度理论出发,提出一种多粒度自学习聚类算法 (multi-granularity self learning clustering algorithm, MSCA)。算法通过构造聚合树结构和定义粒度函数对问题逐层求解,并在每层聚合过程中根据聚合区间以自学习的方式动态确定聚合粒度,解决了传统聚类算法从非均匀类簇密度数据中无法得到不同层次的聚合特征且参数对经验依赖性过高的问题。理论和实验表明,MSCA算法可以发现任意形状类簇,有效处理噪声,并能发现关键聚合层,具有较好的计算复杂性。  相似文献   

7.
一种采用LLE降维和贝叶斯分类的多类标学习算法   总被引:2,自引:0,他引:2  
多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低维特征属性集;然后将多类标样本集按所属的类标进行划分,并采用贝叶斯分类模型来学习各组样本集的分类特性;根据各个分类模型的判定类标,综合得到多类标样本的最终类标集。将该算法分别应用到自然场景图像和基因数据的多类标分类学习中,实验结果表明,该算法针对不同的多类标数据集均能取得很好的分类效果,且相比于其他多类标算法有更高的性能。  相似文献   

8.
一种基于互信息的词聚类算法   总被引:1,自引:0,他引:1  
基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法.传统的统计聚类方法基于贪婪原则,常以语料的似然函数或困惑度(perplexity)作为评价标准.这种传统的聚类方法的主要缺点是聚类速度慢,初值对结果影响大,易陷入局部最优.本文利用互信息定义了一种词相似度,在词相似度的基础上给出了词集合相似度的定义.基于相似度,提出了一种自下而上的分层聚类算法,这种方法不但能改善聚类效果,而且可根据不同的模型选择不同的相似度定义,因而提高聚类的使用效果.实验证明,该算法在计算复杂度和聚类效果上比传统的基于贪婪原则的统计聚类算法都有明显的改进.  相似文献   

9.
采用北京市可变信息板(variable message signs, VMS)系统近三年发布的交通诱导信息数据, 研究了交通诱导信息发布策略的空间关联规则. 首先基于系统聚类算法分析事件点与上游VMS的关联度, 根据其强弱将上游路段的影响空间分级, 并确定不同影响等级空间范围的大小; 然后采用基于关系代数理论的关联规则挖掘算法, 计算位置相邻的VMS集合的支持度和置信度, 确定不同影响等级空间范围内、相邻影响等级空间范围VMS集合的 依存关系. 实证分析表明: 空间关联规则能将事件点上游的影响空间分级, 并确定VMS间的依存关系, 从而锁定诱导信息发布的各级影响 空间以及相应的VMS, 具有实际的应用价值, 将应用于北京市交通诱导信息发布专家辅助决策系统.  相似文献   

10.
工业过程中各类数据间具有一定的相似性,单纯利用K均值算法对其进行故障诊断时,存在很大的错误率.提出一种基于局部线性嵌入(Locally Linear Embedding,LLE)的K均值聚类算法,将正常数据运用LLE算法降维并求出投影矩阵,利用投影矩阵将原始故障数据映射到低维空间,再利用K均值算法对其聚类,建立检测与诊...  相似文献   

11.
侯臣平  易东云  吴翊 《系统仿真学报》2008,20(20):5553-5557
针对虚拟计算环境下Web资源特性的描述问题,提出资源空间模型,采用流形学习的方法提取Web资源特征.首先根据资源空间模型,有效地将Web资源抽象为高维空间中的数据集;然后,采用流形学习中的最大差异延展算法.此方法不仅能有效地提取Web资源的特征,而且能够挖掘隐含在Web资源内部的本征信息;此时,描述Web资源特征的数据位于低维空间,有利于资源的进一步处理.基于最大差异延展算法的Web资源描述方法有效地解决了Web资源的描述问题.通过仿真实验证明了此方法的有效性.  相似文献   

12.
Web服务器基于不精确响应的Web服务机制   总被引:1,自引:0,他引:1  
传统Web服务器对于到达的请求使用先来先服务机制.但是,先来先服务机制无法为到达的请求提供区分服务和服务质量保证.在不精确计算和弱.硬实时调度策略基础上,提出了一种Web服务质量机制(简称WQS)为到达Web服务器的请求提供区分服务与服务质量保证.WQS不同于先来先服务机制在于:它首先利用一个请求分类器分类到达的请求到不同级别的队列.其次,借助不精确调度器与内容自适应器,WQS能够使优先级高的队列中请求具有好的响应率和短的响应延迟,使优先级低的队列中请求具有满意的响应率和可接受的响应延迟.最后,本论文描述了一系列在ApacheWeb服务器上针对.WQS的仿真实验,实验表明:WQS是一种能够提供区分服务与服务质量保证,达到改进传统Web服务器或Web服务的可行和有效的方法.  相似文献   

13.
Web日志挖掘技术进展   总被引:14,自引:0,他引:14  
用户访问Internet时,服务器、客户机日志会记录下大量的用户访问信息。通过挖掘这些日志信息所得到的用户访问模式,在个性化信息服务、改进门户站点设计和服务、开展有针对性的电子商务、构建智能化Web站点、提高网站的声誉和效益等方面都将起到重要的作用。概述了Web挖掘的概念、分类及其主要应用领域,详细介绍了Web日志挖掘的主要方法和用户访问模式挖掘算法及国内外最新研究进展。最后提出了Web用户访问信息挖掘研究的发展方向和趋势。  相似文献   

14.
基于Web Services的生物信息集成框架   总被引:1,自引:0,他引:1  
生物信息学是用数理和信息科学的观点、理论和方法去研究生命现象、组织和分析呈现指数增长的生物学数据的一门学科。Web Services是一种面向服务的体系结构,其突出优点是实现了真正意义上的平台独立性和语言独立性。目前生物信息的数据库呈爆炸式增长。在分析Web Services的体系结构和关键技术后,提出一个基于Web Services的生物信息集成框架与服务类的概念,并对框架的工作原理进行了研究。该框架可以方便地用于各种已有的异构生物信息系统的集成。  相似文献   

15.
采用PDM、CSCW等技术,把校园等场景看作由许多子对象组成的复杂对象,研究建立一个支持大规模虚拟场景快速设计的数据管理系统。基于该系统,不仅可实现对3D模型、图像等文档的有效管理,根据实际需求灵活地配置场景,提高场景绘制速度,更重要的是提供一个分布式协同工作环境,使处于不同地域的许多用户通过协同工作,快速地创建大规模虚拟场景。  相似文献   

16.
杨兴良  华蓓  高鹰 《系统仿真学报》2007,19(6):1406-1409
基于内容的Web服务请求调度算法有利于均衡服务器集群系统的负载。已有的请求分配算法大多先运用Hash方法对请求的URL进行散列,在此基础上再按一定规则对请求内容进行负载均衡调度。在分析了Web服务流量分布不均衡及已有URL散列方法存在不足的基础上,提出了一种基于URL词典排序及内容等分的URL分配算法LOCEP。该算法通过对URL进行词典序排序,按内容等分,依访问流量排序及分段互补等一系列方法将Web负载尽可能均匀地分布到多个后端服务器中。仿真实验结果表明,该算法比现有的URL散列方法具有更好的负载均衡能力。  相似文献   

17.
针对武器装备体系效能评估在高维噪声小样本数据条件下准确性不高的问题,提出一种基于堆栈降噪自编码与支持向量回归机的混合模型。利用堆栈自编码神经网络对通用深层特征的自主抽取能力,通过在相似源域大数据上预训练混合模型,获得两任务间的共有特征知识,借助对该知识的迁移,在目标域微调该混合模型,从而提升支持向量回归机在小样本噪声数据上的学习预测精度。在一定作战想定背景下,结合武器装备体系仿真试验数据,对该混合模型进行验证。实验结果表明,与传统支持向量回归机等模型相比,所提模型能够更准确地评估装备效能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号