首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
XML数据聚簇技术研究   总被引:1,自引:1,他引:0  
在分析DOM标准中数据访问的特点后,提出了两种XML数据聚簇存储方法:基于父子关系的XML数据聚簇存储方法和基于兄弟关系的XML数据聚簇存储方法·针对两种典型树遍历操作,分析了两种XML聚簇存储方法发生I/O的概率,给出了两种DOM树遍历路径表达式查询算法,即深度优先查询算法和宽度优先查询算法·基于XMark和XMach测试基准进行了性能评价·  相似文献   

2.
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性.  相似文献   

3.
基于大数据技术准确把握配电网负荷发展态势将为精细化规划提供依据,解决城区供电分区混乱问题.本研究提出城市负荷空间分布的聚类感知方法,首先开展用户信息收集筛选建立样本数据集,采用基于密度峰值的快速聚类算法,以各电力用户样本点的局部密度和样本间距为指标进行聚类,聚类所得群簇对应于一定容量变电站供电分区的负荷分布,以聚类群簇作为基本单元,分析群簇属性指标包括群簇簇头空间坐标、群簇负荷总量、群簇负荷密度、群簇用户总数、群簇最大半径、群簇平均半径等,建立以群簇属性为要素的城市电力负荷态势感知模型,在特定的时间和空间对城市电力负荷群簇进行分析以准确把握城市发展态势;最后以某城市供电网格为例,验证所提方法有效性.  相似文献   

4.
对象代理数据库是一种先进的具有复杂信息管理能力的数据库系统,随着数据量的剧增,实现其分布式存储变得十分重要.然而,对象代理数据库中的数据存在着很强的关联性,如果按照传统数据划分方式进行分布式存储,将导致查询效率低下.针对这一问题,本文提出了一种基于关联的高效数据划分方法:首先根据代理层次将关联对象聚集成对象簇,每个簇对应一个存储文件;然后提取对象簇的模式特征和语义特征,通过聚类算法将对象簇集划分为k个子集分配到各存储节点.将本文方法与随机分布式存储方法进行了比较实验,结果证明本文方法在查询效率方面具有明显优势.  相似文献   

5.
针对无线传感网中数据收集、存储和查询的需要,提出了一种基于动态可调簇的能量感知数据存取算法ACEDBA(Adjusted Cluster-based energy-aware Data Brokerage Algorithm).该算法将网络节点分成许多簇结构,簇内节点负责数据采集,簇首节点负责簇内数据的收集、汇聚和转发,数据可以集中存储,也可以分布存储在各簇首节点或本地存储.算法引入能量分级消耗机制,可动态选择和调整簇首节点,保证各簇首节点簇内数据存储和簇间数据转发查询的能量平衡.实验结果表明,与典型数据存取算法相比,该算法的节点能耗均衡、生命周期和查询成功率方面具有优势.  相似文献   

6.
基于SNN相似性和密度的聚类算法是当前主要的无监督聚类方法之一,该类算法在发现不同大小形状簇的聚类过程中都取得了较好的结果。但是该类算法也存在局限性,如Jarvis-Pat-rick算法通过单连结的方式发现簇,可能分割真正的簇或者合并应该保持分离的簇,而SNN密度类算法的Eps,MinPts参数的确定对用户来说是比较困难的。针对该类问题,本文对聚类过程中的局部集聚特征进行了分析和定义,提出了利用数据的局部集聚特征来控制聚类过程的的聚类算法。通过验证,该算法对发现不同密度以及任意形状的数据集合的聚类分析问题是有效的,突出了数据分析的局部集聚特征,改进了数据聚类的质量。  相似文献   

7.
一种三维点云聚类算法的研究   总被引:1,自引:1,他引:0  
在重构曲面之前,需要对点云数据进行聚类处理,以保证后续3D重建工作准确、高效地进行。基于采用传统的聚类方法处理立体视觉形成的海量数据所存在的计算与存储瓶颈问题,提出一种新型的聚类算法,即基于包围盒的密度聚类算法。它首先利用包围盒算法对给定的海量点云进行过分聚类,然后对每个过分簇求中心,用中心点代替过分簇,最后在过分簇的级别上进行基于密度的聚类来完成对整体的聚类。结果显示该方法能够有效地实现海量点云的聚类,突破计算瓶颈。它实现了原始点云的大量删减,简化率高达96.75%,并最终在过分簇的级别上将原始点云分为5类。  相似文献   

8.
为研究如何帮助社交网络中虚拟团队从海量的用户中筛选更多行为相似的用户加入团队,建立了一种基于社交网络的团队成员推荐模型,为虚拟团队推荐一些行为特征相似的用户作为候选团队成员。通过对用户信息和团队信息进行分词处理,得到用户标签向量集和团队标签向量集;将基于遗传算法的聚类算法应用于团队标签向量集,得到团队聚类簇和团队聚类中心;在此基础上,将团队聚类中心作为用户集的初始聚类中心,聚类出行为特征与团队聚类中心相似的用户簇,将这些用户簇作为相应团队聚类簇的候选推荐用户;再应用协同过滤思想,筛选出团队推荐成员列表。实验结果表明,该算法有效地解决了虚拟团队成员推荐问题。  相似文献   

9.
针对大学生就业问题,以层次聚类策略为技术支撑,架构出一种就业去向短期预测系统.根据待挖掘数据量,选取簇间距离度量标准,架构簇与子簇构成的层次聚类树,完成目标数据的聚类或分类处理.构建层次聚类算法模块中相关算法运行流程,结合预测系统用户与管理员的角色职责,设计多个系统数据库实体.建立各实体间关系的映射模型,基于此完成数据...  相似文献   

10.
针对新闻的个性化服务差及推荐效率低的问题,提出了一种新闻事件的分布式混合推荐算法.该算法改进了传统的层次聚类算法用于新闻事件发现,通过协调簇中心距离和簇间最远距离的权重解决了传统层次聚类中的大簇问题;使用混合推荐算法进行事件推荐,引入了事件的多重特征来计算用户兴趣模型,更准确地表示用户的兴趣偏好;采用Spark分布式计算平台实现该算法,可处理大数据的个性化推荐问题.在公开数据集上的实验结果表明本文方法有效.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号