首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 46 毫秒
1.
缓存是增强计算机整体性能的一项重要技术,缓存替换算法作为核心技术尤为重要。通过深入研究多种数据访问模式下ARC(adaptive replacement cache)算法的性能,总结出ARC算法性能较差的数据访问模式及其原因。针对发现的不足提出了一种改进的缓存替换算法,该算法通过引入IRR(inter reference recency)信息,提高了弱局部性访问模式下的缓存命中率,改善了ARC算法对不同数据访问模式的适应性。仿真实验结果表明,改进后的算法提升了应对弱局部性访问模式的能力,增强了算法的灵活性。  相似文献   

2.
提出了一种基于树形结构的Web结构化数据抽取算法.该算法基于HTML的树形层次结构,包括HTML树构造算法,数据区域挖掘算法,数据记录挖掘算法以及数据记录模式生成算法.算法引入了页面元素布局位置等信息用于清洗页面,采用层次划分思想实现页面数据区域的挖掘,并通过树匹配生成记录模式,实现最终数据项抽取.实验表明,该方法可以有效地实现Web结构化数据抽取.  相似文献   

3.
XML数据到关系数据的映射   总被引:2,自引:0,他引:2  
为实现XML数据到关系数据的数据映射,提出一种模式抽取算法,通过XML2XDR模块抽取XML模式,依据模式对XML数据分类.分析XML模式与关系模式的差异性,通过XMLdata2DB模块建立XML数据到关系数据的映射规则,从而实现将XML数据映射到关系数据中.  相似文献   

4.
移动泛在感知设备的广泛普及为移动轨迹数据的大规模采集、存储与分析开拓了广阔的空间。通过对用户的移动轨迹数据进行分析挖掘,发现其中所蕴含的有价值的行为模式与特征,对于基于位置的服务(Location-based Service,LBS),城市交通管理,精准广告营销等领域均具有重要的价值。文中针对移动轨迹频繁模式规模过大、信息冗余问题定义了频繁闭合移动轨迹模式,以经典闭合序列模式挖掘算法为基础提出了适应于移动轨迹数据的频繁闭合模式Close Traj算法,分别通过对仿真数据与真实数据的实验测试,结果显示文中所提出的Close Traj算法对于频繁闭合移动轨迹模式挖掘问题具有较强的适用性,同时在运行效率方面具有显著优势。  相似文献   

5.
首先,深入分析了频繁模式挖掘算法Eclat和Eclat+,在大数据集上挖掘长模式时,Eclat+的性能不及Eclat。基于此,提出一种改进的Eclat算法,新算法充分利用了垂直数据表示和交叉计数的高效优势,直接在垂直数据表示的数据集上通过广度优先搜索和交叉计数产生频繁模式。实验结果表明,在挖掘长模式时,改进的Eclat算法的运行速度较Eclat、Eclat+均有明显的提高。  相似文献   

6.
一种更稳定的链接分析算法〖CD2〗子空间HITS算法   总被引:8,自引:0,他引:8  
在给定超链接情况下, Kleinberg的HITS算法采用特征向量的办法来确定页面的权威性等级. 通过分析当链接模式发生小的变化时算法的稳定性, 提出一种新的算法——子空间HITS算法, 并通过Web超链接数据作为实验数据对其性能进行研究.  相似文献   

7.
提出了一种基于模式增长的频繁模式挖掘算法(简称为PGMiner算法).这种算法是一种深度挖掘的算法,不产生任选项集,便于发现较长的模式,避免了Apriori和FP-growth方法存在的问题.通过一种简单的索引结构在映射数据库中不断地增加模式长度.这种索引结构占用较少的内存,使得这种基于内存的算法有很高的执行效率.采用现实数据集以及IBM人工数据集对PGMiner算法进行测试.试验结果显示,对于一般类型的特别是较为稀疏的数据集,PGMiner算法比Apriori和FP-growth方法有更好的性能.  相似文献   

8.
分析稀少数据的相关性是一种重要的、有价值的数据挖掘任务。运用面向关联规则的FP树构造方法,提出了一种特异关联规则挖掘算法RSFPA。该算法将包含特异模式的数据集压缩成一棵FP树,通过挖掘FP树来提取特异模式集,从而进一步提高了特异模式的挖掘效率。最后,利用恒星光谱作为数据集,实验验证了RSFPA算法的正确性和有效性。  相似文献   

9.
FP-Growth算法在关联规则挖掘中是最经典的算法,主要通过频繁模式树(FP树)避免生成候选频繁项目集.针对FP-Growth算法中耗费内存严重的问题,采用链表存储方式,给出了FP-Growth算法的实现方法,其中单个结点采用链表形式来产生,频繁模式树采用左孩子右兄弟的存储结构来组织.在此基础上利用索引表,实现了对频繁模式树中共同前缀结点的快速查找,提高了频繁模式树构造的效率,解决了FP树构造算法中数据存储的瓶颈问题.最后以天体光谱数据和城市土壤数据作为数据集分别对该算法进行测试,实验结果表明,该方法的构造效率要明显优于基于顺序结构的FP-Growth算法.  相似文献   

10.
物体的性质可以用各向异性的数据模式表达,每一个分类器可以针对一种数据模式对物体进行分类,由此提出了一个对各向异性的数据模式进行整合的概率分类算法。将该算法应用于一个模拟数据,实验结果表明了该算法是可行性的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号