期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王伟娜李陶深陈庆锋《华中科技大学学报(自然科学版)》2012,(Z1):104-107

针对PrefixSpan算法在产生频繁序列模式(特别是挖掘密数据集和长序列模式)时会产生大量的投影数据库,使得算法性能下降的问题,提出一种基于投影位置的序列模式挖掘(PSPM)算法.该算法利用Apriori性质舍弃对非频繁项存储,节省了存储空间和扫描不可能出现序列的挖掘时间;在递归挖掘过程中,利用投影位置表直接定位投影序列位置进行挖掘局部频繁项,避免了构造投影数据库,从而提高执行效率.实验结果表明:与PrefixSpan(with pseudo-pro)算法相比,PSPM具有更好的执行效率和可伸缩性. 相似文献

2.

基于PrefixSpan序列模式挖掘的改进算法

《西南科技大学学报》2016,(4)

针对PrefixSpan算法在构建投影数据库时时间开销过多和随着支持度增加效率下降的问题,提出了一种基于PrefixSpan算法的改进算法AP(AprioriAll-Prefix Span),该算法可以减少构建投影数据库的时间开销和降低支持度增加对算法效率的影响。改进思想是在第一次划分生成投影数据库时,按投影数据库中项集的个数从小到大排序,在第二次划分的时候,从已挖掘序列模式中直接生成所需序列模式,从而减少数据库的构建。实验结果显示AP算法效率高于PrefixSpan算法。相似文献

3.

大型数据库中的高效序列模式增量式更新算法 总被引：7，自引：1，他引：7

邹翔张巍蔡庆生王清毅《南京大学学报(自然科学版)》2003,39(2):165-171

提出一种称为FIMS（fast incremental mining of sequential patterns)的序列模式增量式更新算法，处理因数据库的更新而引起的序列模式的维护问题。主要思想是利用原先的序列模式挖掘结果，通过建立一个投影数据库来减少对整个数据库的扫描次数和侯选序列的生成，从而提高挖掘的效率。实验结果显示在更新数据量远小于整个数据库的大小时，FIMS算法的性能优于GSP算法4－7倍。相似文献

4.

改进的PrefixSpan算法在Web挖掘中的应用

谢清森杨天奇《科学技术与工程》2009,9(23)

针对PrefixSpan算法不足,采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法.实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35%以上,更适用于Web挖掘. 相似文献

5.

基于投影数据库的序列模式挖掘增量式更新算法

陆介平刘月波倪巍伟陈耿孙志挥《东南大学学报(自然科学版)》2006,36(3):457-462

针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法. 相似文献

6.

改进的PrefixSpan算法在Web挖掘中的应用

谢清森杨天奇《南京邮电大学学报(自然科学版)》2009,9(23)

针对PrefixSpan算法不足,本文采用修改Prefix策略与舍弃非频繁项的方法,减少内存与外存之间频繁地交换,减小在挖掘过程中产生的投影数据库规模,降低构建、扫描投影数据库的时空耗费,从而改进算法。实验结果表明,在长序列模式挖掘中,算法在改进后运行效率比原来提高35％以上,更适用于Web挖掘。相似文献

7.

面向网络管理知识获取的一种序列模式挖掘新算法

下载免费PDF全文

李伟罗军舟《解放军理工大学学报(自然科学版)》2008,9(5):445-449

为了从反映网络状况和网络行为的海量历史数据中提取有用的网络管理知识,提出了一种用于获取网络管理知识的序列模式挖掘新算法--基于定位索引投影的序列模式挖掘算法.该算法采用模式增长、分而治之的思想,通过引入定位索引的概念,避免了对投影数据库的扫描,进一步减少了系统的开销.实验证明,利用该算法能够有效地发现网络告警事件序列模式. 相似文献

8.

基于比特向量组的数据流邻近序列模式挖掘算法研究

下载免费PDF全文

谢伙生孙金涛《福州大学学报(自然科学版)》2012,40(5):567-571

引入项的半垂直比特向量结构,提出挖掘数据流邻近序列模式的MCSP-TSW算法.通过改进比特向量组结构和引入两个剪枝策略,提出改进的MCSP-TSW-Imp算法来减少判断一个候选序列是否频繁的时间.实验表明,两种算法空间消耗相当,但MCSP-TSW-Imp算法比MCSP-TSW算法具有较高的时间效率. 相似文献

9.

基于投影二维表的最大频繁模式挖掘算法

下载免费PDF全文

王利军《西昌学院学报(自然科学版)》2019,33(4):70-74

PITable-MAX是基于投影二维表的最大频繁模式挖掘算法。算法只需要遍历一次事务数据库,并将数据信息存入投影数据库中,在挖掘事务项时才会从投影数据库中提取相关的数据信息生成投影二维表,从而减少对内存空间的占用,算法虽然采用递归方式,但组合策略可实现减少条件投影二维表的规模,以达到减少空间;并结合减挖策略来减少挖掘事务项的个数,以达到提高挖掘效率的目的;实验验证了算法的可行性和优越性。相似文献

10.

一种面向物流数据分析的路径序列挖掘算法ImGSP

胡孔法张长海陈崚达庆利《东南大学学报(自然科学版)》2008,38(6)

为了有效地挖掘物流管理系统中的物流频繁路径序列模式,提出了一种针对物流数据分析的路径序列挖掘算法ImGSP算法.ImGSP算法通过对原始路径数据库筛选,选出路径序列长度大于或等于候选序列长度的路径序列,有针对性地产生过度候选序列,来约减候选序列.实验结果表明:ImGSP算法能够有效地减少候选序列数量,生成频繁路径序列模式,进而产生物流中有用的规则.该方法不仅缩小了扫描数据库的规模,而且减少了生成频繁序列的候选序列集合. 相似文献

11.

A Fast Interactive Sequential Pattern Mining Algorithm 总被引：3，自引：0，他引：3

LU Jie-Ping LIU Yue-bo NI wei-wei LIU Tong-ming SUN Zhi-hui 《武汉大学学报:自然科学英文版》2006,11(1):31-36

In order to reduce the computational and spatial complexity in rerunning algorithm of sequential patterns query, this paper proposes sequential patterns based and projection database based algorithm for fast interactive sequential patterns mining algorithm （FISP）, in which the number of frequent items of the projection databases constructed by the correct mining which based on the previously mined sequences has been reduced. Furthermore, the algorithm＇s iterative running times are reduced greatly by using global-threshold. The results of experiments testify that FISP outperforms PrefixSpan in interactive mining 相似文献

12.

基于操作序列挖掘的OLAP查询推荐方法 总被引：1，自引：0，他引：1

陈岭陈元中陈根才《东南大学学报(自然科学版)》2011,(3):498-504

针对联机分析处理(OLAP)操作复杂导致的用户使用效率低下问题,提出基于操作序列挖掘的OLAP查询推荐方法.首先从多维表达式(MDX)查询语句记录中提取整数数列形式的查询序列,再利用PrefixSpan方法对查询序列进行频繁序列模式挖掘,并基于挖掘出的模式及其子模式建立概率矩阵,最后通过搜索与用户当前查询操作或查询序列... 相似文献

13.

改进的PrefixSpan算法在旅游热门路线上的应用

胡冰冰芦俊丽郑承宇《云南民族大学学报(自然科学版)》2022,(1):94-102

PrefixSpan算法是目前比较经典且较为高效的挖掘频繁序列模式的算法,而应用在旅游热门路线的搜索上,仍存在着连续性不足的问题.为了改善该算法的连续性,从改变频繁序列模式的生成过程方面对算法进行了改进优化.实验结果表明,改进的PrefixSpan算法在旅游热门路线的搜索上具有更好的连续性,且比原算法效率更高,更适用于... 相似文献

14.

NPSP:一种高效的序列模式增量挖掘算法 总被引：4，自引：3，他引：1

张兵聂永红林士敏《广西师范大学学报(自然科学版)》2004,22(4):22-26

提出了一种称为“异构树”的数据结构,采用一套编号规则对异构树的分支进行编号,使具有相同编号的分支代表相同的候选序列,编号不同的分支代表不同的候选序列,极大地简化了候选集计数过程,在此基础上提出了具有增量挖掘功能的序列模式高效挖掘算法NPSP,并从理论分析和实验两方面证明了其挖掘结果集的完备性和算法的高效性．相似文献

15.

带限制的动态数据库中大项目集增量式挖掘

李乃乾沈钧毅《西安交通大学学报》2003,37(4):359-363

提出了一种带限制的动态数据库中大项目集的增量式挖掘算法，基于限制条件它有4种优化策略，并对候选项目集进行修剪，减少了个性选项目集的数量。同时，利用已挖掘的大项目集计算本次挖掘顺在项目集的记数，减少了I／O的次数。该算法允许用户不断改变限制条件，实现交互式挖掘，而且可将挖掘的目标仅仅聚焦到其感兴趣的模式上，这不仅适用于对数据库进行插入操作，还适用于删除，修改操作，实验表明该算法是有效的。相似文献

16.

基于序列划分的压缩序列模式挖掘算法

下载免费PDF全文

谢伙生黄钧钧《福州大学学报(自然科学版)》2012,40(4):459-463

研究了静态数据库当中挖掘压缩序列模式的问题,提出了一个压缩序列模式挖掘算法.该算法通过对闭序列模式全集进行划分处理,降低了序列的比对空间,并结合δ-dominant序列检测机制,有效的挖掘出了压缩序列模式集.实验表明,该算法具有较好的运行效率. 相似文献

17.

基于量化概念格的关联规则挖掘 总被引：4，自引：0，他引：4

王德兴胡学钢王浩《合肥工业大学学报(自然科学版)》2002,25(5):678-682

在概念格的内涵中引入等价关系并将其外延量化 ,得到量化概念格。利用量化概念格可以清晰地表示知识 ,从而便于挖掘包括关联规则在内的多种规则 ,与经典的 A priori算法相比较 ,规则表示更简捷、直观 ,尤其重要的是用户可根据自己的兴趣交互地挖掘关联规则 ,不需要计算频繁项目集 ,因而提高了挖掘规则的效率 ,适用于大型数据库中关联规则的挖掘相似文献

18.

基于项目位置索引的序贯模式增量挖掘方法

梁铁柱李德毅宋云娴《西安交通大学学报》2002,36(10):1032-1036

通过前缀序列的引入，将搜索空间划分为若干个子空间，利用模式增量技术对序贯模式进行有效搜索，并提出了项目位置索引的概念，即将原始序列数据库信息转换到项目位置索引（IPI）中，从而在搜索序贯模式时避免了复杂的多维候选序列的测试，仅需对各前缀序列对应的扩展的项目位置索引库（IPIDBs)做简单的序列数目累加操作，将复杂的高维序贯模式搜索问题巧妙地转换为一维频繁项目的搜索，降低了算法复杂度，提高了效率。相似文献

19.

基于FP_tree的最大频繁模式挖掘算法的改进

叶福兰《成都大学学报(自然科学版)》2014,(2):148-150,162

基于条件模式树的最大频繁模式挖掘算法在挖掘过程中将扫描事务数据库两次,且产生了大量的候选项目集,产生最大频繁模式过程中比较次数较多,总体效率较低.提出改进后的最大频繁模式挖掘策略,利用二维表保存事务出现项目的情况,通过最大频繁模式的相关性质减少了挖掘的项数及产生的频繁模式集,减少比较的次数. 相似文献