首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
移动环境中的最大移动序列模式挖掘   总被引:1,自引:0,他引:1  
在移动通信环境中,移动序列模式挖掘对于有效的提高位置管理的服务质量具有重大的意义.移动序列模式挖掘和传统的序列模式挖掘是不同的,首先,前者需要考虑更多的时间因素;其次,移动序列模式中的项之间是连续的,因为关心移动用户的下一次移动情况.本文提出了一种挖掘移动序列模式的新技术:聚类的思想引入到移动序列模式挖掘来处理移动历史的时间离散化,并且提出了一个高效的PrefixTree算法来挖掘移动序列.性能研究表明,Pref ixTree算法优于PrefixSpan-2算法.  相似文献   

2.
将名词、形容词、动名词和命名实体作为文本特征,考虑词序与词频,结合特征项的语义,提出一种基于改进最长公共子序列的文本聚类(LCSC)方法.实验结果表明:相对于传统的余弦值聚类方法,LCSC方法在人名消歧的P-IP指标上,F平均值由74.2%提高到了84.9%;相对于最长公共子序列方法,总体性能也提高了3.7%.  相似文献   

3.
阐述了最长公共子序列算法在程序代码结构相似度度量中的应用,列举了两种计算最优值和一种获取最长公共标识符子序列的算法.根据最优值得到结构相似度值,进而可以查找出结构相似程序对.最后探讨了程序代码相似度的实际应用.  相似文献   

4.
Internet飞速发展在带给人们很多方便的同时,也出现了一个新问题,即如何从大量的Web日志数据中快速而方便的找到所需要的信息,Web日志挖掘是其关键技术之一.本文使用了RACE算法及使用长度分析实现了Web序列模式的日志挖掘,并进行了实例分析.  相似文献   

5.
不同于传统以距离为相似度标准的聚类方法,基于模式的聚类方法旨在挖掘出数据集中存在一致性模式的簇.然而,已有的模式聚类方法只能挖掘出特定的等差或等比模式,而对其他常用模式判断不足.分析数据对象间存在的多样化模式,引入了线性模式的概念,研究其特性和运算方法,并给出了一个对符合线性模式相似性的对象进行聚类的有效算法.  相似文献   

6.
序列模式挖掘是数据挖掘中最重要的研究课题之一。基于记录频繁集各元素的Ctid表的基础上,有研究者提出一种渐进式序列模式挖掘算法IMSP,目的是支持度保持不变,而数据库变化不大时,如何利用前次的结果和中间结果,以加速本次挖掘过程。笔者深入分析了算法IMSP结构,指出该算法在时间复杂度,挖掘规则的完备性上的不足,同时也指出利用该算法所可能得到的错误结果。  相似文献   

7.
针对基于数据挖掘方法的病毒检测系统中计算量和内存消耗大的问题,分析病毒行为,研究序列挖掘技术,提出基于PrefixSpan算法的检测方法,并将其运用到基于序列挖掘的病毒检测系统中.实验结果表明:改进的病毒检测系统能节约大量资源,其检测病毒,尤其是未知病毒的准确率较高.  相似文献   

8.
谢晶 《天津科技》2009,36(4):78-79
提出了一种挖掘网站用户访问模式知识的新聚类方法。利用关联规则挖掘方法,首先构造出反映网站用户频繁访问行为的访问集(基类),然后对相似的基类进行归并,从而获得最终描绘网站用户访问行为的模式知识(聚类集合)。  相似文献   

9.
根据网站的树形结构特点,提出了一种统一的树化模型对用户访问路径进行建模,解决了因使用原始访问路径产生的"过度比较问题",并通过采用适合该模型的网页相对位置的概念,大大减轻了原来由于使用网页绝对访问位置导致的误差。结果表明:树化模型能够提高用户访问行为的相似度识别率。  相似文献   

10.
现代战争需要对多源异构的装备数据进行高效集成。针对不同来源数据中装备名称不一致的问题,设计了装备数据的聚合模型和聚合流程,在综合分析现有算法的基础上,结合装备名称特点为该模型提供了一种新的相似度匹配算法,算法将Jaro-Winkler和最长公共子序列相结合,以提高匹配的精度。最后通过实验进行了验证,结果表明该算法与传统相似度算法相比具有较高的适配性和鲁棒性,可以为装备数据聚合工作提供有效支撑。  相似文献   

11.
网页内容的不断更新往往使得采用静态网页制作技术设计的网站难以维护。本文采用基于最长公共子序列算法(LCS),挖掘静态网页之间在网页结构上的相似性即结构模式,结合可视化标注技术辅助静态网站的维护。  相似文献   

12.
13.
为了实现对数据流的序列模式挖掘,提出了基于数据流的序列模式挖掘算法MFSDS-1和MFSDS-2,它们均通过调整入选度的大小来调整保存信息的粒度.算法MFSDS-2利用分层存储结构,不仅能更好地保存序列信息,而且可以通过与全局序列模式的对比得到当前活动的一些异常序列模式.实验结果表明,基于分层存储的算法MFSDS-2的效率比算法MSFDS-1高.  相似文献   

14.
基于超图聚类的用户行为模式挖掘   总被引:3,自引:1,他引:2  
为解决代理服务器端用户行为日志的高维特征,提出一种基于超图模型的Web会话聚类方法。该方法利用页面归约和隐含在会话中的时间等统计信息描述会话,并在此基础上利用基于关联规则的超图对用户会话进行聚类,可以在较高层次上发现代理服务器端的用户行为模式。实验结果表明,该方法可以在大型的代理日志文件集中挖掘出有意义的用户行为模式,有效揭示用户的行为规律。  相似文献   

15.
卢海涛 《科技资讯》2014,12(17):204-204
论文阐述了基于时间序列的模式挖掘的基本概念,对基于时间序列的模式挖掘经典算法和增量挖掘、时间序列分段线性表示及相似性算法进行了相对全面的介绍,对算法的特征做了详细的论述。  相似文献   

16.
DMBIT:一种有效的序列模式挖掘算法   总被引:1,自引:0,他引:1  
大量候选序列模式支持度的计算所带来的时间消耗是序列模式挖掘主要问题之一,为此提出了一种有效的序列模式挖掘算法:DMBIT(Data Mining Bitmap),该算法根据位索引表和Seq-list表的结构,采用渐进的事件扩展,事务扩展方法,通过有效的剪枝策略和"与"逻辑运算操作进一步缩小了频繁序列的搜索范围,同时通过序列列表ListX的生成加快了相应候选项支持度的计算,算法分析和实验结果表明,在大数据集环境下的DMBIT算法性能优越,能够明显加速数据库中最大频繁序列的生成.  相似文献   

17.
分析了状态演化模式挖掘(SEPM)过程中的不确定性,将模糊的思想引入SEPM中,提出了模糊状态演化模式挖掘(FSEPM)的概念并对其进行了算法实现;在此基础上,对FSEPM进行了基于有效支持度的改进。  相似文献   

18.
历史相似时间序列的提取在数据挖掘、工业故障检测以及故障根源分析等领域应用非常广泛。针对工业报警系统中异常根源分析方法存在的问题,提出了一种基于趋势特征聚类的多元相似时间序列的提取方法,可以有效地辅助现场工作人员分析关键变量发生异常变化的根源。首先对多元时间序列进行分段线性表示,获得变量的趋势特征信息;然后采用基于密度峰值聚类分析算法对获得的趋势特征在高维空间中聚类,从而实现历史数据的相似性提取;最后可根据关联变量的幅值变化量分析导致主变量发生异常变化的根源变量。数值仿真和实际工业数据案例验证了所提方法的有效性。  相似文献   

19.
针对目前动态数据挖掘中存在的问题,提出基于数据增量的动态挖掘进程概念;在动态挖掘进程和生物免疫进化过程的相似性基础上,提出了知识发现中的免疫进化机制的基本内涵;给出了基于免疫进化机制的时序模式挖掘算法及其实验分析,以验证理论的正确性和有效性。  相似文献   

20.
提出了一种基于图结构的文本聚类方法,采用基于图结构的文本表示方法来构建文本的图结构模型,将一个文本映射为相应的图结构,通过最大完全公共子图的求解计算文本间相似度,并进行聚类。实验结果验证了该方法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号