首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
时空轨迹频繁模式挖掘旨在从大规模轨迹数据中发现频繁时序模式,其过程主要包括数据处理和频繁行为发现2个阶段。综述了近年时空轨迹频繁模式挖掘的研究进展,首先对挖掘的过程进行概述;然后将挖掘算法按照轨迹维度特征分为基于位置的轨迹频繁模式挖掘、基于活动周期的轨迹频繁模式挖掘和基于语义的轨迹频繁模式挖掘3类,并分别展开论述;最后讨论了这些算法的基本思想和优缺点,并从挖掘方式、适用范围等方面进行对比分析。  相似文献   

2.
现有移动对象聚集模式因为模式定义的不足,无法全面地反映移动对象群体聚集运动.提出一种新的移动对象聚集模式,称为汇合模式,该模式从移动对象群体运动形态出发设计,准确反映群体的变化趋势,有效识别群体聚集运动.汇合模式挖掘过程中使用簇包含关系保证群体之间的关联性,识别群体变化趋势.通过相邻时刻的簇集合进行条件为簇包含的连接操作,实现汇合模式的挖掘.利用移动对象簇之间的空间关系对连接操作进行剪枝,提升汇合模式挖掘的效率.针对汇合模式挖掘中移动对象聚类效率较低的问题,使用四叉树改进DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法,进一步提升了汇合模式挖掘算法的性能.利用真实的GPS轨迹数据进行实验,结果表明汇合模式挖掘方法是有效的.  相似文献   

3.
移动泛在感知设备的广泛普及为移动轨迹数据的大规模采集、存储与分析开拓了广阔的空间。通过对用户的移动轨迹数据进行分析挖掘,发现其中所蕴含的有价值的行为模式与特征,对于基于位置的服务(Location-based Service,LBS),城市交通管理,精准广告营销等领域均具有重要的价值。文中针对移动轨迹频繁模式规模过大、信息冗余问题定义了频繁闭合移动轨迹模式,以经典闭合序列模式挖掘算法为基础提出了适应于移动轨迹数据的频繁闭合模式Close Traj算法,分别通过对仿真数据与真实数据的实验测试,结果显示文中所提出的Close Traj算法对于频繁闭合移动轨迹模式挖掘问题具有较强的适用性,同时在运行效率方面具有显著优势。  相似文献   

4.
针对Apriori算法产生大量候选集和多次扫描事务数据库的不足之处,本文提出一种基于模式向量的与和或运算的关联规则挖掘算法Association Rule Mining Algorithm Basedon ModeVector(ARMV)。该算法首先提出通过模式向量的或运算来减少生成的候选集数量。然后采用模式向量与事务矩阵的与运算来判断候选模式向量是否为频繁集。同时对事务矩阵的行设置flag,删除flag为0的行。每个候选模式矩阵只需扫描事务矩阵一次。实验表明ARMV算法比Apriori算法具有更好的性能和效率。  相似文献   

5.
为提高液压挖掘机器人工作装置挖掘作业轨迹规划控制精度,将挖掘机器人工作装置简化为斗杆、铲斗两关节二维机械臂进行分析.在建立逆运动学模型时,要将铲斗末端位姿空间与工作装置关节空间和油缸空间联系起来进行轨迹规划,以便在各个空间实现对挖掘机器人的控制.为提高跟踪期望轨迹精度,采用两个自适应神经模糊推理系统(ANFIS)分别学...  相似文献   

6.
网络日志挖掘中基于时间间隔的会话切分   总被引:10,自引:0,他引:10  
针对网络日志挖掘中的会话切分问题,提出了一种基于时间间隔的方法。该方法在相邻页面访问时间间隔超出某阈值时切分会话,针对特定IP的阈值根据其频率矢量来定义。实验表明:代理服务器IP和单用户IP的频率矢量具有不同特性,代理服务器IP的频率矢量具有Power-law的特点,而单用户IP的频率矢量具有Gauss分布的特点,在此基础上提出一种基于Gauss假设的方法来设定不同单用户IP的阈值。与传统的对所有IP地址使用单一的先验阈值进行切分的方法相比,该方法更为合理有效。  相似文献   

7.
通过藏文格助词的接续、结构以及上下文特征,提出基于规则、支持向量机、还原法等三层混合模式的藏文音节切分方法.藏文音节切分是藏文字频统计、分词、词性标注和机器翻译等研究领域的基础,其中藏文紧缩格歧义现象的正确识别、切分和还原是藏文音节切分的难点.经实验,混合模式藏文音节切分的F值为99.97%.  相似文献   

8.
从时空统计的角度,将时空级联模式的频繁度评价建模为多元独立分布零假设下的显著性判别问题,提出一种基于点过程模拟的时空级联模式统计挖掘方法。首先,采用时空点过程模拟每类地理要素的观测数据集,构建显著性判别的零模型;其次,通过蒙特卡洛模拟获取零假设下每种候选时空级联模式频繁度的实验分布;最后,对候选模式的观测频繁度进行显著性检验,识别显著的时空级联模式。研究结果表明:本文方法能够用于有效识别地理要素间的时空级联模式,且避免了挖掘结果对频繁度阈值设置的依赖。  相似文献   

9.
引入项的半垂直比特向量结构,提出挖掘数据流邻近序列模式的MCSP-TSW算法.通过改进比特向量组结构和引入两个剪枝策略,提出改进的MCSP-TSW-Imp算法来减少判断一个候选序列是否频繁的时间.实验表明,两种算法空间消耗相当,但MCSP-TSW-Imp算法比MCSP-TSW算法具有较高的时间效率.  相似文献   

10.
摘要随着高校扩招以及互联网信息膨胀,高校毕业论文管理中排查论文抄袭的工作量越来越大。文中提出采用向量空间模型计算论文之间的相似度,通过相似度排序,找出“可疑”论文,然后再进行人工审核,从而加快了管理机构对论文排查的速度,减少了人工排查的工作量,增加了论文排查过程的公正性。  相似文献   

11.
为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法。构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合。建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的自适应学习与寻优控制,实现Web日志频繁序列模式挖掘。仿真结果表明,采用该方法进行Web日志频繁序列模式挖掘的误差较低,收敛性较好。  相似文献   

12.
将人类时空轨迹中隐含的信息进行可视化并转换为语义语言是公安工作的迫切需要。使用聚类算法将空间轨迹数据离散化,设计等间距抽样算法规整时间序列数据,从而将连续域上的时空轨迹数据表示为离散的二值序列,为使用离散傅里叶变换和循环自相关方法查找时空轨迹中隐含的周期性行为模式做好数据准备;并通过调整采样时间跨度以增强稀疏二值序列的周期性特征。实验表明可以有效提取时空轨迹中的周期性行为模式,而具有季节性和随机变化的行为模式也具有重要参考价值。案件的发生是由人的行为导致的,所以对人类时空轨迹的研究成果也可以应用于案件分析。  相似文献   

13.
针对文本表示模型中语义信息提取不充分的问题,提出基于点互信息的CLSVSM (Co-occurrence Latent Semantic Vector Space Model)和语义增强的CLSVSM.首先利用点互信息计算关键词间的语义相似性,建立基于点互信息的CLSVSM;其次,通过潜在语义分析对关键词权重的修正,构...  相似文献   

14.
摘要:新技术在进行技术突破时,很难找到创新点和技术。针对这一难题,提出一种基于向量空间的专利类比挖掘算法。首先,从源数据中获取描述功能和属性的专利技术方案(PSC),建立基于PSC的TF-IDF值的向量空间模型(VSM);然后,根据专利文献间的信息距离制成基于PSC术语的专利地图;最后,分别对PSC进行创新性分析,根据分析结果用类比的思想进行新技术的创新。本文算法的时间复杂性为O((n2+n)/2),低于对比算法的O(n2)。以无线充电技术专利和无线传感技术专利文献为源数据,实验结果表明,所提出的算法比对比算法能更有效的获取更具有创新性的创新方案。  相似文献   

15.
基于向量的频繁项集挖掘算法研究   总被引:1,自引:0,他引:1  
针对Apriori算法寻找频繁项集时,需要多次扫描事务数据库和可能产生大量候选项集的问题,提出了一种向量和数组相结合的频繁项集挖掘算法。该算法不仅实现了只扫描事务数据库一次,而且避免了模式匹配,减少了无价值的候选项集的产生。通过与已有算法的比较,验证了本文算法具有较高的挖掘效率,而且数据库的项数越多,此算法的挖掘效果越明显。  相似文献   

16.
短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Movers Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。  相似文献   

17.
为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法.构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合.建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的...  相似文献   

18.
基于领域知识和词向量的词义消歧方法   总被引:3,自引:0,他引:3  
利用无标注文本构建词向量模型,结合特定领域的关键词信息,提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料,通过与Lesk等其他消歧方法进行比较,证明了所提方法的有效性。通过引入不同的领域知识,证明该方法亦可在其他领域的文本消歧任务中加以应用。  相似文献   

19.
新技术在进行技术突破时,很难找到创新点和方案。针对这一难题,提出一种基于向量空间的专利类比挖掘算法。首先,从源数据中获取描述功能和属性的专利技术方案(PSC),建立基于PSC的TF-IDF值的向量空间模型(VSM);然后,根据专利文献间的信息距离制成基于PSC术语的专利地图;最后,分别对PSC进行创新性分析,根据分析结果用类比的思想进行新技术的创新。本文算法的时间复杂性为O[(n~2+n)/2],低于对比算法的O(n~2)。以无线充电技术专利和无线传感技术专利文献为源数据,实验结果表明,所提出的算法比对比算法能更有效地获取更具有创新性的创新方案。  相似文献   

20.
把一类支持向量机应用到人脸相似性学习中,提出了一种快速的人脸相似性学习方法.和标准支持向量机相比较,一类支持向量机的主要特点是只利用相似样本进行训练,减少了数据量,能快速地进行相似性学习.2个实际人脸数据库上的实验结果表明,本方法能够快速地学习到人脸相似性,其运行时间至多是支持向量机算法的三分之一.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号