期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《江西科学》2017,(6)

时空轨迹频繁模式挖掘旨在从大规模轨迹数据中发现频繁时序模式,其过程主要包括数据处理和频繁行为发现2个阶段。综述了近年时空轨迹频繁模式挖掘的研究进展,首先对挖掘的过程进行概述;然后将挖掘算法按照轨迹维度特征分为基于位置的轨迹频繁模式挖掘、基于活动周期的轨迹频繁模式挖掘和基于语义的轨迹频繁模式挖掘3类,并分别展开论述;最后讨论了这些算法的基本思想和优缺点,并从挖掘方式、适用范围等方面进行对比分析。相似文献

2.

一种新的基于时空轨迹的汇合模式挖掘算法

杨宇吉根林赵斌黄潇婷《南京大学学报(自然科学版)》2018,(1)

现有移动对象聚集模式因为模式定义的不足,无法全面地反映移动对象群体聚集运动.提出一种新的移动对象聚集模式,称为汇合模式,该模式从移动对象群体运动形态出发设计,准确反映群体的变化趋势,有效识别群体聚集运动.汇合模式挖掘过程中使用簇包含关系保证群体之间的关联性,识别群体变化趋势.通过相邻时刻的簇集合进行条件为簇包含的连接操作,实现汇合模式的挖掘.利用移动对象簇之间的空间关系对连接操作进行剪枝,提升汇合模式挖掘的效率.针对汇合模式挖掘中移动对象聚类效率较低的问题,使用四叉树改进DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚类算法,进一步提升了汇合模式挖掘算法的性能.利用真实的GPS轨迹数据进行实验,结果表明汇合模式挖掘方法是有效的. 相似文献

3.

面向移动时空轨迹数据的频繁闭合模式挖掘

王亮汪梅郭鑫颖秦学斌《西安科技大学学报》2016,(4):573-576,598

移动泛在感知设备的广泛普及为移动轨迹数据的大规模采集、存储与分析开拓了广阔的空间。通过对用户的移动轨迹数据进行分析挖掘,发现其中所蕴含的有价值的行为模式与特征,对于基于位置的服务(Location-based Service,LBS),城市交通管理,精准广告营销等领域均具有重要的价值。文中针对移动轨迹频繁模式规模过大、信息冗余问题定义了频繁闭合移动轨迹模式,以经典闭合序列模式挖掘算法为基础提出了适应于移动轨迹数据的频繁闭合模式Close Traj算法,分别通过对仿真数据与真实数据的实验测试,结果显示文中所提出的Close Traj算法对于频繁闭合移动轨迹模式挖掘问题具有较强的适用性,同时在运行效率方面具有显著优势。相似文献

4.

基于模式向量与和或运算的关联规则挖掘算法

刘力伦淑娴姜浩《渤海大学学报(自然科学版)》2008,29(4)

针对Apriori算法产生大量候选集和多次扫描事务数据库的不足之处,本文提出一种基于模式向量的与和或运算的关联规则挖掘算法Association Rule Mining Algorithm Basedon ModeVector（ARMV）。该算法首先提出通过模式向量的或运算来减少生成的候选集数量。然后采用模式向量与事务矩阵的与运算来判断候选模式向量是否为频繁集。同时对事务矩阵的行设置flag,删除flag为0的行。每个候选模式矩阵只需扫描事务矩阵一次。实验表明ARMV算法比Apriori算法具有更好的性能和效率。相似文献

5.

基于ANFIS的挖掘机器人挖掘轨迹仿真

王福斌刘杰焦春旺陈至坤《东北大学学报(自然科学版)》2011,32(4):554-558

为提高液压挖掘机器人工作装置挖掘作业轨迹规划控制精度,将挖掘机器人工作装置简化为斗杆、铲斗两关节二维机械臂进行分析.在建立逆运动学模型时,要将铲斗末端位姿空间与工作装置关节空间和油缸空间联系起来进行轨迹规划,以便在各个空间实现对挖掘机器人的控制.为提高跟踪期望轨迹精度,采用两个自适应神经模糊推理系统(ANFIS)分别学... 相似文献

6.

网络日志挖掘中基于时间间隔的会话切分 总被引：10，自引：0，他引：10

庄力可寇忠宝张长水《清华大学学报(自然科学版)》2005,45(1):115-118

针对网络日志挖掘中的会话切分问题,提出了一种基于时间间隔的方法。该方法在相邻页面访问时间间隔超出某阈值时切分会话,针对特定IP的阈值根据其频率矢量来定义。实验表明:代理服务器IP和单用户IP的频率矢量具有不同特性,代理服务器IP的频率矢量具有Power-law的特点,而单用户IP的频率矢量具有Gauss分布的特点,在此基础上提出一种基于Gauss假设的方法来设定不同单用户IP的阈值。与传统的对所有IP地址使用单一的先验阈值进行切分的方法相比,该方法更为合理有效。相似文献

7.

基于混合模式的藏文音节切分

才让当知华却才让却措卓玛夏吾吉《内蒙古师范大学学报(自然科学版)》2019,(5)

通过藏文格助词的接续、结构以及上下文特征,提出基于规则、支持向量机、还原法等三层混合模式的藏文音节切分方法.藏文音节切分是藏文字频统计、分词、词性标注和机器翻译等研究领域的基础,其中藏文紧缩格歧义现象的正确识别、切分和还原是藏文音节切分的难点.经实验,混合模式藏文音节切分的F值为99.97%. 相似文献

8.

基于点过程模拟的时空级联模式统计挖掘方法

《中南大学学报(自然科学版)》2017,(10)

从时空统计的角度,将时空级联模式的频繁度评价建模为多元独立分布零假设下的显著性判别问题,提出一种基于点过程模拟的时空级联模式统计挖掘方法。首先,采用时空点过程模拟每类地理要素的观测数据集,构建显著性判别的零模型;其次,通过蒙特卡洛模拟获取零假设下每种候选时空级联模式频繁度的实验分布;最后,对候选模式的观测频繁度进行显著性检验,识别显著的时空级联模式。研究结果表明:本文方法能够用于有效识别地理要素间的时空级联模式,且避免了挖掘结果对频繁度阈值设置的依赖。相似文献

9.

基于比特向量组的数据流邻近序列模式挖掘算法研究

下载免费PDF全文

谢伙生孙金涛《福州大学学报(自然科学版)》2012,40(5):567-571

引入项的半垂直比特向量结构,提出挖掘数据流邻近序列模式的MCSP-TSW算法.通过改进比特向量组结构和引入两个剪枝策略,提出改进的MCSP-TSW-Imp算法来减少判断一个候选序列是否频繁的时间.实验表明,两种算法空间消耗相当,但MCSP-TSW-Imp算法比MCSP-TSW算法具有较高的时间效率. 相似文献

10.

基于向量空间模型的毕业论文相似性辨识研究

王毅唐歆瑜谢治华《科学技术与工程》2007,7(9):2111-2113

摘要随着高校扩招以及互联网信息膨胀,高校毕业论文管理中排查论文抄袭的工作量越来越大。文中提出采用向量空间模型计算论文之间的相似度,通过相似度排序,找出“可疑”论文,然后再进行人工审核,从而加快了管理机构对论文排查的速度,减少了人工排查的工作量,增加了论文排查过程的公正性。相似文献

11.

基于支持向量机的Web日志频繁序列模式挖掘研究

《齐齐哈尔大学学报(自然科学版)》2021,(1)

为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法。构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合。建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的自适应学习与寻优控制,实现Web日志频繁序列模式挖掘。仿真结果表明,采用该方法进行Web日志频繁序列模式挖掘的误差较低,收敛性较好。相似文献

12.

时空轨迹中隐含的周期性行为模式

刘翔王斌君王靖亚杜锦《科学技术与工程》2015,15(35)

将人类时空轨迹中隐含的信息进行可视化并转换为语义语言是公安工作的迫切需要。使用聚类算法将空间轨迹数据离散化,设计等间距抽样算法规整时间序列数据,从而将连续域上的时空轨迹数据表示为离散的二值序列,为使用离散傅里叶变换和循环自相关方法查找时空轨迹中隐含的周期性行为模式做好数据准备;并通过调整采样时间跨度以增强稀疏二值序列的周期性特征。实验表明可以有效提取时空轨迹中的周期性行为模式,而具有季节性和随机变化的行为模式也具有重要参考价值。案件的发生是由人的行为导致的,所以对人类时空轨迹的研究成果也可以应用于案件分析。相似文献

13.

基于点互信息语义相似性的向量空间模型

牛奉高赵霞徐倩丽《山西大学学报(自然科学版)》2021,(2):220-228

针对文本表示模型中语义信息提取不充分的问题,提出基于点互信息的CLSVSM (Co-occurrence Latent Semantic Vector Space Model)和语义增强的CLSVSM.首先利用点互信息计算关键词间的语义相似性,建立基于点互信息的CLSVSM;其次,通过潜在语义分析对关键词权重的修正,构... 相似文献

14.

基于向量空间的专利类比挖掘方法

吴正李少波杨观赐《科学技术与工程》2017,17(11)

摘要：新技术在进行技术突破时,很难找到创新点和技术。针对这一难题,提出一种基于向量空间的专利类比挖掘算法。首先,从源数据中获取描述功能和属性的专利技术方案（PSC）,建立基于PSC的TF-IDF值的向量空间模型（VSM）;然后,根据专利文献间的信息距离制成基于PSC术语的专利地图;最后,分别对PSC进行创新性分析,根据分析结果用类比的思想进行新技术的创新。本文算法的时间复杂性为O((n2+n)/2),低于对比算法的O(n2)。以无线充电技术专利和无线传感技术专利文献为源数据,实验结果表明,所提出的算法比对比算法能更有效的获取更具有创新性的创新方案。相似文献

15.

基于向量的频繁项集挖掘算法研究 总被引：1，自引：0，他引：1

张文东尹金焕贾晓飞黄超苑衍梅《山东大学学报(理学版)》2011,46(3):31-34

针对Apriori算法寻找频繁项集时,需要多次扫描事务数据库和可能产生大量候选项集的问题,提出了一种向量和数组相结合的频繁项集挖掘算法。该算法不仅实现了只扫描事务数据库一次,而且避免了模式匹配,减少了无价值的候选项集的产生。通过与已有算法的比较,验证了本文算法具有较高的挖掘效率,而且数据库的项数越多,此算法的挖掘效果越明显。相似文献

16.

基于词向量和EMD距离的短文本聚类

黄栋徐博许侃林鸿飞杨志豪《山东大学学报(理学版)》2017,52(7):66-72

短文本聚类在数据挖掘中发挥着重要的作用,传统的短文本聚类模型存在维度高、数据稀疏和缺乏语义信息等问题,针对互联网短文本特征稀疏、语义存在奇异性和动态性而导致的短文本聚类性能较差的问题,提出了一种基于特征词向量的文本表示和基于特征词移动距离的短文本聚类算法。首先使用Skip-gram模型(Continuous Skip-gram Model)在大规模语料中训练得到表示特征词语义的词向量;然后利用欧式距离计算特征词相似度,引入EMD(Earth Movers Distance)来计算短文本间的相似度;最后将其应用到Kmeans聚类算法中实现短文本聚类。在3个数据集上进行的评测结果表明,效果优于传统的聚类算法。相似文献

17.

基于支持向量机的Web日志频繁岚列模式挖掘研究

陈宝国宋旸《齐齐哈尔大学学报(自然科学版)》2021,37(1):21-25

为了降低Web日志频繁序列模式挖掘误差,提出基于支持向量机的Web日志频繁序列模式挖掘方法.构建Web日志频繁序列模式检测序列,采用自相关特征分布式融合方法进行序列重组,提取序列模式的统计特征量,对其特征分布值进行信息融合.建立Web日志频繁序列模式融合式调度模型,采用支持向量机分析方法进行Web日志频繁序列模式挖掘的... 相似文献

18.

基于领域知识和词向量的词义消歧方法 总被引：3，自引：0，他引：3

杨安李素建李芸《北京大学学报(自然科学版)》2017,53(2)

利用无标注文本构建词向量模型,结合特定领域的关键词信息,提出一种词义消歧方法。以环境领域的待消歧文本作为评测语料,通过与Lesk等其他消歧方法进行比较,证明了所提方法的有效性。通过引入不同的领域知识,证明该方法亦可在其他领域的文本消歧任务中加以应用。相似文献

19.

基于向量空间的专利类比挖掘算法

《科学技术与工程》2017,(11)

新技术在进行技术突破时,很难找到创新点和方案。针对这一难题,提出一种基于向量空间的专利类比挖掘算法。首先,从源数据中获取描述功能和属性的专利技术方案(PSC),建立基于PSC的TF-IDF值的向量空间模型(VSM);然后,根据专利文献间的信息距离制成基于PSC术语的专利地图;最后,分别对PSC进行创新性分析,根据分析结果用类比的思想进行新技术的创新。本文算法的时间复杂性为O[(n~2+n)/2],低于对比算法的O(n~2)。以无线充电技术专利和无线传感技术专利文献为源数据,实验结果表明,所提出的算法比对比算法能更有效地获取更具有创新性的创新方案。相似文献

20.

基于一类支持向量机的快速人脸相似性学习

张莉卢星凝夏佩佩《浙江师范大学学报(自然科学版)》2015,(1):67-72

把一类支持向量机应用到人脸相似性学习中,提出了一种快速的人脸相似性学习方法.和标准支持向量机相比较,一类支持向量机的主要特点是只利用相似样本进行训练,减少了数据量,能快速地进行相似性学习.2个实际人脸数据库上的实验结果表明,本方法能够快速地学习到人脸相似性,其运行时间至多是支持向量机算法的三分之一. 相似文献