首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对目前城市功能区划分大多依靠人工完成,且未充分使用城市中时空数据的问题,提出一种基于时空语义挖掘的城市功能区识别方案.首先,选取某城市矩形区域为研究样本,并以建筑物为划分依据将研究样本划分为有效的基础区域;然后,对各基础区域内的新浪微博位置签到数据及POI(Points of Interest)数据进行时空语义挖掘,采用狄利克雷多项式回归(DMR)主题模型生成区域的功能性向量;最后,通过向量聚类,依据POI类别比例完成区域的功能性识别.实验结果表明,本方案相比基于POI密度的k-means聚类方案和基于潜在狄利克雷分布(LDA)主题模型的城市功能区识别方法具有更高的准确性,位置签到数据所表征出的人们活动模式可以揭示城市功能区之间的差异,在城市地理空间分析上具有良好的效果.  相似文献   

2.
为了分析交叉口车辆运行轨迹的规律性, 提高环形交叉口交织段的通行能力, 提出基于时空相似系数的环形交叉口车辆轨迹聚类方法。 针对规定区域车辆轨迹, 分析车辆轨迹时空信息并计算得到时空相似系数, 同时采用谱聚类进行聚类, 将交叉口区域内一段时间内的轨迹聚类情况进行可视化展示。 经过实例验证, 所提出的方法能够有效地约简数据, 并可提取出轨迹信息中的潜在规律, 为进一步的决策工作提供一定的参考价值。  相似文献   

3.
将数字图像处理中模糊锐化算子与三支聚类进行结合,提出了一种基于图像处理的三支聚类算法。该算法通过逆多元二次核函数将数据集的密度量化为灰度值,对数据总体采用模糊与锐化操作,提取锐化后灰度值较高的数据区域,将低密度区域从原始数据中删除。对灰度值较高的数据采用传统的聚类算法得到不同的类簇,然后对每个类簇利用图像模糊算子得到类簇的核心域,锐化算子得到类簇数据边界域,从而获得每个类簇的三支表示。试验采用不同的UCI数据集,通过比较聚类指标Adjusted Rand Index(ARI),Normalized Mutual Information(NMI)和Adjusted Mutual Information(AMI),验证了该聚类算法的有效性。  相似文献   

4.
一种基于数据流聚类的动态目标分群框架   总被引:1,自引:0,他引:1  
为了解决动态目标分群问题,提出了一种基于数据流聚类的动态目标分群框架.该框架分为在线和离线两部分.在线部分采用临时存储结构和金字塔时间框架保存侦察数据集的概要信息;离线部分采用CNM算法对时间框架的信息进行聚类,最终得到分群结果.实验表明,该框架具有灵活的精度和效率平衡性,能够较好地满足决策辅助系统处理实时信息的需要.  相似文献   

5.
城市交通仿真是智能交通系统领域内的核心技术之一,其基础在于实时交通数据的采集和分析整理.而城市实时交通数据包括静态信息和动态数据,需要将多源数据进行融合并对数据进行分析和挖掘,提取交通特征.提出了一种基于聚类集成的多目标聚类分析框架.同时在此框架下,提出了一个启发式的聚类算法k-WANMI,进行快速有效的聚类分析.实验结果表明,提出的方法有效的满足多数据源的应用需求,提出的框架和算法能够处理混合数据、处理具有不同权重的属性并且能够进行多目标分析.  相似文献   

6.
针对复杂场景中分割人体不准确的问题,提出了一种在图论优化框架中联合RGB-D信息和骨架信息的人体分割算法.首先,采用边缘引导的滤波算法修复低质量的深度图,得到高质量的深度图;然后通过一种聚类算法对RGB-D数据进行聚类得到超像素;最后在图模型中将超像素看作节点,并结合相应的人体骨架来提高区分人体和背景相似颜色区域的能力,设计能量函数各组成项,最小化能量函数得到全局最佳的融合结果.为验证算法的有效性,在实际场景数据集上与多种算法进行比较.实验结果表明,在主观视觉和客观指标上,本文提出的算法均得到了更为准确的人体分割结果.  相似文献   

7.
针对在识别框架不确定时基本概率分配(BBA)生成困难的问题,提出一种基于聚类特征的基本概率分配生成方法,以减弱对样本长度的依赖性,并分析2种情况下的BBA生成。在框架未知时,通过聚类分析获得各个类别的聚类特征,建立样本属性的聚类特征区间模型;在框架已知时,获取聚类特征,建立样本属性的聚类特征区间模型;然后用各个区间模型之间的距离表示样本属性之间的差异,在此基础上建立了一种相似度的度量方法;最后对相似度进行归一化得到BBA。采用Iris数据集和Wine数据集的实验结果表明:所提方法对样本长度敏感程度低,对Wine数据集的一个类的分类结果达到100%。将该方法应用于某煤化工企业压缩机组子系统状态监测信息数据集,实现了监测信息状态的识别。  相似文献   

8.
利用核密度估计的非参数检验特性,提出了一种基于核密度估计的Kmeans改进算法KernelKmeans.该算法综合了基于划分的聚类思想以及基于密度的聚类思想,首先由核密度估计算法计算样本点的密度分布,然后对密度分布栅格进行窗口计算并取极大值来初步确定聚类中心以及聚类数量,最后将聚类中心和聚类数量作为参数输入Kmeans算法得到聚类结果.以OpenStreetMap发布的京津冀城市群点数据开展实验研究,采用算法运算时间与轮廓系数为验证指标,与Kmeans算法、极大极小改进Kmeans算法进行了对比验证,结果表明Kernel-Kmeans算法的精度高于后两者.  相似文献   

9.
针对用电数据量大、用电数据挖掘效率低等问题,采用理论分析和实验的方法,进行用电数据并行分析构架的研究,研究了Canopy和K-means两种典型的聚类算法,提出一种新的聚类思路,使用Canopy先对用电数据进行粗略处理,得到聚类个数和聚类中心,再用K-means精确聚类,既利用了K-means算法简单、收敛速度快的优势,又使其不容易陷入局部最优.为达到处理海量数据的目的,把提出的算法部署到MapReduce框架上进行实验.研究结果表明:提出的算法在海量用电数据的处理方面高效可行,并且具有良好的加速比.  相似文献   

10.
非平衡数据集是指数据集中的某类样本数量远大于其他样本的数量。对于此类数据,类分布的不平衡会直接导致很多分类算法的失效。文中基于K-means聚类,Silhouette指标和M-近邻下采样提出一种新的数据平衡方法(K-S-M)。该方法首先用K-means算法对多数类样本进行多次聚类并选取最优聚类个数,然后采用M-近邻下采样对聚类后的数据进行采样,将采样后的点最终构成平衡数据,并对得到的平衡数据进行癫痫性发作的自动检测。实验结果表明,文中所提方法可以很好地处理非平衡数据,减少数据信息损失,同时可以提高非平衡数据分类的有效性。  相似文献   

11.
一种基于密度的启发性群体智能聚类算法   总被引:3,自引:0,他引:3  
提出一种基于密度的启发性群体智能聚类算法.针对以往群体智能聚类算法中分类错误率较高、算法运行时间较长等不足,提出记忆体方法和基于密度的先行(look ahead)策略.用人工数据集和真实数据集进行实验,将实验结果进行比较分析.分析结果表明,基于密度的启发性群体智能聚类算法能够得到令人满意的聚类结果,其分类错误率和运行时间明显小于其它聚类算法.  相似文献   

12.
多源时空轨迹数据隐含丰富的城市出行信息,通过对其进行挖掘、处理和分析,可以找到个体与群体之间的交互关系。针对轨迹数据挖掘研究范围单一,缺少多空间尺度研究的问题,提出一种融合多空间尺度特征的出行轨迹数据挖掘分析方法。以广东为例,结合社交媒体腾讯用户密度(Tencent user density, TUD)数据集,通过具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise, DBSCAN)聚类算法与局部密度峰值计算法提取时空相似性轨迹区域,进而簇类分成一系列热点区域,获得不同时间粒度、不同空间尺度下的出行轨迹规律特征。这能够实现在不同空间尺度融合下展示同一地区的热点区域,进一步探讨出行轨迹的规律变化。可见所提出的方法为利用时空大数据进行城市空间结构研究提供科学参考。  相似文献   

13.
【目的】将人工智能领域的技术应用于网贷平台风险识别,提出了一种用于P2P网贷平台的风险评估模型,为网贷平台的风险划分提供决策支持。【方法】通过因子分析提取因子指标,进而利用K-means聚类算法对基于因子指标变化后的网贷平台运营数据进行聚类簇的划分,最终通过聚类结果对P2P网贷平台的风险进行划分。【结果】在获取真实网贷数据之后,采用皮尔森相关系数对平台指标进行影响指标的划分,随后使用因子分析将影响指标转化为因子指标,并在因子指标的基础上采用K-means算法对数据进行聚类分析。【结论】实验结果表明,因子分析聚类方法所得到的分析结果更为符合网贷数据所对应公司产品的实际情况,所得结论符合金融领域的实际情况,其聚类结果对网贷平台的风险评估和风险预测具有指导性的意义。  相似文献   

14.
提出基于知识图谱和数据驱动的电影分类推荐方法;首先基于数据驱动爬取互联网中的电影数据并进行去重及清洗,然后采用知识图谱将电影数据与用户情感偏好数据进行关联,对海量的数据信息进行中心聚类,并在数据聚类的过程中计算投影向量得到相似度矩阵,最后查询相似度值并计算分类推荐指标权重得到最终的电影推荐清单.  相似文献   

15.
通过检测图像局部噪声水平的不一致性,提出一种图像拼接篡改区域的定位方法.首先,用改进的简单线性迭代聚类(SLIC)超像素分割算法将待检测图像分割成具有相似特征的像素块;然后,采用基于主成分分析的噪声水平估计方法计算每个图像块的局部噪声水平;最后,利用3种聚类算法对估算的噪声水平进行聚类,根据聚类结果定位出被篡改的区域.实验结果表明:文中方法不仅能有效定位被篡改的区域,而且能保留检测区域更多的边缘信息.  相似文献   

16.
近年来,聚类作为机器学习、数据挖掘等领域的基本问题受到广泛的关注及研究,然而数据中普遍存在的噪声和异常值严重影响聚类结果.提出一个基于相关熵和流形正则化的聚类框架CRNMF(Correntropy and Manifold Regularization Non-Negative Matrix Factorization).首先,采用基于相关熵的非负矩阵分解(Non-Negative Matrix Factorization,NMF)作为损失函数来抑制非高斯噪声和异常值的影响;其次,充分考虑数据的结构信息,采用流形正则化学习数据的局部结构,并通过l2,1-范数对非负矩阵进行稀疏约束;最后,利用半二次优化技术(Half-Quadratic Optimization Technique,HQ)进行优化,并分析了收敛性和计算复杂度.在五个图像数据集上进行测试,实验结果表明,提出的框架在图像聚类任务中具有较好的有效性和鲁棒性.  相似文献   

17.
基于大数据技术准确把握配电网负荷发展态势将为精细化规划提供依据,解决城区供电分区混乱问题.本研究提出城市负荷空间分布的聚类感知方法,首先开展用户信息收集筛选建立样本数据集,采用基于密度峰值的快速聚类算法,以各电力用户样本点的局部密度和样本间距为指标进行聚类,聚类所得群簇对应于一定容量变电站供电分区的负荷分布,以聚类群簇作为基本单元,分析群簇属性指标包括群簇簇头空间坐标、群簇负荷总量、群簇负荷密度、群簇用户总数、群簇最大半径、群簇平均半径等,建立以群簇属性为要素的城市电力负荷态势感知模型,在特定的时间和空间对城市电力负荷群簇进行分析以准确把握城市发展态势;最后以某城市供电网格为例,验证所提方法有效性.  相似文献   

18.
一种基于半监督降维的聚类算法   总被引:1,自引:1,他引:0  
半监督聚类通过利用少量有标号样本或成对约束等监督信息来提高聚类性能.在此提出一种新颖的基于半监督降维的聚类算法,首先用半监督降维方法对原始数据进行降维,然后在降维后的空间中进行半监督聚类.由于在降维和聚类两个阶段中都利用了监督信息,从而使得算法的聚类性能得到进一步提升.在UCI标准数据集、yale人脸库以及文本数据集上的实验结果验证了该算法的有效性.  相似文献   

19.
丰富的居民出行行为信息对挖掘城市热点区域以及居民出行模式有很大的帮助,并且对更好地满足居民出行需求也有一定的启示作用.最新的相关研究主要聚焦于城市中区域之间的空间移动模式,但并不能识别移动模式发生的时间以及持续的时长.针对这一问题,提出具有时空特性的区域移动模式挖掘算法STMPZ(Spatio-Temporal based Movement Patterns between Zones).该算法在DBSCAN(Density-based Spatial Clustering of Applications with Noise)算法的基础上,通过将对象从点扩展成一条出行OD(Origin-Destination)记录,并引入时间特性,最终可以挖掘出具有时空特性的区域移动模式.为了验证所提出算法的可行性和有效性,利用真实的上海地铁通勤数据集进行实验,实验结果表明,该算法可以快速有效地检测出具有高覆盖率和准确率的区域移动模式.此外,该算法也可以通过修改聚类过程的参数应用于其他区域或类型的交通数据.  相似文献   

20.
提出了一种基于聚类的时空关联规则的公交犯罪挖掘算法.针对某市一个区的110报警数据库中的大量业务信息进行分析.首先,通过文本挖掘技术从案情信息中提取时间、地点等信息,并利用高德地图API的地理编码服务和POI搜索功能对提取的地址信息进行地址匹配,提取受害人上下车站点、乘坐公交线路等信息.其次,对提取得到的时空数据进行归并处理.最后,根据案发时段、季节以及是否节假日进行聚类分析,然后在簇内进行时空关联规则分析.这种挖掘方法具有以下特点:①在聚类基础上进行关联规则分析,减少扫描数据库次数,大大缩小数据扫描范围,提高算法效率,更加适合海量犯罪数据的挖掘.②聚类后簇内数据具有相似性,特征更加明显,在此基础上进行关联规则分析产生较小的频繁项集,并且提取出置信度较高的规则.③考虑犯罪行为的时空特性,挖掘过程中同时考虑了案发季节、是否节假日等因素.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号