期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

梁京章黄星舒吴丽娟熊小萍《华南理工大学学报(自然科学版)》2020,48(6):143-150

为了提高电力负荷曲线聚类精度,文中提出了一种基于核主成分分析(KPCA)和改进K-means算法的电力负荷曲线聚类方法。该方法首先在划分聚类算法K-means基础上融入密度聚类思想,提出了融合密度思想的K-means算法(DK-means算法),并在电力负荷曲线实验集上对比分析其聚类效果;接着在实验集上比较各种降维算法的降维聚类精度和降维速度;最后分析KPCA+DK-means组合算法的降维聚类能力。结果表明,戴维森堡丁指数(DBI)更适合作为电力负荷曲线聚类评价指标;以DBI为评价指标,与K-means、BIRCH、DBSCAN和EnsClust 4种聚类算法相比,DK-means的聚类精度更高;与LLE、MDS、ISOMAP 3种非线性降维算法相比,KPCA的降维速度更快;KPCA+DK-means组合算法有良好的降维聚类能力,较DK-means在聚类精度和聚类效率上均有提升。KPCA+DK-means组合算法可以实现电力负荷曲线的高效降维、精确聚类,对用电行为模式的准确提取起关键技术支持作用。相似文献

2.

基于自编码器的电力负荷聚类分析

赵忠啟常喜强樊艳芳徐森樊茂《科学技术与工程》2021,21(32):13737-13743

电力负荷聚类分析研究是负荷特性模拟、需求侧管理等应用的基础。针对负荷数据日趋多样性、随机性,传统K-means算法无法有效处理高维数据,且存在人工给定聚类数目K值及随机选取初始聚类中心易收敛至局部最优的问题,本文提出一种基于自编码器(Auto-Encoder,AE)降维的电力负荷聚类方法。首先利用自编码器网络对采集的负荷数据提取特征,降低数据维度,然后通过密度权值Canopy算法对降维后的数据预聚类,得到初始聚类中心和最优聚类数目K值,将预聚类结果结合K-means算法进行聚类。算例结果表明,该方法能够有效对负荷数据进行特征提取,并减少聚类过程中的复杂度,提高了聚类结果准确度和聚类效率。相似文献

3.

基于微簇的两阶段高维数据流聚类算法

韦洁华韦春妙《西南师范大学学报(自然科学版)》2018,(7)

提出了一种基于微簇的两阶段高维数据流聚类算法.首先,对新到达的数据进行降维处理,使用改进的线性判别分析方法获得一个局部投影子空间;然后,在子空间内最大化流入数据近邻微簇之间的距离;最终,将流入数据划分到投影空间的微簇中.基于高维数据流的实验结果显示,本算法的分类性能优于其他的数据流聚类算法,并且具有较低的计算复杂度. 相似文献

4.

基于类内和类间距离的粗粒度并行AP聚类算法

张素智杨芮陈小妮李鹏辉《华中师范大学学报(自然科学版)》2018,52(6):781-787

近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因此具有快速高效的优点,然而在处理高维复杂数据集时存在随着聚类效率提升而准确度不高的问题.为改善AP聚类算法的效率和精度,提出基于类内和类间距离的粗粒度并行AP聚类算法——IOCAP.首先引入粒度思想将初始数据集划分成多个子集;其次对各子集结合类内和类间距离进行相似度矩阵的改进计算,最后基于MapReduce模型实现改进后的并行AP聚类.在真实数据集上的实验表明,IOCAP算法在大数据集上有较好的适应性,能在保持AP聚类效果的同时有效地提升算法精度. 相似文献

5.

基于局部线性嵌入的半监督仿射传播聚类算法 总被引：1，自引：0，他引：1

赵小强谢亚萍《兰州理工大学学报》2015,41(1)

针对运用半监督仿射传播聚类算法处理高维数据时聚类精度低和计算量大的问题,提出一种基于局部线性嵌入的半监督仿射传播聚类算法.该算法首先通过LLE算法将高维输入数据集映射到低维空间得到低维数据集,计算低维数据集的相似度矩阵,再用半监督算法调整相似度矩阵,最后用仿射传播聚类算法对低维数据进行聚类分析.仿真结果表明,本文提出的算法与半监督仿射传播聚类算法相比,在处理高维数据时聚类效果更好,精度更高,迭代次数更少. 相似文献

6.

拉普拉斯矩阵在聚类中的应用

刘颖张艳邦《天津科技大学学报》2019,(3)

高维数据受冗余数据和噪声数据的影响,聚类效率和准确率低,基于拉普拉斯矩阵的特征值和特征向量的特点,介绍了一种适用于高维数据的新的聚类中心选择算法,算法将拉普拉斯矩阵用于候选聚类中心选择前的数据降维处理,经过对数据进行降维处理,提高了候选聚类中心的准确性,增大了聚类准确率,扩大了聚类数据的种类范围.在10个包含不同数量样本、维度、类别数的数据集上进行了聚类分析,实验结果表明了基于拉普拉斯降维的新聚类中心选择方法的有效性. 相似文献

7.

基于属性重要性的Web文本聚类研究

贾丙静王传安王亚军吴长勤《渝西学院学报(自然科学版)》2011,(3):49-51

Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间. 相似文献

8.

聚类数据挖掘可视化模型方法与技术

下载免费PDF全文

谢庆华张宁蓉宋以胜王海波岳振军《解放军理工大学学报(自然科学版)》2015,(1):7-15

面向通用数据资源,研究聚类数据可视化方法与技术,旨在探索有效的数据处理方法,满足信息领域对高维数据处理的要求。通过对高维数据进行降维处理和可视化映射实现,建立K均值算法的聚类数据挖掘可视化系统模型,实现中间聚簇结果、聚类中心、收敛准则函数值三类要素的可视化。利用加利福利亚大学欧文分校(UCI)数据库中的Iris数据集、Wine数据集、Seeds数据集对可视化系统模型方法进行测试。结果表明,该模型实现了对数据集的有效聚类,能够将中间聚类、聚类中心、收敛准则函数值进行实时有效的可视化表达,达到了预期效果。相似文献

9.

Isomap在基因表达谱数据聚类分析中的应用 总被引：8，自引：0，他引：8

袁远季星来孙之荣李衍达《清华大学学报(自然科学版)》2004,44(9):1286-1289

基因表达谱数据的聚类分析对于研究基因功能和基因调控机制有重要意义。基于非线性降维算法等容特征映射 ,提出了一种新的大规模基因表达谱数据聚类算法 ,该方法改进了样本向量之间的距离度量 ,用测地距离代替传统的欧式距离 ,有助于挖掘高维数据内在的几何结构。将该算法应用于两个公开的基因表达数据集 ,并用一种新的评价方法Normalized Cut将聚类结果与其他聚类方法的结果进行了比较。结果表明 ,该文的聚类算法优于其他聚类算法 ,聚类结果具有明显的生物学意义 ,并能对数据的类别数作出较好的预测和评估相似文献

10.

基于属性重要性的Web文本聚类研究

贾丙静王传安王亚军吴长勤《重庆文理学院学报(自然科学版)》2011,30(3)

Web文本聚类是一种典型的无指导机器学习技术,目标是将站点上采集到的Web文本分成若干簇,使同一簇内的文本相似性最大,不同簇间的文本相似性最小.为了对原始粗糙的Web文本数据进行降维处理,在知识属性值的基础上,计算单个属性相对于属性集的重要性量化值,并根据属性重要性量化值对特征向量降维,并采用K-means算法对降维后的数据聚类,实验证明该方法缩短了聚类时间. 相似文献

11.

无线传感器网络可分负载调度算法 总被引：1，自引：0，他引：1

代亮许宏科陈婷《西安交通大学学报》2012,46(6):23-28

为了节省传感器节点能量,提高网络资源利用率,提出了一种无线传感器网络可分负载调度(DLSW)算法.DLSW算法以LEACH协议为基础,分群内和群间两阶段进行任务调度.在群内调度阶段,群内节点共享同一信道,相继向群首发送数据;在群间调度阶段,群首节点和SINK节点之间独立的信道使得群首将群内节点报告的数据融合后,并行向SINK节点传送结果,同时完成数据发送.DLSW算法通过去除节点间的通信干扰使得总任务完成时间减少、资源利用率提高.实验结果表明,在大规模的网络环境下,DLSW算法可以使总任务完成时间减少20％,网络能耗减少10％. 相似文献

12.

基于密度的全局K-means算法的改进

徐娟范菁陈楚天曲金帅《云南民族大学学报(自然科学版)》2019,(2):160-164

针对全局K-means聚类算法和快速全局K-means聚类算法在选择下一簇的聚类中心点时,需要逐一计算数据集中每个点作为备选聚类中心点时的簇内平方误差函数,而数据集中存在很多不可能作为备选点的噪声点.为剔除噪声点,提出了一种基于高密度数的DGK-means算法,并通过UCI数据库中的4组数据集进行实验测试.验证了在聚类效果稳定的前提下,改进的DGK-means算法比全局K-means算法和快速全局K-means算法,聚类用时更短,聚类效率更高. 相似文献

13.

Automatic Spike Sorting Based on Robust Clustering

丁伟东袁景淇《东华大学学报(英文版)》2008,25(3):273-276

The collected spikes from extracellular recordings usually contain noisy data and outliers, which make it difficult to separate them. A method for spike sorting based on robust clustering is proposed to deal with the problem. The clustering method combines the advantage of fuzzy clustering and robust statistical estimators. The number of dusters is obtained by fuzzy cluster validity. In order to reduce the influence of outliers, the validity index is calculated using the weighting intra-cluster distances. The proposed method is suitable to separate neural spikes in the presence of noisy data and outfiers. The experiment on real data shows its performance. 相似文献

14.

A novel hybrid CDL-based multipath propagation model for the high-speed railway at 2.35 GHz

Jiahui Qiu Cheng Tao Liu Liu Zihuai Lin Zhenhui Tan 《科学通报(英文版)》2014,59(35):4976-4987

In this study, based on the actual channel measurements of the high-speed railway （HSR） in a via- duct scenario at 2.35 GHz, a hybrid cluster delay line （CDL） channel modeling technology which combines a statistical model and a theoretical model is proposed. This novel channel-characterization approach is used to reveal the statistical properties for ＂random＂ scattering and to provide a geometric mechanism for computing the time- variant paths for ＂periodically moving＂ scattering. Using a modified clustering algorithm in the delay domain, the inter-cluster and intra-cluster characteristics against the distance between the transmitter and the receiver were extracted and analyzed. In addition, the measurement results were compared with some conclusions from other measurement studies, and the proposed channel model was validated by comparing the simulated results with the measurement data. The study results provide a useful technique for the evaluation and verification of wireless communications in the HSR environment. 相似文献

15.

核k-凝聚聚类算法

王宇李晓利《大连理工大学学报》2007,47(5):763-766

为解决k-means聚类算法和k-凝聚聚类算法对于非凸形状数据聚类正确率低和模糊核聚类算法(FKCM)收敛速度慢的问题,将k-凝聚聚类算法与核函数方法相结合,在高维特征空间构造了新的核聚类算法--核k-凝聚聚类算法,实现了k-凝聚聚类算法的核化.通过Matlab编程进行数值实验,证明了核k-凝聚聚类算法在聚类的准确性、稳定性、健壮性等方面较之k-means聚类算法、k-凝聚聚类算法和FKCM有一定程度的改进. 相似文献

16.

一个基于k-means算法的聚类

陈勇陈健《东莞理工学院学报》2010,17(3):27-31

用k-means算法对二维数据进行聚类分析,并用C#语言实现了该算法。先按照样本点的距离进行初始划分,然后再按照各样本点和初始中点的距离远近进行聚类。结果表明,k-means算法对二维数据的聚类是有效的,实现该算法的程序对二维数据的聚类具有通用性。相似文献

17.

一种基于QoS的LEACH改进算法

下载免费PDF全文

杨海俊李鲁群《上海师范大学学报(自然科学版)》2016,45(5):527-535

改进了经典分簇算法LEACH,提出了QBL(QoS-based LEACH)算法,以节约能耗为主要目标,旨在延长网络寿命、减小时延、提高网络可靠性.首先在簇头竞争时采用了新的权重计算方法,其次采用了不均匀分簇的策略,此外簇内只安排部分成员完成监测任务,并在簇间通信时采用基于权重的最短路径方法.仿真实验证明:QBL算法在分簇情况、网络寿命、时延、可靠性方面均有较为突出的表现. 相似文献

18.

基于马氏距离的模糊聚类优化算法——KM-FCM

下载免费PDF全文

祖志文李秦《河北科技大学学报》2018,39(2):159-165

为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚类精度比FCM,FCM-M,M-FCM高,对高维数据聚类识别能力强,具有全局优化作用,并且聚类个数无需提前设定。新算法可为基于马氏距离的模糊聚类算法的优化提供参考。相似文献

19.

一种增量式MinMax k-Means聚类算法

胡雅婷陈营华宝音巴特曲福恒李卓识《吉林大学学报(理学版)》2021,59(5):1205-1211

针对MinMax k-means算法易产生空解、收敛速度慢和计算效率低的问题, 提出一种增量式MinMax k-means聚类算法. 该算法从给定的初始聚类个数开始, 以固定步长递增式产生新的聚类中心, 采用基于数据均衡的快速分裂方法产生增量聚类中心, 从而避免了传统增量聚类中心选择中遍历数据、k-means聚类算法运行次数过多导致的大计算量问题. 与MinMax k-means及相关算法的对比实验结果表明, 该算法在计算效率和求解精度上均优于对比算法, 有效改善了MinMax k-means聚类对初始化中心敏感和易产生空解的问题. 相似文献