共查询到18条相似文献,搜索用时 93 毫秒
1.
在数据挖掘领域,聚类用于发现数据的分布模式和数据间的相互关系.作者提出一种分层聚类算法,可识大规模、高维数据.该算法首先从不同的角度对电信客户进行聚类或分类,然后以这些聚类为基础,实行自底向上的层次聚类得到最终的聚类结果.算法执行效率高,适合大规模数据的聚类问题.该方法在某电信企业的客户分析中取得了较好的结果. 相似文献
2.
一种基于加权Parzen窗的聚类算法 总被引:1,自引:0,他引:1
提出了一种新的基于加权Parzen窗的无监督学习方法 .该方法采用加权Parzen窗获得对数据分布状态的良好描述 ,从而求出不同模式类的分界面 ,并将聚类过程转变为求解加权Parzen窗权值的线性规划问题 .实验表明 ,采用这一方法只需较少的计算时间就可以获得与Asa等人基于支持向量机的方法类似的聚类结果 . 相似文献
3.
一种广义加权模糊聚类算法 总被引:2,自引:0,他引:2
提出了一种广义的加权模糊聚类新算法来处理具有不同特征贡献和不同数据分布的混合属性数据.分别利用样本概率密度思想和ReliefF算法为每一个样本和每一维特征分配权值,通过样本和特征的加权,将模糊c均值算法、模糊c-modes算法、模糊c-原型算法以及样本加权聚类算法统一为一个通用的框架.不同测试数据集的实验结果证明,这种广义的模糊聚类新算法对于处理不同分布以及具有不同特征贡献的大数据集是相当有效的. 相似文献
4.
一种新的密度加权粗糙K-均值聚类算法 总被引:1,自引:0,他引:1
为了克服粗糙K-均值聚类算法初始聚类中心点随机选取,以及样本密度函数定义所存在的缺陷,基于数据对象所在区域的样本点密集程度,定义了新的样本密度函数,选择相互距离最远的K个高密度样本点作为初始聚类中心,克服了现有粗糙K-均值聚类算法的初始中心随机选取的缺点,从而使得聚类结果更接近于全局最优解。同时在类均值计算中,对每个样本根据定义的密度赋以不同的权重,得到不受噪音点影响的更合理的质心。利用UCI机器学习数据库的6组数据集,以及随机生成的带有噪音点的人工模拟数据集进行测试,证明本文算法具有更好的聚类效果,而且对噪音数据有很强的抗干扰性能。 相似文献
5.
在传统层次聚类基础上,提出并实现了一种基于距离的增量式聚类算法,并应用于粮食智能决策支持系统中,算法在保持层次聚类优点的基础上,利用原有的聚类结果提高聚类速度,并可以根据用户需要在聚类精度和聚类速度两方面选取一个适当的平衡点,有效地提高聚类分析的效率。 相似文献
6.
一种聚类挖掘软件数据的方法 总被引:1,自引:2,他引:1
提出了一种聚类挖掘软件数据的方法。首先将一组软件数据的最可能分类情况称为“中心知识”。将该组数据的所有可能分类结果称为“知识的浮动域”,最后将“中心知识”对应分类的可信程度称为“知识的正确度”。分类结果的评价标准主要考虑到:分类数目适中,每个类内半径尽可能小,类间距离尽可能大的分类结果具有较高的评价分数。进行的“软件数据挖掘实验”结果表明,这种方法更加准确、更加切合实际。从理论和实践上证明了软件数据挖掘具有广阔的发展前景。 相似文献
7.
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高.针对这个不足,提出一种特征加权的K-means算法进行优化.首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其... 相似文献
8.
聚类算法作为一种重要的数据挖掘的方法,能找到样本中相对集中的区域。本文分析了一些常用聚类算法以及局限性,并且针对K-means算法中初始点的选择,讨论了一种改进的K-means算法的实现过程,以期得到比较理想的聚类效果。 相似文献
9.
10.
一种基于层次聚类的流数据挖掘方法 总被引:1,自引:0,他引:1
单劲松 《太原师范学院学报(自然科学版)》2008,7(4):72-74
流数据的特点在于数据流快速、有序地到达,并且数据海量,许多应用领域中生成的数据都可以归结为此类型.数据挖掘技术可以从海量的数据中发现有意义的知识模型,传统的数据挖掘算法通常是针对静态数据集,对流数据却无法有效地处理.文章试图从层次聚类角度处理流数据,并探讨了一种基于最小代价函数的层次聚类算法. 相似文献
11.
针对 Web应用挖掘中聚类算法中的问题 ,提出加权 Web访问模式聚类算法 .该算法利用服务器日志库中保存的网页访问次数信息 ,提高了聚类的客观性和准确性 . 相似文献
12.
王显明 《贵州大学学报(自然科学版)》2009,26(6):104-107
资费套餐体系是电信运营商核心竞争力之一,首先分析移动运营商现行资费套餐存在的问题,然后运用数据挖掘中的聚类分析方法,通过对移动经营分析系统中真实的客户通信数据的挖掘,建立客户消费需求细分模型,最后结合资费设计原则和移动运营策略,研究分析提出了一整套全新的移动资费体系,提高了客户满意度、移动运营商的竞争力和经营效益。 相似文献
13.
在样条回归的基础上,提出了适用于非单调数据的广义样条带权回归方法,经我校区用电量实例计算验证,比广义线性、多项式逐步和传统样条回归方法的效果显著 相似文献
14.
随着电信市场竞争的不断加剧,电信企业传统的营销模式正在向主动、精确营销模式转变.因此,客户划分显得至关重要.采用数据挖掘中聚类的方法对电信业的客户进行划分,在比较了现有聚类算法计算复杂度普遍较高的的基础上,采用了一种基于空间定位的方法,将客户数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任意数据,通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程.为了适合电信业客户的特殊性质,改进对客户属性数据的处理过程.通过电信客户的数据实验结果表明,算法的时间复杂度降至 O(N) 级别. 相似文献
15.
耿悦敏 《五邑大学学报(自然科学版)》2008,22(1):63-67
针对各种单一的传统预测方法中存在的问题,提出了一种基于最优加权的组合预测方法.根据珠江三角洲天河水文站的水位预测要求,运用最优加权法建立了多元线性回归、灰色系统GM(1,1)和BP神经网络的组合模型.实验结果表明,组合预测方法比各单一模型有更高的预测精度. 相似文献
16.
数据挖掘中聚类分析技术的研究与应用 总被引:1,自引:0,他引:1
刘艳霞 《科技情报开发与经济》2008,18(6):156-157
对数据挖掘中聚类分析方法的概念、功能及其算法做了深入研究,并将其应用于学生成绩数据管理,对某高职院校学生成绩进行了数据挖掘 相似文献
17.
关联规则挖掘方法是数据挖掘领域的一个研究热点。主要探讨了数值型关联规则挖掘方法,介绍了数值型关联规则挖掘在客户关系管理中的应用。 相似文献