首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
K—means聚类算法在客户细分中的应用   总被引:2,自引:0,他引:2  
以某超市会员为研究对象,以其会员卡的消费记录为数据源,运用K-means聚类算法对该超市VIP客户进行细分,得到一个细分模型,该模型对企业营销策略的制定具有一定的辅助作用.  相似文献   

2.
随着人们对数据质量、欺诈检测、网络入侵、故障诊断、自动军事侦察等问题的关注,异常点挖掘在信息科学研究领域日益受到重视.本文首先给出异常点的定义,并在聚类分析的基础上对PAM算法、BIRCH算法、DBSCAN算法和CURE算法在算法效率、适合的数据类型、发现的聚类类型、对异常数据的敏感性、空间复杂性、时间复杂性、使用的方法等方面进行了比较研究,最后给出了如何使用这些聚类算法处理异常点的方法.  相似文献   

3.
基于最小聚类单元的商圈聚类方法研究   总被引:2,自引:0,他引:2  
根据客户群聚的特点,在分析现有聚类方法的基础上,提出了基于最小聚类单元(LeastClusterCell,简称 LCC)的商圈聚类方法.并在数据挖掘体系结构中引入LCC子系统,以利用关系数据库成熟的接口技术方便地完成 对LCC的各种操作管理.  相似文献   

4.
廖定安 《科技信息》2012,(10):117-118
当今企业信息组织结构中,存在多个数据集各自独立而又相互协作影响的情况。考虑来自多个数据集的影响,比从独立的数据集挖掘出的知识更能反映现实的数据结构。对这些数据集采用数据挖掘协作分析是很有必要的。本文提出并设计了基于聚类的信息协作分析模型。首先对信息协作分析给出定义,随后给出设计的模型,并对具体的模型分析过程进行了讨论。  相似文献   

5.
原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度.  相似文献   

6.
孙宝法 《河南科学》2004,22(5):600-604
玻译基因图是二十一世纪最重要的任务之一.人类基因草图绘制后,接下来需要寻找各种基因的精确位置,研究各种基因的功能等.为此,必须对DNA序列片段进行分类,然后归类研究。本文分别从数学、物理、化学三个角度讨论了40个人工DNA序列和182个自然DNA序列的分类问题,提出了一些设想。  相似文献   

7.
基于凝聚层次聚类的co-location模式挖掘   总被引:1,自引:0,他引:1  
空间的co-location模式代表一组空间对象的子集,它们的实例在空间中频繁地关联,它是空间数据挖掘的重要研究方向.本文首先介绍co-location模式挖掘的基本算法,然后提出一种新的挖掘算法,算法先对空间数据进行凝聚层次聚类,在聚类结果上挖掘co-location模式,最后对这种新的算法作实验评估.  相似文献   

8.
提出了双重区间值聚类的数据挖掘模型:首先将每个属性的取值按照领域知识划分为若干类。接着统计每个类在各条“交易”中出现的频率(支持度),最后再按照关联规则挖掘方法进行处理.这种区间值数据挖掘方法与传统的数据挖掘方法相比较,更有实用价值.  相似文献   

9.
在借鉴空间数据挖掘技术的基础上,定义了移动对象轨迹之间的时态距离和平均距离,提出了标准差法和置信区间法两种轨迹聚类算法。两种方法能够找出所有具有相似轨迹的对象对,在不同距离采样点数的基础上配合使用两种方法能够明显降低轨迹聚类算法的时间复杂度。基于标准差法和置信区间法的轨迹聚类算法在仿真数据集和真实数据集进行了验证。表明两种方法能够为其他轨迹聚类算法进行数据筛选,筛选后的数据量将大大减少,从而可提高算法效率。  相似文献   

10.
一种聚类挖掘软件数据的方法   总被引:1,自引:2,他引:1  
提出了一种聚类挖掘软件数据的方法。首先将一组软件数据的最可能分类情况称为“中心知识”。将该组数据的所有可能分类结果称为“知识的浮动域”,最后将“中心知识”对应分类的可信程度称为“知识的正确度”。分类结果的评价标准主要考虑到:分类数目适中,每个类内半径尽可能小,类间距离尽可能大的分类结果具有较高的评价分数。进行的“软件数据挖掘实验”结果表明,这种方法更加准确、更加切合实际。从理论和实践上证明了软件数据挖掘具有广阔的发展前景。  相似文献   

11.
随着信息爆炸时代的到来,如何有效的从网络上获取有价值的信息成为当前研究的热点.Web文本挖掘技术就是解决上述问题的一种方法,它从大量半结构化、异构的Web文档集中发现潜在的、有价值的知识.本文着力于研究Web文本挖掘过程中的重要技术,并通过分析当前研究热点和各种算法,提出一种改进的投影聚类算法,实验证明其正确率比k-均值算法高.最后,本文设计了基于Web文本挖掘的证券投资系统,并将改进的聚类算法应用其中.  相似文献   

12.
基于数据挖掘技术的移动通信行业客户细分   总被引:1,自引:0,他引:1  
利用数据挖掘中的误差平方和准则函数的K-Means聚类算法,建立了客户细分模型,为企业进一步制定营销策略提供依据.此方法已经投入运行.实践证明,该方法实用、可操作性强,对支持企业产生了积极的影响.  相似文献   

13.
一种基于层次聚类的流数据挖掘方法   总被引:1,自引:0,他引:1  
流数据的特点在于数据流快速、有序地到达,并且数据海量,许多应用领域中生成的数据都可以归结为此类型.数据挖掘技术可以从海量的数据中发现有意义的知识模型,传统的数据挖掘算法通常是针对静态数据集,对流数据却无法有效地处理.文章试图从层次聚类角度处理流数据,并探讨了一种基于最小代价函数的层次聚类算法.  相似文献   

14.
随着电信市场竞争的不断加剧,电信企业传统的营销模式正在向主动、精确营销模式转变.因此,客户划分显得至关重要.采用数据挖掘中聚类的方法对电信业的客户进行划分,在比较了现有聚类算法计算复杂度普遍较高的的基础上,采用了一种基于空间定位的方法,将客户数据对象映射到特征空间中,并利用空间立方体的某些特殊顶点定位任意数据,通过计算数据点与空间立方体顶点群的距离差异,完成聚类过程.为了适合电信业客户的特殊性质,改进对客户属性数据的处理过程.通过电信客户的数据实验结果表明,算法的时间复杂度降至 O(N) 级别.  相似文献   

15.
数据挖掘中聚类分析技术的研究与应用   总被引:1,自引:0,他引:1  
对数据挖掘中聚类分析方法的概念、功能及其算法做了深入研究,并将其应用于学生成绩数据管理,对某高职院校学生成绩进行了数据挖掘  相似文献   

16.
提出了加权的系统聚类方法.该方法通过对不同的客户特征赋予不同的权重,达到对客户的聚类结果更符合企业经营目标的目的.为分析客户特征的权重,利用线性回归挖掘企业的历史数据,得到物流企业对客户各个特征的重视程度,并把重视程度作为权重进行客户聚类.实验分析表明,与传统的系统聚类相比,加权的系统聚类方法可以发现隐藏在一般客户中的重要客户,从而使物流企业对本公司的重要客户提供优质服务.  相似文献   

17.
Web日志挖掘旨在使用数据挖掘技术从Web服务器日志文件中挖掘出有用的规律和模式,以此改进网站结构以及实现Web个性化服务。本文提出基于免疫聚类的Web日志挖掘算法,利用人工免疫系统的基本原理来进行用户聚类分析,从而发现相似客户群体、挖掘潜在客户。免疫聚类通过模拟免疫系统体液免疫应答的基本过程,提取出数据的基本特征,以此概括数据的分布特征,从而实现Web日志数据的无监督自组织聚类。通过在真实数据集上的实验证明了该算法的可行性和有效性。  相似文献   

18.
提出了一个基于移动agent和数据挖掘标准的分布式数据挖掘系统模型,该系统运用两个层次的开放式数据挖掘语言来提供良好的延伸性,基于KQML和XML的代理通信机制保证移动代理具备很好的跨平台性.系统可以有效实现对分布的、异构异质数据源的集成和访问,同时还给出了系统的响应时间模型.  相似文献   

19.
介绍了离群数据挖掘的基本概念,全面分析并总结了离群数据挖掘研究的历史与现状,以及离群数据挖掘的几类方法,并对一些典型方法进行了分析和评价,指出传统方法的优点和不足,展望了今后的研究工作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号