首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
根据数据之间的相似关系,构造了基于模糊相似关系传递闭包的聚类方法.该方法用数据之间的距离定义模糊相似关系,利用模糊关系的合成算子,构造该关系的传递闭包,该传递闭包是等价关系.以等价类为聚类.实验结果表明该聚类方法可得到与传统K-均值方法相同的聚类结果.  相似文献   

2.
模糊聚类挖掘方法在电子商务中的应用   总被引:7,自引:2,他引:5  
在分析模糊技术与聚类方法的基础上,利用模糊关系矩阵,给出了一种模糊聚类的方法,这种方法利用了模糊集合中的“最小最大”运算关系·将该方法应用到具体电子商务平台的数据挖掘工作中,得到了可行性验证,从而为此技术在电子商务领域的广泛应用起到了示范作用·  相似文献   

3.
针对文本在聚类或分类时,由于数据高维稀疏导致相似度值低的问题,提出一种基于改进文本相似度计算的聚类方法.首先,利用向量空间模型VSM表示文本,采用余弦函数计算文本之间的相似度;然后,基于网络中节点的相似性传播原理,通过设置阈值找到与各个文本相似度较大的文本集合,进而使用Jaccard系数将两个文本之间相似度计算转化为两个文本集合之间的相似度计算;最后根据得到的文本相似度矩阵,利用谱聚类算法对文本进行聚类.在WebKB上的实验结果表明,与传统的K-means、谱聚类方法相比,该方法提高了聚类的准确度,召回率与F值.  相似文献   

4.
为了在多维聚类分析中运用有效距离度量方法表征数据对象的邻近度,提出一种协方差测距(covariance distance measure analysis,CDM)算法,首先,采用模糊C均值(fuzzy c-means,FCM)方法对数据对象赋予权值,得到每个样本点相对类别特征的隶属度,再依据隶属度计算每个样本的差异度;其次,为了使类别分离最大化,用样本点同关联类别的协方差距离度量代替模糊聚类中欧式距离度量作为优化问题的第一个标准,使相似数据对象更为接近;最后,用样本点间的协方差距离度量作为第二个优化标准,使相异数据相互隔开,交替固定变量迭代计算最优解,使聚类指标和距离度量学习参数同时得到优化,获得更好的聚类结果。在不同数据集上的实验结果表明,与FCM-Sig和UNCA算法相比,CDM算法在聚类准确性和算法收敛性方面均有更好表现。  相似文献   

5.
空间聚类是空间数据挖掘和知识发现的的主要方法之一."基于模糊C均值的空间聚类方法"可以广泛地应用到对空间数据挖掘和知识发现中的分类分级研究.该方法的基奉思想是:首先,设定聚类数目和模糊度常数,并初始化各个聚类中心,每一个数据点按照一定的模糊隶属度隶属于某一聚类中心;然后,逐步进行循环迭代.改变目标函数值以及各个隶属度,并决定新一级聚类中心;最后,当日标函数收敛或者数据点的隶属度保持恒定时,就得到了输入数据的最终聚类中心,从而完成了模糊聚类划分.该文给出了该方法的实现步骤,并以实例验证了方法的可行性和科学性,取得了很好的效果.  相似文献   

6.
文章研究了利用序列模式的挖掘结果对序列数据库进行再发现的问题,提出一种利用已发现序列模式对数据库中的数据序列进行聚类的方法SPSC.该方法利用发现的序列模式定义了数据序列之间相似度函数和数据序列分组的平均值,使得经典聚类方法k-means可以应用于序列型数据,实现了对包含相似模式的数据序列进行聚类;理论分析和实验表明,与已有的序列聚类方法相比,该文所提出的方法不仅可以得到更加优化的聚类,而且效率更高.  相似文献   

7.
针对最小二乘支持向量机对训练样本内噪声比较敏感和其稀疏性差的问题,提出基于密度k-近邻向量的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据,提高支持向量机的训练精度。通过计算出每个样本类的平均相似度和平均密度,得到样本的类相似度阈值;根据相似度阈值,将小于类相似度阈值的样本进行合并,减少训练样本总数。实验结果表明,该算法在保证训练精度的情况下,减少了支持向量数目。  相似文献   

8.
为了解决传统方法不适于大规模用户访问,访问准确性差的问题,通过语义指向性匹配和多维索引树编码结合的方法,对跨境电商系统用户数据库智能访问优化方法进行研究。建立跨境电商数据库模型,为数据库智能访问提供模型依据。依据模糊层次聚类提取语义指向性关联特征,在概念格中完成语义指向性相似度计算,依据提取特征,通过相似度匹配实现数据库智能访问,针对其在用户规模较大时影响访问准确性的问题,采用多维索引树编码的方式对其进行优化,实现对跨境电商系统用户数据库智能访问方法的优化。结果表明:采用所提方法对跨境电商系统时域数据与时频数据语义指向性特征进行提取,能够完成数据语义本体特征指向性聚类,冗余干扰信息被滤除,特征分布聚类性较强;对查全率水平较高情况下的查准率进行测试,发现所提方法在查全率升高时,可令查准率保持在较高的水平,未随查全率的升高有显著下降。可见所提方法访问准确性高。  相似文献   

9.
采用基于相似度的特征聚类算法以及粗糙集模糊分析法,提出了基于网络日志的用户性格特征分析及行为预测方法.首先,构建标准性格特征向量库;然后,采用基于余弦相似度的特征聚类算法进行性格分析,该算法解决了适量样本情况下的机器学习中聚类的问题,使训练模板数据即使在数据不是足够大的情况下仍能提取特征;最后,采用基于粗糙集理论的模糊分析算法进行行为预测,该分析算法简化了分析过程,减少了建模中需考虑的因素,又能得出精确的结果.对比实验表明,该方法能较准确地分析不同用户性格特征和对其未来行为进行预判,并分析出可能对安全领域造成威胁的人群.  相似文献   

10.
将改进的蚁群聚类算法应用于Web使用挖掘中,可对Web事务进行聚类,以便了解Web用户的兴趣以及它们之间的联系,从而为用户提供个性化的服务。同时定义一个Web会话为一个带权值的多维向量,也定义了两个会话间的相似度度量。实验表明在广西大学网站抽取的会话数据集上执行蚁群聚类算法得到的聚类是稳定的。结果显示该算法执行得很好,能找到没有噪音的聚类。  相似文献   

11.
一种基于模糊C均值聚类的图像区域分割方法   总被引:2,自引:5,他引:2  
提出一种基于模糊C均值聚类的彩色图像区域分割方法。该方法首先选用适当的彩色空间对图像中的每个像素抽取颜色、纹理及空间位置等综合特征;然后,利用模糊C均值聚类方法进行聚类,利用提出的确定最佳聚类簇数的方法,确定聚类簇数、中心等参数;根据每个像素的隶属函度,将像素初步划归不同的组,利用连接原理对图像区域进一步分割,并提供了图像描述特征。实验结果表明,该方法分割效果很好。  相似文献   

12.
将改进的蚁群聚类算法应用于Web使用挖掘中,可对Web事务进行聚类,以便了解Web用户的兴趣以及它们之间的联系,从而为用户提供个性化的服务。同时定义一个Web会话为一个带权值的多维向量,也定义了两个会话间的相似度度量。实验表明在广西大学网站抽取的会话数据集上执行蚁群聚类算法得到的聚类是稳定的。结果显示该算法执行得很好,能找到没有噪音的聚类。  相似文献   

13.
基于最小二乘支持向量机的TSK模糊模型   总被引:2,自引:0,他引:2  
为了提高模糊系统处理高维问题的推广能力, 本文提出用最小二乘支持向量回归机(LSSVR)的思想设计TSK模糊模型.TSK模糊模型的传统算法普遍存在过学习问题, 为此我们在目标函数中考虑了结构风险从而避免了过学习现象.并且,我们将模糊系统的参数寻优问题转化为一个二次规划问题进行求解.由于该规划问题的求解与输入数据维数无关,适用于处理高维数据.算法分为两步:首先用Gustafsonk-Kessel (GK)算法确定模糊规则的前件;然后用最小二乘支持向量算法确定模糊规则的后件,这里的核函数是由模糊聚类确定的, 经证明它是Mercer核.三个著名数据的实验结果表明,与TSK模糊系统的传统算法相比,本文所提的算法提高了TSK模糊系统处理高维问题的推广能力;与LSSVR相比,,本文所提的算法具有良好的鲁棒性.  相似文献   

14.
针对经典支持向量机对非目标样本没有拒绝能力,且应用于说话人辨认时存在不可分区域的问题,提出一种基于模糊C均值聚类和模糊支持向量机的多级模糊说话人辨认方法。首先利用模糊C均值聚类方法对特征向量进行聚类,减少样本的数目,加快模糊支持向量机训练速度。最终由FSVM得出判决结果。并通过仿真实验验证了该方法的有效性。  相似文献   

15.
FCM算法在基因表达数据分析中存在噪声点,影响聚类结果,为此提出了一种改进的模糊核聚类算法,通过使用Mercer核把原始数据映射到高雏特征空间,并为特征空间的每个向量分配一个动态权值,分析权值的大小来识别噪声点,得到一个较为理想的聚类结果:实验结果表明,该方法比FCM聚类算法具有更好的聚类效果.  相似文献   

16.
在模糊C-均值聚类(FCM)目标函数的基础上按聚类中心分离原则增加一个聚类中心分离项来扩展FCM算法,提出基于聚类中心分离的模糊聚类模型(FCM_CCS)。该模型可使聚类过程中的聚类中心之间距离扩大,从而得到更好的聚类效果。由于该模型和FCM一样对噪声敏感我们提出它的可能性聚类模型(PCM_CCS),最后进一步扩展成它的可能性模糊聚类模型(PFCM_CCS)。基于聚类中心分离的可能性模糊聚类模型在处理噪声数据和克服一致性聚类问题方面表现出良好的性能。对数据集的测试实验结果表明了提出的PFCM_CCS能同时产生模糊隶属度和典型值,使聚类中心间距扩大,同时具有更好的聚类准确率。  相似文献   

17.
一种确定最佳聚类数的新算法   总被引:1,自引:0,他引:1  
针对K-均值聚类算法需要事先确定聚类数K的问题,将粒度计算引入样本相似度函数,定义了新的样本相似度,用模糊等价聚类确定数据集可能的最大类簇数Kmax.以Kmax为搜索上界,利用改进全局K-均值聚类算法,以BWP(Between-Within Proportion)为聚类有效性度量指标,提出确定最佳聚类数的一种新方法.通过UCI机器学习数据库数据集以及随机生成的人工模拟数据集实验测试,证明该算法不仅能有效确定数据集的最佳聚类数,而且适用于大规模数据集,但是会受到噪音点影响.  相似文献   

18.
在自适应控制最小方差自校正控制器设计中,当被控对象的数学模型未知时,可采用模糊系统代替实际系统。提出了一种新的模糊系统的聚类学习算法,根据初始聚类中心的选取原则,可以使最终获得的聚类结果是全局近优解。该方法只需计算一遍样本间的广义距离,即可完成初步的聚类,通过迭代运算可以使聚类结果得到进一步优化。仿真结果证明了自适应控制器的控制效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号