首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
基于LSI和自组织神经网络的高效文本聚类方法   总被引:4,自引:0,他引:4  
根据隐含语义索引(LSI)理论和动态自组织映射神经网络理论,提出了一种文本聚类的新方法.应用动态自组织映射神经网络来实现文本聚类,不必预先给定聚类个数,可以在任意合适的位置生成一个新的类,具有聚类灵活和精度高等特点,对于高维的文本特征向量来说,聚类速度很低;该方法应用LSI理论来建立文本集的向量空间模型,在词条的权重中引入了语义关系,消减了原词条矩阵中包含的"噪声"因素,从而更加突出了词和文本之间的语义关系.通过奇异值分解(SVD),有效地降低了向量空间的维数,克服了自组织神经网络的聚类缺陷,提高了文本聚类的精度和速度.  相似文献   

2.
通过研究基于距离的孤立点发现算法(Cell-Based),指出其存在的问题,提出了一种基于核映射空间距离的入侵检测算法.该算法通过检测孤立点的方法进行入侵检测,首先将样本通过核函数映射到高维特征空间,重新定义特征空间中的数据点之间的距离.然后经过初始聚类算法确定聚类数目和初始类中心,再通过迭代优化目标函数来实现数据点的再聚类,最终得到聚类中心,超出聚类中心点半径r外的点即为孤立点.试验结果表明,该算法能有效突出样本之间的差异,克服传统基于距离的孤立点发现算法易随参数变化而需调整单元结构的缺点,且具有更准确的检测率和较快的收敛速度.  相似文献   

3.
多级自组织映射用于心电信号QRS波群聚类   总被引:1,自引:0,他引:1  
提出了一种利用多级自组织映射(MSOM)网络进行心电QRS波群聚类的算法。此方法将归一化的两导联心电数据作为第一层自组织映射网络的输入,其输出作为第二层自组织映射的输入,最后得到聚类结果。网络迭代学习过程采用了特殊的设计,能根据不同类别自适应调整学习参数,从而提高了自组织映射的聚类能力。使用MIT-BIH数据库数据的聚类结果表明,这种方法非常适合心电QRS波群的聚类,对室性早搏(PVC)真阳性检出率达到99.1%,且聚类效率比ART-2网络方法、匹配方法有明显优势。  相似文献   

4.
一种改进的SOFM聚类算法研究   总被引:2,自引:0,他引:2       下载免费PDF全文
针对常规SOFM(self-organizing feature map)无监督的神经网络,提出了一种改进的自组织特征映射SOFM神经网络算法。在常规SOFM网络数据聚类算法基础上,分析了其在实际应用中存在的不足,对初始权值设定以及邻域范围选择等方面进行了算法的优化和改进,进而提高了SOFM神经网络聚类算法的正确率、收敛速度和实时性,并利用仿真实验进一步对提出的改进算法进行了验证。  相似文献   

5.
图像分割的谱聚类集成算法   总被引:2,自引:2,他引:0  
针对谱聚类算法对尺度参数敏感的问题,利用集成学习算法良好的鲁棒性和泛化能力,提出了一种无监督集成学习算法——谱聚类集成算法.该算法先利用谱聚类的内在特性产生集成学习所需的多个聚类个体,再采用Hungarian算法对生成的聚类个体进行重新标记,计算每个样本点关于每一个类别所占的比例,得到一个成分向量,然后运用对数比变换将所得的成分向量映射到另一个空间,去除成分数据的不适定性,最后对映射后的数据进行聚类,从而得到最终的集成结果.通过对UCI数据集和纹理图像的仿真实验表明,所提算法的聚类准确率与常用的共识函数具有一定的可比性,且运算代价较小,所需时间大约为MCLA算法的一半,同时避免了精确选择谱聚类算法的尺度参数.  相似文献   

6.
针对传统生物地理优化算法(bio-geographic optimization algorithm,BBO)的种群随机初始策略会降低聚类算法性能的问题,提出了一种基于自组织映射算法(self-organization feature map,SOM)和BBO的混合聚类算法(improved SOM and bio-geography optimization,ISOMBBO),通过优化初始化神经元权值的方法改进SOM算法,然后以改进的SOM来计算数据聚类的初始簇中心,最后在BBO优化框架下进行数据簇结构的寻优.在4个标准数据集(Iris、Wine、Glass与Diabetes)的实验中,实验结果表明该算法不仅提高聚类的有效性,而且相对于传统的优化算法具有更好的优化能力和收敛度.  相似文献   

7.
为了在多维聚类分析中运用有效的深度特征选择方法排除冗余和无关的特征属性,学习数据元素的非线性关系提取最佳特征,提出一种降噪分层映射算法(DHM).首先,基于降噪自动编码器构建非循环神经网络,容错数据经过隐藏层加权和激活函数的训练获取输入数据的非线性关系得到特征空间,实现特征重构选取最佳特征.其次,特征空间用于调整自组织特征映射神经网,通过计算最小化加权平方欧式距离寻找匹配的获胜神经元.最后,结合特征选择网络和无监督聚类网络为降噪分层映射神经网,通过整体模型迭代训练,使权重参数和偏差向量同时得到优化,实现有效的无监督聚类方案.在真实数据集上的实验结果表明,同AESOM,DCSOM和S-SOM算法相比,DHM算法在提高聚类质量及准确性方面有更好的表现.  相似文献   

8.
为解决k-means聚类算法和k-凝聚聚类算法对于非凸形状数据聚类正确率低和模糊核聚类算法(FKCM)收敛速度慢的问题,将k-凝聚聚类算法与核函数方法相结合,在高维特征空间构造了新的核聚类算法--核k-凝聚聚类算法,实现了k-凝聚聚类算法的核化.通过Matlab编程进行数值实验,证明了核k-凝聚聚类算法在聚类的准确性、稳定性、健壮性等方面较之k-means聚类算法、k-凝聚聚类算法和FKCM有一定程度的改进.  相似文献   

9.
基于混沌粒子群的SVM参数优化算法   总被引:1,自引:0,他引:1  
支持向量机的性能与核函数的参数及惩罚系数C有很大关系.利用Lozi’s映射的较好遍历性,在粒子群优化算法中引入Lozi’s映射的混沌思想,提出基于混沌粒子群优化算法的SVM参数优化方法.仿真实验表明,该算法能有效提高整个迭代搜索的收敛速度和精度,从而更好地优化SVM参数.  相似文献   

10.
支持向量机的性能与核函数的参数及惩罚系数C有很大关系.利用Lozi’s映射的较好遍历性,在粒子群优化算法中引入Lozi’s映射的混沌思想,提出基于混沌粒子群优化算法的SVM参数优化方法.仿真实验表明,该算法能有效提高整个迭代搜索的收敛速度和精度,从而更好地优化SVM参数.  相似文献   

11.
对于数据流的处理,多任务多核学习已逐渐成为在线学习算法研究的热点,它在一定程度上可提高数据流预测的准确性。多核方法尽可能使用最少的核函数得到最好的实验效果,当数据量增大、训练模型稳定时,通过阈值限定的方法对核函数进行遗忘,从而减少基本核函数的使用个数,使得计算更加简单;对于算法的优化,通过引入一个遗忘变量,从对偶的角度来进一步优化权重更新过程,这里的权重指多个任务的共有特征权重和每个任务间的特有权重,以提高算法的收敛速度。实验部分对核函数的选取进行了较为详细的分析,通过对UCI数据集和实际的机场客流量数据集进行分析,证明该本算法的合理性和高效性。  相似文献   

12.
针对战场环境下通信质量较低的问题,提出了一种基于加权的具有相同移动特性的车载自组网分簇算法。首先通过对移动节点的速度相似度和距离相似度进行计算,将具有相同移动特性且距离相近的节点分为同一个簇,并设置每个分簇中簇成员的最大阈值;计算移动节点的速度因子、距离因子和平均链路维持率,并在分簇中对每个移动节点的这3个因素进行加权,选取权值最大的作为首要簇头,权值第二大的作为次要簇头,首要簇头失效时次要簇头充当主要簇头角色,且主要簇头给每个成员分配了TDMA时隙,提高了通信质量。仿真实验结果表明:与WCA算法和WBACA算法相比,该分簇算法在簇结构的稳定性和分组投递率方面都有较大的改善。  相似文献   

13.
基于聚类分析和支持向量机的布匹瑕疵分类方法   总被引:2,自引:0,他引:2  
提出一种基于聚类分析和支持向量机(SVM)的布匹瑕疵分类方法.该方法充分利用瑕疵的几何特征,首先使用迭代自组织数据分析技术算法(ISODATA)对其进行聚类,在聚类形成的子空间内再根据瑕疵的纹理特征利用SVM进行分类.根据布匹瑕疵的特点提出一种新的几何特征,并使用各类瑕疵的几何特征均值作为初始聚类中心,提高ISODATA算法的聚类效果.实验表明,该方法有效地提高了分类准确性,降低了训练的复杂度,分类准确率可达90%.  相似文献   

14.
针对网络入侵检测准确率低、误报率高的问题,本文提出了一种基于粒子群优化和极限学习机的入侵检测算法。粒子群优化算法(PSO)是一种群智能算法,核极限学习机(KELM)是一种学习速度快、泛化能力强的经典核机器学习的方法,但是极限学习机对核函数及参数的选择直接影响它的分类性能。本文算法中利用粒子群算法优化核极限学习机的核参数,采用学习能力强且线性组合泛化能力强的全局性核函数,形成了多核极限学习机,可以有效提高单核极限学习机(ELM)分类器的性能。最后通过实验对算法性能做了对比分析,实验结果验证了本文算法的有效性。  相似文献   

15.
基于核方法的分类型属性数据集模糊聚类算法   总被引:1,自引:0,他引:1  
针对分类型属性数据的聚类问题.将核方法的思想推广到快速、高效率的模糊c-均值算法,构造了基于核函数的模糊核c-均值聚类算法.该算法通过使用经验核矩阵充分利用了数据间的“相异性”信息,并且避免了模糊k-modes算法中每次迭代均要直接计算类中心的缺点,提高了聚类的精确度和稳定性.同时该算法对模式(类中心)的初始值选择不敏感.时实际的线性可分的和线性不可分的分类型属性数据集的仿真实验证明了该算法的有效性.  相似文献   

16.
 介绍了批量处理时间序列数据情况下,基于台区负荷特性聚类的样本自适应反向传播神经(BP)神经网络预测短期电力负荷的方法,通过对历史数据的预处理、初始聚类中心的设置以及最优聚类数目的确定,建立典型日负荷曲线的聚类预测模型。基于历史数据的聚类结果及待预测日的温度、湿度、气压、风速、星期等相关参数,使用BP神经网络算法得出待预测日负荷曲线预测结果。通过实例验证,基于台区负荷特性聚类的样本自适应神经网络短期负荷预测能够得到较为准确的预测结果。  相似文献   

17.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号