首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
一种基于SOM和层次凝聚的中文文本聚类方法   总被引:2,自引:0,他引:2  
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。  相似文献   

2.
为了处理大量分布式存储的农业环境数据,提高农业生产效率,对高斯混合模型聚类算法进行了改进,提出了一种基于分布式聚类的农业环境数据异常检测方法.在Spark分布式计算框架下,首先对数据进行粗聚类,得到初始化模型;然后利用Spark迭代更新模型直至稳定,其中Map阶段将样本点分配到模型,Reduce阶段更新模型个数及参数;最后利用聚类结果,实现环境异常值的检测.实验结果表明该方法可行有效.  相似文献   

3.
为有效解决传统K-means聚类算法在处理大规模数据集时面临的扩展性问题,提出了一种Hadoop K-means聚类算法.该算法首先根据样本密度剔除数据集中孤立点或者噪声点的影响,再利用最大化最小距离思想选取K个初始中心,使初始聚簇中心点最优化,最后用Hadoop云计算平台的Map Reduce编程模型实现算法的并行化.实验结果表明,该算法不仅在聚类结果上具有较高的准确率和稳定性,而且能够很好地解决传统聚类算法在处理大规模数据时所面临的扩展性问题.  相似文献   

4.
基于遗传算法的可变加权FCM聚类方法改进研究   总被引:2,自引:2,他引:0  
模糊C均值聚类(FCM)应用广泛,但是它容易陷入局部最优,且对初始值很敏感.利用遗传算法对模糊聚类中聚类中心的个数和聚类中心的选取进行了确定,然后在FCM法中引入指标权重,并给出迭代公式和相应算法.实验结果表明,该方法可以在一定程度上避免FCM算法对初始值敏感和容易陷入局部最优解的缺陷,使聚类更合理,效果很好.  相似文献   

5.
基因组数据的聚类分析,可以从多个数据集中识别与特定的生物学表型相关联的基因。传统的聚类方法仅进行单向聚类,即仅对基因表达谱的特征(基因)或样本进行聚类,没有考虑基因与样本的关联性。针对基因表达数据提出了一种新的无监督双向聚类算法,同时对基因和样本进行聚类。对已提出的聚类性能评价指标进行了改进,利用改进的指标确定双向聚类算法最优的聚类个数。将该方法分别应用到乳腺癌和青少年类风湿性关节炎基因表达数据中,结果显示,与传统方法相比,本方法具有较好的聚类效果。  相似文献   

6.
大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果.  相似文献   

7.
提取目标背景的主色是迷彩设计中的重要步骤,通常采用的颜色聚类算法具有监督性的缺陷. 为此,提出一种基于色度直方图的、无监督的颜色聚类算法. 该算法采用CIE 1931色度系统建立色度直方图,根据像素点在该坐标系的分布规律自动生成聚类中心. 逐一计算像素点与各聚类中心的色度的欧氏距离,将像素点与最近的聚类中心归于一类. 实验结果表明,采用该聚类算法能够准确提取主色,自动分割彩色图像,且比普通聚类算法的时间效率更优.  相似文献   

8.
该文提出了一种多任务Takagi-Sugeno-Kang(TSK)模糊系统建模方法.首先给出了一种新的多任务模糊c均值聚类算法,能够有效提取所有任务之间的公共信息和每个任务的私有信息,进而利用所得的聚类中心构建多任务TSK模糊系统的前件参数.其次设计了一种具备多任务协同学习机制的后件参数优化方法,可以优化多任务TSK模糊系统的后件参数.最后基于优化的前后件参数,构建出具体多任务模糊聚类方法驱动的多任务TSK模糊系统模型(multi-task fuzzy c-means based multi-task TSK fuzzy system,MTFCM-MT-TSK-FS)以用于实际应用.分别在合成和真实数据集上进行实验,结果验证了该模型的有效性.  相似文献   

9.
PBC:一种基于路径的XML文档聚类方法   总被引:2,自引:0,他引:2  
提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完成文档的聚类.首先,包含某一路径的文档集合形成初始类,并用该路径作为初始类的标识.然后,用层次聚类方法根据设定的标准,合并初始类,直至结束.类的标识信息是类中文档包含的路径,结果直观,容易理解.算法的复杂度是O(n),其中n是文档的大小.相关实验证明该算法不但能保证聚类结果准确,而且能大幅度提高计算的速度.  相似文献   

10.
为了快速探测复杂网络中的社团结构,提出了基于网络节点耦合度的凝聚聚类算法.首先利用一种优化的聚类中心算法确定初始聚类中心节点,然后根据节点间耦合程度和节点度分别对各社团的节点进行分类和不断调整聚类中心,直至聚类算法结束.实验结果表明,该算法能够快速准确的划分复杂网络中的各社团.  相似文献   

11.
非负矩阵分解(Non-negative Matrix Factorization,NMF)由于可以保证矩阵分解的非负性,这符合许多实际问题的要求,比如遥感、生物信息等数据都具有非负性.而且其分解结果具有可解释性和明确的物理意义,因此在很多领域都有广泛的应用.将半监督非负矩阵分解应用于人流量统计数据处理,实验结果表明加入...  相似文献   

12.
为解决人脸识别中运算速度和识别效果之间的矛盾,提出了零范数稀疏编码算法. 该算法用零范数描述稀疏编码模型的稀疏度,通过对模型的间断点连续开拓,有效地提高了算法收敛速度. 运用ORL人脸数据库对该算法进行识别率和效率测试,并与非负稀疏编码算法和非负矩阵稀疏分解算法进行对比,表明文中提出的算法调节稀疏度的能力更强,可有效缩短运算时间,并在较短时间内获得较高的识别率.  相似文献   

13.
为提高拷贝检测系统的鲁棒性和效率,提出一种鲁棒图像哈希算法. 用Gabor变换系数构建图像内容结构图,将它从笛卡尔坐标系变换到极坐标系进行归一化. 将归一化的结构子图加权,求得特征向量,最后通过量化得到二值哈希码. 基于Gabor系数的内容结构图有很强的鲁棒性和独特性,量化中采用的失真哈希码融合和双密钥进一步提升了算法的鲁棒性、独特性、紧凑性. 利用公开数据库分别对所提出的算法和多种代表性算法进行对比实验,比较对象包括非负矩阵分解哈希、形状上下文哈希、圆环分割与不变向量距离哈希. 实验表明,该算法在查准率和查全率方面均表现突出,匹配效率也有大幅提升,整体性能优于对比算法.  相似文献   

14.
稀疏化递归Cholesky分解预条件技术加速PO-MoM迭代求解   总被引:1,自引:0,他引:1  
提出了一种新的稀疏化递归Cholesky分解预条件技术,并应用于加速物理光学和矩量法(PO-MoM)混合方法分析大型复杂载体上线天线的辐射问题.基于积分方程积分核的物理意义,忽略MoM区与PO区的耦合,构造出一个PO-MoM混合方法系数矩阵的稀疏近似阵.然后采用Cholesky分解方法将该稀疏阵的逆阵进行递归分解,得到一个矩阵连乘形式的预条件阵.将该预条件阵用于预条件广义最小留数(GM RES)法迭代求解线性方程组,应用该技术对卫星和舰船两个电大尺寸复杂载体模型上天线辐射问题进行了求解.结果表明,采用这种新的预条件技术可以大大加快方程组迭代求解的收敛速度,明显提高计算效率.  相似文献   

15.
利用相似矩阵、广义逆矩阵、幂等变换的矩阵、正交投影矩阵、矩阵的谱分解、矩阵的运算等方面的理论给出了构造幂等矩阵的几种方法.  相似文献   

16.
矩阵论中矩阵的分解是很重要的内容。本文借助于矩阵的Jordan标准形给出一种方阵分解为二对称阵之积的初等证明方法。  相似文献   

17.
姜黄素诱导肿瘤细胞凋亡机制的研究进展   总被引:8,自引:0,他引:8  
姜黄素能够诱导多种肿瘤细胞系凋亡,其机制主要是调控癌基因和抑癌基因,下调多个转录因子活性,通过多种信号转导途径,诱发细胞周期停滞而诱导细胞凋亡.对近年来姜黄素诱导细胞凋亡的机制进行综述,以便更好地探求和开辟治疗恶性肿瘤的新途径。  相似文献   

18.
针对带有色观测噪声的目标跟踪系统,分别用基于ARMA新息模型和基于R iccati方程的两种方法,在线性最小方差信息融合准则下,提出了多传感器按矩阵加权、对角阵加权和标量加权的三种信息融合稳态Kalman跟踪滤波器.仿真说明了三种加权滤波器的误差的差别不明显,但按标量加权滤波器显著地减少了计算负担,便于实时应用,且验证了两种方法所得结果相同.应注意在构造ARMA新息模型时,必须进行多项式矩阵的左素分解,才能得到正确的ARMA新息模型.  相似文献   

19.
距离测度是度量两个直觉模糊集的重要方法,在聚类分析中被广泛应用.本文基于相异度矩阵的思想,在直觉模糊多属性聚类中,定义了距离测度矩阵,然后根据不同的阚值要求转化为布尔矩阵进行聚类,最后通过实例验证该方法的有效性.  相似文献   

20.
马尔可夫跳跃线性系统是一类具有随机马尔可夫跳跃参数的线性系统,其应用于结构扰动衰减或变化的模型系统中。研究了具有不确定性跳跃线性时滞系统的鲁棒稳定性,采用线性矩阵不等式(LMI)途径,提出并证明了鲁棒稳定性的存在条件,还设计了相应的状态反馈控制器。最后,举例说明这种途径的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号