首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
智能化Web站点(Intelligent web site)技术是从用户的浏览行为中自动学习用户的浏览模式,包括频繁访问页组、页面聚类、用户聚类等,并根据当前用户的浏览模式,定制个性化页面内容和改进站点结构,为用户提供个性化服务.  相似文献   

2.
加权Web访问模式聚类算法   总被引:4,自引:0,他引:4  
针对Web应用挖掘中聚类算法中的问题,提出加权Web访问模式聚类算法,该算法利用服务器日志库中保存的网页访问次数信息,提高了聚类的客观性和准确性。  相似文献   

3.
基于分层聚类的k-means算法   总被引:8,自引:0,他引:8  
为了更好地实现聚类,在分析分层聚类和k-means算法优缺点的基础上提出了一种改进的聚类算法.改进算法将分层聚类和k-means聚类算法的优点相结合,首先采用分层聚类,得到一个初始的聚类结果,然后应用k-means聚类算法继续聚类.实验结果表明,改进算法较原先传统的聚类算法,不但算法执行速度快、效率高,而且聚类效果也比较好。  相似文献   

4.
随着Internet的迅速发展,人们面对信息爆炸的现实。因此,需要根据用户的查询意图进行推荐。基于此,提出一种计算查询词相似度的方法,利用K-means对查询词进行聚类并计算聚类簇中心,当用户输入查询词后计算该查询词与每个聚类簇中心的相似度并降序排列,选取相似度最大的两个聚类簇对其进行查询推荐。  相似文献   

5.
随着人工智能和数据挖掘技术的兴起,聚类分析已被广泛应用于通信、文本数据统计、生物信息学和图像处理中。对于非监督聚类分析,聚类的分类数目是决定聚类质量的关键因素。通常聚类个数事先无法确定,随即选择的初始聚类中心容易使聚类结果不稳定。针对此,基于聚类中心具有高局部密度且距高局部密度聚类中心距离较远的特点,提出一种基于局部密度估计的聚类个数的估计方法。经过仿真实验,验证了该算法具有良好的有效性和鲁棒性。  相似文献   

6.
Web日志模糊聚类算法的研究   总被引:3,自引:0,他引:3  
本文提出了一种新的Web事务模糊聚类算法.给出了新的Web事务定义和相异度定义,聚类准则函数是所有样本与C个代表中心的相异度之和,我们的目标是使这个聚类准则函数最小.同时给出了改进算法.经过试验证明,改进的算法更有效.  相似文献   

7.
研究了最小一乘下的PP k-聚类问题,给出了相合性,得到了与最小二乘情形下类似的结论。  相似文献   

8.
鉴于网络入侵检测数据样本特征属性的异构性及贡献率不同,提出一种加权特征的异构数据相似性度量法来反应网络数据样本间的相似程度.针对基于模糊C-均值聚类的网络入侵检测算法聚类数目难以确定的问题,提出了一种自动确定最佳聚类数的无监督模糊聚类入侵检测算法.通过KDDcup1999数据集的仿真对比实验,结果表明本文算法能找到最佳...  相似文献   

9.
大规模高维数据集的聚类算法已成为当前聚类研究的热点,由于高维的原因,聚类往往隐藏在数据空间的某些子空间中,传统的聚类算法无法获得有意义的聚类结果.此外,高维数据中含有的大量的随机噪声也会带来额外的效率问题.为了解决以上问题,该文在CLIQUE算法的基础上提出了一种基于最优区间分割和数据集划分的聚类算法—OpCluster,并使用仿真数据对该算法加以验证,实验结果表明,OpCluster对大规模高维数据集具有很好的聚类效果.  相似文献   

10.
在计算机上,同屏显示多幅彩色图像会出现明显的失真。特别是两幅图像色调差别较大时,失真现象列为严重为了克服这一缺陷,本文在参考K均值聚类算法的基础上,优化了初始聚类中心提出了色彩压缩的聚类统计算法。  相似文献   

11.
梁玲  孙新义 《河南科技》1999,(12):15-16
一、引言由于WWW技术的影响,通过超文本标识语言HTML连接的应用在迅速增长。用户用浏览器来浏览HTML用于编写的Web页面,可将超文本、多媒体信息一并浏览,进行世界范围的信息漫游。但面对信息存储于多种数据库服务器的客观现实,解决在Web页面中访问异构数据库,并且能使非专业人员也能掌握其访问方法,是十分重要的课题。“在WEB页面中访问异构数据库的接口”就是为解决此类问题研制开发的。该接口软件提供给用户使用是以动态主页的形式,数据库访问所需SQL语句信息是用户逐项填写该主页各项而成,利用该接口软件…  相似文献   

12.
一种基于SOM和层次凝聚的中文文本聚类方法   总被引:2,自引:0,他引:2  
研究了一种基于SOM(self-organizing map)和层次聚集的中文文本聚类方法,按照提出的中文聚类模型,该方法首先对文档集向量化,文档向量矩阵通过SOM训练映射到虚拟的二维空间,形成初步聚类;然后对虚拟坐标集进行二次聚类,与直接聚类方法相比,该方法提高了聚类的效果,减少了计算时间,通过数值实验对比表明该方法对中文文本聚类具有有效性。  相似文献   

13.
图形聚类算法的代谢网络模块化分析   总被引:1,自引:0,他引:1  
代谢网络的研究是当今生物学研究中的新热点,使用图形聚类算法对代谢网络进行分析研究是一个有力的手段.文中提出了用图形聚类方法挖掘复杂代谢网络中蕴含的功能信息并进行模块相似性分析的方法,从系统生物学角度揭示光合作用的进化.介绍了马尔可夫聚类算法和模拟退火聚类算法两种图形聚类方法;给出了两种方法对叶绿体和蓝细菌的代谢网络进行聚类的结果;定义了模块相似度评价指标,挖掘叶绿体和蓝细菌间保守的功能模块,并对其网络结构进行了比较分析.  相似文献   

14.
近几年来,单元化制造系统(CMS)作为一种由于能满足不同客户需求、缩短产品生产周期、提高企业的全球竞争力的先进制造组织模式而备受关注。本文提出了一种新的矩阵聚类方法(HERBAL)设计制造单元,并探讨了该方法与其它聚类方法如ROC、ROC2、DCA等方法在成组效率、成组功效等评价指标上的优劣,证明了该方法的可行性和高效率。同时该方法中的设备_零件矩阵(MCM)中的二元值元素,采用反映实际生产中的流程时间替代,可使聚类结果更符合实际的生产需求。  相似文献   

15.
指出在基层单位员工考评中存在的问题,提出了模糊聚类方法对员工进行量化考评的模型,并给出了聚类数据在管理中的应用。  相似文献   

16.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak, CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering, DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%...  相似文献   

17.
常用于径向基神经网络中心参数学习的K-均值聚类算法,易受初始参数选取的影响而收敛于局部极小值.将自动终止聚类判据的减聚类算法用于径向基网络的学习,可根据样本集确定径向基函数数目,且其计算量与数据点的数目与考虑问题的维数无关,很适合于人脸这种维数较高的模式.实验证明,应用这种算法训练径向基神经网络识别人脸,从识别精度到识别速度上都优于传统算法.  相似文献   

18.
DBSCAN算法是一种基于密度的空间数据聚类方法,聚类速度快,且能够有效处理噪声点和发现任意形状的空间聚类.但是数据量大时要求较大的内存支持和IO消耗,当空间聚类的密度不均匀,聚类间距离相差很大时,聚类质量较差.本文在DBSCAN算法的基础上提出一个划分不同密度分别聚类的算法.测试结果表明可以改善聚类效果.  相似文献   

19.
当站点较多时,物流运输路径规划存在困难,传统Floyd算法路径规划的时间复杂度过高.鉴于传统Floyd算法规划时间复杂度高是因节点数量过大导致,提出一种结合改进K-means聚类算法的Floyd算法,该算法在节点数量较大情况下,运用改进K-means聚类算法分割物流区域,降低规划所需考虑节点数量,从而降低Floyd算法的时间复杂度.在复杂环境下进行传统Floyd算法和改进算法的对比实验,仿真分析结果表明,改进算法可以在更少的时间内找到一条较优的路径.  相似文献   

20.
针对聚类算法的聚类中心重复性和无法对点云聚类的问题,提出了融合高斯核及指数函数的聚类中心均匀化的点云聚类方法,以优化聚类中心的均匀化分布,实现点云的均匀化聚类。首先,根据高斯核函数及密度指数函数确定局部密度,再依据局部密度的大小确定距离参数。其次,依据局部密度和距离参数的乘积确定聚类中心,同时消除聚类中心的邻近化,使得聚类中心更加均匀分布于整个数据集中。最后,利用数据点到聚类中心距离逐个确定每个数据的聚类归属,并合并邻近聚类实现点云目标物的提取。将该算法与常规的基于密度峰值的聚类算法(clustering function based on density peak,CFDP)、K-means聚类算法、具有噪声的基于密度的聚类方法(density-based spatial clustering of applications with noise,DBSCAN)进行比较,该文所提方法可以对教室内3排椅子实现100%的提取。与相对密度关系的峰值聚类(density peak clustering,DPC)算法及深度学习方法相比,所提方法对不同分辨率目标物点云的提取精度均为96.7%,在计算效率和精度方面均优于其他两种方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号