首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
周期分类和Single-Pass聚类相结合的话题识别与跟踪方法   总被引:1,自引:0,他引:1  
针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.  相似文献   

2.
针对二分K-means算法存在的误判实例无法再参与后续划分并降低了聚类的精度的问题.提出一种基于部分实例重判的二分K-means算法,通过区分目标簇和候选簇,过滤出候选簇中的召回实例,对召回实例所应归属的簇进行重判,实现了误判实例的正确聚类.实验结果表明,改进算法对三个实验数据集都是有效的,在不同程度上提高了聚类的准确性,同时对算法的运行速度也有小幅度的提升.  相似文献   

3.
针对传统网格聚类算法聚类精度不高的缺点,把高密度单元格的网格平均密度作为密度阀值,将簇边界点从低密度网格单元中提取出来。算法即保留了网格算法运行速度快的特点,有提高了聚类结果的质量。  相似文献   

4.
数据聚类是常用的无监督学习方法,通过词嵌入聚类能够挖掘文本主题,但现有研究大多数采用常规聚类算法挖掘词嵌入的簇类,缺少基于词嵌入特性设计实现词嵌入聚类的主题挖掘算法.该文从语言模型通过建模词间相关信息来使相关及语义相似词的嵌入表示聚集在一起的特点出发,设计词嵌入聚类算法.该算法首先计算中心词的簇类号,然后使该簇中心嵌入和相邻词嵌入的相似性增强,同时使其与负样本词嵌入远离,学习文本集词嵌入的簇类结构,并将其应用于文本主题挖掘.在3种公开数据集上的实验表明:该算法在一些模型的词嵌入结果上能够挖掘出一致性和多样性更好的主题结果.  相似文献   

5.
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性.  相似文献   

6.
DPC算法是一种能够自动确定类簇数和类簇中心的新型密度聚类算法,但在样本分配策略上存在聚类质量不稳定的缺陷.其改进算法KNN-DPC虽然具有较好的聚类效果,但效率不高而影响实用.针对以上问题,文中提出了一种近邻密度分布优化的DPC算法.该算法在DPC算法搜索和发现样本的初始类簇中心的基础上,基于样本的密度分布采用两种样本类簇分配策略,依次将各样本分配到相应的类簇.理论分析和在经典人工数据集以及UCI真实数据集上的实验结果表明:文中提出的聚类算法能快速确定任意形状数据的类簇中心和有效地进行样本类簇分配;与DPC算法和KNN-DPC算法相比,文中算法在聚类效果与时间性能上有更好的平衡,聚类稳定性高,可适用于大规模数据集的自适应聚类分析.  相似文献   

7.
针对目前流聚类算法无法有效处理数据流离群点的检测和处理,以及增量式数据流聚类效率较低等问题,提出了一种基于密度度量的异常检测、删除的增强型仿射传播流聚类算法。在仿射传播流聚类算法的基础上,所提算法通过引进异常检测和删除机制改善了异常点对聚类精度、聚类效率的影响。利用仿射传播聚类实现在线数据流的聚类过程,同时检测数据漂移现象,即数据流分布特征随时间发生变化,并采用基于密度度量的局部异常因子检测技术(LOF)对储备池数据进行异常检测和删除处理,通过对当前类簇和处理过的储备池数据重聚类来重建动态数据流模型。在真实网络数据(KDD’99)上进行了实验,结果表明,所提算法不仅减少了重聚类构建动态模型的次数,改善了聚类效率,而且在同时考虑聚类精度、纯度和熵3种聚类评价标准下,均优于传统的仿射传播流聚类算法。  相似文献   

8.
聚类是数据挖掘中的关键问题,吸取了BIRCH算法中构造簇特征树来产生初始聚类中心的方法,提出了一种基于随机抽取的有限深度层次聚类算法(RSLDCH算法),采用随机抽取样本、限制特征树深度、构建叶子节点链表技术从而提高了算法的时间效率和聚类效果.实验表明,RSLDCH较BIRCH在运行速度和聚类效果上有一定的提高.  相似文献   

9.
针对微博对社会舆情影响力日趋增大,设计了基于层次聚类的微博敏感话题检测算法,通过对微博内容的自动抓取,利用层次聚类算法实现对微博内容的智能识别,并以敏感话题为单位对微博内容进行分类.重点对层次聚类算法的实现过程进行研究,引入了词频、词性等关键参数因子,提高层次聚类算法分类精度.通过测试表明,检测算法的检测分类精度为95.3%,话题误判率不超过6%.  相似文献   

10.
针对聚类分析精度和效率低的问题,设计了一种聚类算法FBCLUS.应用卷积定理和傅里叶变换,提出了频率滤波法来消除噪声的干扰;提出了单阈值、多阈值幅度滤波法消除噪声和提取不同密度的感兴趣区间;提出一个数学形态学算子提取聚类簇.实验表明:FBCLUS算法能够发现任意形状的聚类;速度快,计算复杂度为O(N);能够发现不同密度的聚类簇;抗噪声性能强;对网格大小有一定的适应性.FBCLUS算法有很高的聚类精度和效率.  相似文献   

11.
基于综合目标函数的神经网络多新息辨识算法   总被引:1,自引:1,他引:0  
为提高动态神经网络学习算法的辨识精度及抗噪性能,提出一种基于综合目标函数的多新息辨识算法。该算法基于多新息理论在最小均方误差目标函数中引入一辅助项构造综合目标函数,利用该目标函数进行网络输出层权值的训练,并采用牛顿法推导出输出层权值的递推计算公式。与已有二阶学习算法相比,新算法鲁棒性强,收敛速度快,辨识精度高。仿真结果验证了算法的有效性。  相似文献   

12.
基于Bayesian-MCMC方法的水体污染识别反问题   总被引:2,自引:0,他引:2  
针对具有不适定性的环境水力学反问题,基于贝叶斯推理和二维水质模型建立水体污染识别反演模型,运用马尔科夫链蒙特卡罗法抽样获得污染源源强、污染源位置和污染泄漏时间等模型参数的后验概率分布和统计结果.实例研究结果表明,基于马尔科夫链蒙特卡罗抽样算法的贝叶斯推理可以较好地用来实现水体污染识别,具有识别精度高,误差小的特点,其可靠性和稳定性高于混合遗传模式搜索优化算法.  相似文献   

13.
针对手动控制调节药物注射量缺乏正确性和低效的特点,将广义动态模糊神经网络(GD-FNN)应于药物注射系统辨识。学习算法在动态模糊神经网络算法基础上进行改进,以模糊完备性作为高斯函数宽度的确定准则,避免初始化选择的随机性。同时,该算法能对模糊规则而且能对输入变量的重要性做出评价,从而使每条规则的输入变量的宽度可以根据它对系统性能贡献的大小实施在线自适应调整。通过对药物注射系统的辨识和控制仿真实验表明改进后的广义动态模糊神经网络与动态模糊神经网络相比,可取得更好学习效率和辨识精度。  相似文献   

14.
激励轨迹的选取和优化是机器人动力学参数辨识的重要基础.为了提高机器人动力学参数的辨识精度,以SCARA机器人为研究对象,设计了基于双层自适应遗传算法的机器人激励轨迹优化方案.运用Newton-Euler法建立了机器人的动力学模型,并对机器人的动力学模型进行线性分离,得到了机器人的最小惯性参数集和对应的观测矩阵.分析机器...  相似文献   

15.
Special input signals identification method based on the auxiliary model based multi-innovation stochastic gradient algorithm for Hammerstein output-error system was proposed.The special input signals were used to realize the identification and separation of the Hammerstein model.As a result,the identification of the dynamic linear part can be separated from the static nonlinear elements without any redundant adjustable parameters.The auxiliary model based multi-innovation stochastic gradient algorithm was applied to identifying the serial link parameters of the Hammerstein model.The auxiliary model based multi-innovation stochastic gradient algorithm can avoid the influence of noise and improve the identification accuracy by changing the innovation length.The simulation results show the efficiency of the proposed method.  相似文献   

16.
传统的L曲线法在使用的时候常常不容易获得准确的正则化参数,基于此,提出了一种基于Newmark-β的反算-对比-调整-逼近(inverse computation-contrast-adjustment-approach, ICAA)正则化参数选取方法.该算法相比传统的L曲线法使用起来更加直观、简便,并且计算耗费的时间更短、效率更高.通过一个四自由度系统的仿真算例和一个悬臂梁的实验验证了本算法的有效性,并把本算法的载荷识别结果与L曲线法的载荷识别结果进行了对比.结果表明:该算法相比L曲线法不仅在计算效率方面有显著优势,而且利用前者的正则化参数进行载荷识别,计算精度更高.  相似文献   

17.
针对目前非侵入式负荷监测仅能识别单个家用电器、多种家用电器同时运行识别率低的问题,提出一种基于卷积神经网络(CNN)与K-means聚类结合的非侵入式家用电器识别方法。首先,通过改进的CUSUM边沿检测算法对获取的用户用电数据进行时间检测,提取负荷发生投切事件的功率波形;其次,通过高斯滤波法对提取的功率波形进行滤波处理,并将处理后的波形转化为像素图作为负荷特征库,一部分作为训练集用来训练K-means算法改进后的CNN模型,一部分作为测试集测试模型识别的精度;最后,利用搭建的实验平台进行实际测试分析。实验结果表明,所用模型对7种家用电器的识别率均为100%,验证了模型的有效性。通过K-means算法对卷积神经网络进行改进,增大相似特性负荷特征之间的区别,提高负荷辨识的准确率,为非侵入式负荷检测技术开发提供了参考。  相似文献   

18.
 射频识别技术被广泛应用到室内定位领域。现有的利用射频识别技术的定位系统有很多缺陷,在定位精度、效率、可靠性、成本等方面存在诸多问题。分布式多天线阵列阅读器定位系统可根据各接收天线检测的信号强度、相位差等信息实现快速精确定位。引入本地标识概念可简化标签识别过程,以实现对目标标签的高速识别定位,满足对快速运动物体识别的支持。与传统定位方法相比,引入本地标识的多天线阵列阅读器定位系统在定位速度、定位精度和抗干扰能力上都具有突出的优势。  相似文献   

19.
基于前向神经网络的多新息随机梯度辨识算法   总被引:7,自引:0,他引:7  
为了提高动态系统的辨识精度,提出一种基于前馈神经网络的多新息随机梯度辨识算法,它通过动态调整网络权值来提高网络在线辨识性能.由于多新息随机梯度辨识算法利用了系统的当前数据和历史数据,对动态辨识,特别是对具有纯时间延迟动态系统的辨识,较传统的BP算法在辨识精度和收敛速度方面具有更好的效果.仿真结果表明该算法的有效性.  相似文献   

20.
为了标记海量Web信息的语义,实现计算机自理解和自动处理功能,提高信息查询准确率及效率,研究了信息的表达形式即本体,给出了本体的扩展定义及其快速识别的四个规则,通过模拟实验,验证了规则的实际应用效果及本体快速识别算法效率,本体识别速度和效率较普通的方法有一定的提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号