首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
针对现有预测方法中存在预测精度低、预测时间长及存储空间大等问题,提出一种基于格拉姆矩阵和随机森林的疾病预测方法,该方法首先从数据集中收集大量数据,其次使用格拉姆对称矩阵对采集数据进行存储和归类.然后引入随机森林二元回归和分类技术,通过二元变量相关性来衡量预测结果和数据之间的关系,并根据相关性构造决策树用于结果分类.最后...  相似文献   

2.
基于K-means聚类和遗传算法的少数类样本采样方法研究   总被引:1,自引:0,他引:1  
传统的分类器对不均衡数据集的分类严重倾向于多数类.为了有效地提高不均衡数据集中少数类的分类性能,针对此问题提出了一种基于K-means聚类和遗传算法的少数类样本采样方法.通过K-means算法将少数类样本聚类分组,在每个聚类内使用遗传算法获取新样本并进行有效性验证,最后通过使用KNN和SVM分类器,在仿真实验中证明了方法的有效性.  相似文献   

3.
大数据下的系统发育估计是一个组合优化问题,在有限计算时间内,现有算法很难为大量序列数据的分析提供最优解.基于前人启发式算法,提出了一种系统发育树随机聚类建树方法,可在较短时间内为系统发育过程产生的大规模序列数据提供所有具有进化意义的解及最优解,以揭示发育过程中的序列进化关系.实验结果表明,该随机聚类方法是行之有效的,对生物计算及系统发育相关领域研究具有积极意义.  相似文献   

4.
随着师生对网络流量需求的迅速增长,如何合理的增加用户的流量,既能满足用户的基本上网需求,又能合理利用出口带宽.本文基于一种改进的K-means聚类算法,以校园网用户的行为特征为对象进行聚类,为优化用户计费策略和合理的分配出口带宽提供了数据依据,为校园网用户个性化需求方面提供理论依据.  相似文献   

5.
针对当前三支聚类方法不能有效处理数值型数据,且三支聚类结果受阈值影响问题,文章基于邻域关系提出了确定合适阈值的三支聚类方法。首先给出了确定最优K值的改进K-means聚类算法。进而基于邻域关系下的下、上近似引入精度,提出了权衡边界域和精度关系的有效性评价指标。应用该指标,给出了确定邻域下、上近似中最佳阈值的构建算法,进而得到三支聚类的核心域和边界域。最后,通过UCI数据集上的实验验证了该方法的可行性,且该方法有效提高了聚类精度。  相似文献   

6.
总结图聚类几种主要算法,在此基础上详细介绍了一种较新的图聚类算法——基于模拟随机流的Markov图聚类算法(MCL),该算法是基于流这种自然现象的一种简单优美算法,应用在生物信息学网络聚类中比较高效.由于该算法具有运行速度慢、聚类数目过多的缺点,因此又介绍了一种改进的MCL算法——R-MCL算法.  相似文献   

7.
为了解决聚类挖掘中隐私保护问题,提出一种基于随机投影的数据扰动方法.该方法首先生成投影矩阵,然后根据生成的投影矩阵对数据进行对称扰动,使得扰动后的数据和原数据在维数、聚类形状等多方面均有较大的不同,能很好地保护隐私信息,且扰动后的数据可用性较高,具备一定的抗攻击性.实例验证了所提算法的有效性.  相似文献   

8.
提出了一种相对简单、有效的划分复杂网络社团结构的方法.该算法利用复杂网络的转移矩阵P和K均值聚类算法来划分社团结构,并且用F统计量判定最优的聚类结果,在探测社团结构明显的人工网时具有较高的准确度.  相似文献   

9.
针对K-Means算法对初值敏感和容易陷入局部最优的缺点,本文提出一种基于概率的随机扰动聚类中心优化算法。首先,每次迭代后重新计算聚类中心,以聚类中心为圆心向外搜索一定邻域内的点,将聚类中心以概率随机定位到邻域内的某个点上,称该点为物理中心点;之后,选定的物理中心点以一定速率向聚类中心方向移动一定距离,计算出的位置即为新的聚类中心;最后,根据欧氏距离重新划分数据集。该算法通过概率扰动方式使聚类中心不再固定为某一点,而将其中心扩大到一定区域,搜索该区域内的最优解,从而极大地避免了K-Means算法陷入局部最优的可能;并且,即使计算进程已经陷入局部最优,优化后的算法也可以通过最优区域搜索,以一定概率的机会跳出局部最优。  相似文献   

10.
李顺勇  余曼  王改变 《河南科学》2020,38(10):1549-1557
为了对含有多个特征向量的分类矩阵对象数据进行描述,提出了一种新的基于簇间信息的分类矩阵对象数据的聚类算法(between-cluster k-modes,简称BC-k-modes).该算法利用k-modes算法的聚类过程,对分类矩阵对象数据进行聚类,导出隶属度矩阵与聚类原型的更新公式,通过增加簇间信息对目标函数寻求局部最优解.最后在五个真实数据集上进行了实验,结果表明该算法对真实数据的聚类效果明显优于其他算法.  相似文献   

11.
基于灰理论的居民生活电力消费预测研究   总被引:1,自引:0,他引:1  
介绍了灰理论及GM模型的建模方法,结合我国2000-2005年居民生活电力消费,建立了GM(1,1)预测模型.通过对模型精度及预测值精度的检验,认为该模型具有较高可信度,适用于居民生活电力消费的预测.  相似文献   

12.
先用动态聚类法对福州市居民历史用电负荷进行聚类分析以获得一个样本空间,在此基础上采用偏最小二乘回归方法进行建模和短期负荷预测分析.  相似文献   

13.
原始的k-means算法是从样本点的集合中随机选取K个中心,这种选取具有盲目性和随意性,它在很大程度上决定了算法的有效性.为消除选取初始中心的盲目性,应充分利用已有数据样本点的信息.采取对数据进行预处理的方式来选取初始中心.实验证明新的初始点的选取不仅提高了算法的计算效率,也提高了算法最终确定的聚类的精度.  相似文献   

14.
考虑到资产收益率间复杂的线性和非线性动态相关及演化关系,基于Pearson相关系数、Kendall秩相关系数和Tail相关系数等构建含时网络并结合随机矩阵理论,研究最优投资策略问题。为了对比不同相依关系、不同中心性测度及是否降噪对投资策略的影响,构建了9个资产筛选网络模型,并基于上证180指数数据,求解最优投资策略,分析其内样本和外样本表现。研究发现:在Kendall和Tail相关系数下的模型所选资产组合可以有更低的交易成本,运用随机矩阵理论进行降噪能显著提升投资收益,含时条件中心性测度的引入有助于筛选出更优的资产组合。  相似文献   

15.
夏芃  张倩  王群京  王璨 《科学技术与工程》2021,21(33):14165-14172
配电网无功优化是使电网能安全稳定运行的重要问题,本文将深度学习应用于配电网无功优化上,提出基于改进的粒子群优化 (Particle swarm optimization, PSO)深度置信网络(Deep Belief Networks,DBN)模型的配电网无功优化方法。首先,利用随机矩阵理论将配电网运行过程中产生的环境以及电气数据构造五种随机矩阵,每种矩阵构建8种特征指标,共提取40种特征指标;其次,以随机矩阵理论所提取的各特征指标为输入,以变压器分接头档位和节点的无功补偿容量作为输出,利用改进的PSO优化DBN网络的初始权重,建立PSO-DBN模型,学习各特征指标输入与变压器分接头档位以及节点无功补偿这两种控制策略之间的关系,得出相应的无功优化策略。最后,以改进的IEEE33节点系统作为算例仿真对象,验证了所提方法可降低网损和减少电压波动。  相似文献   

16.
本文提出了一种基于遗传算法,结合网站的拓扑结构,对网站用户进行聚类分析的模型,阐述了遗传算法在优化过程中染色体编码、遗传算子的设计等问题.实验证明能解决常规聚类算法不能有效处理局部极值、聚类结果对初始聚类中心的选取有着很大的敏感性的问题,是一种有实用价值的方法.  相似文献   

17.
蔡军  谢航  谢涛  段盼 《科学技术与工程》2021,21(27):11624-11631
由于能源互联网中分时电量分布不仅为分时电价的制定提供依据还代表着用户的用电意识,提出改进K-Means++的聚类算法与典型用户筛选模型对分时电量进行挖掘。首先对K-Means++进行改进,利用模拟退火算法(simulated annealing, SA)与中位数阈值分割自动确定聚类初始质心与聚类数,弗雷歇与欧式距离的加权复合作为相似性的度量,权值由信息熵与层次分析法(analytic hierarchy process, AHP)确定。然后对分时电量进行聚类,从每簇聚类结果中依据典型用户筛选模型筛选典型用户,得到3种用电类型,最后从主要用电类型与用电类型转变的角度对行业用电行为分析,得到不同行业相同的用电行为。有助于供电侧初步掌控区域性行业用电群体的用电特征,为精细有序的用电管理做准备。  相似文献   

18.
基于RMT的协作MIMO频谱感知   总被引:1,自引:1,他引:0       下载免费PDF全文
针对认知无线电技术中的频谱感知问题,将已经广泛应用于无线通信领域的随机矩阵理论(RMT)引入到多认知用户MIMO环境中,提出了基于随机矩阵理论的协作MIMO频谱感知算法。该算法不需要预知噪声的统计特性和噪声方差,而是利用大维随机矩阵特征值的极限分布特性进行频谱感知。新算法充分利用了协作技术及MIMO技术的优点来提高感知性能。理论分析和仿真结果均表明,新算法整体性能优于同类算法和典型的能量检测算法。  相似文献   

19.
针对数字化主动电网中电力实体行为复杂化、攻击手段隐蔽化等问题,提出了一种基于模糊聚类的多类别归属异常检测算法。首先,对电力实体行为相似性的度量方式进行优化,并基于优化后的度量方法构建模糊聚类算法,通过多次迭代得到实体行为对应各类别的隶属度矩阵;其次,根据类别软划分隶属度矩阵,分别计算实体在各个类别内的近邻距离、近邻密度与近邻相对异常因子等参数;最后,分析实体在各类簇内的相对异常情况,判断该电力实体行为是否属于异常行为。结果表明,与LOF,K-Means和Random Forest算法相比,新方法具有更高的异常行为检出数量和更优的异常检测评价指标,解决了传统异常检测算法样本评价角度单一的问题,进一步提高了数字化主动电网抵御未知威胁的能力。  相似文献   

20.
以人均用电量为测度指标,运用基尼系数、泰尔指数测度方法对江苏省1993~2010年区域差异进行测度分析,研究表明:1993~2010年间,江苏区域总体差异在波动中上升.从江苏省三大区域层面来看,区域间差异呈现不断扩大趋势,并逐步成为总体差异的主要组成部分,区域内部总体差异不断缩小.从三大区域内部差异来看,表现各不相同,其中,苏南地区内部差异较小,但呈缓慢扩大后平缓下降的趋势;苏中地区内部差异也较小,并呈缓慢缩小趋势;而苏北地区内部差异较大,但呈快速缩小趋势.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号