首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
随机森林在分类不平衡数据时,容易偏向多数类而忽略少数类,可以将代价敏感用于分类器的训练,但在传统代价敏感随机森林算法中,代价函数没有考虑样本集实际分布与特征权重,且在随机森林投票阶段,没有考虑基分类器的性能差异。本文提出一种改进的代价敏感随机森林算法ICSRF,该算法首先根据不平衡数据集的实际分布构造代价函数,并将权重距离引入代价函数,然后根据基分类器的性能采取权重投票,提高分类准确率。实验结果表明,ICSRF算法能有效提高少数类的分类性能,可以较好的处理不平衡数据。  相似文献   

2.
为了提高代价敏感分类算法MetaCost的准确率,降低错分代价,提出了多类别问题下的一种代价敏感分类算法(简称D-MetaCost算法).该算法利用MetaCost算法,通过多次取样生成多个模型,依据它们的分类准确率,选择其中准确率较高的前几个基分类器,将它们与最后阶段新生成的分类器聚集在一起得到最终分类模型.实验表明,D-MetaCost算法在准确率和代价方面比经典的MetaCost算法有明显的改进和提高.  相似文献   

3.
基本随机游走相似性指标由于其转移概率仅由当前节点的度决定,影响链路预测效果.鉴于此,在MH (Metropolis-Hasting)算法的基础上,充分利用邻居节点的度信息,并采用将当前节点的自环率按邻居节点的度值加权分配给邻居节点的方法重构转移概率矩阵,再融合重启随机游走(Random Walk with Restart,RWR)相似性指标,提出一种改进MH的链路预测算法.首先,根据当前节点与邻居节点的度信息重新定义节点间的转移概率;然后,将新的转移概率重构成概率矩阵;最后,融合RWR相似性指标进行链路预测实验.结果表明,新算法相较于RWR、CN (Common Neighbors)等7种基准算法在AUC指标上均有提升,在排序分指标上也有所改善;AUC指标上最高可提升3.98%,排序分指标上最高下降1.92%,提升了链路预测的准确性.  相似文献   

4.
现实世界中的数据挖掘经常涉及从类别分布不平衡的数据集学习,少数类的数量相比于其他类较少.从包含少数类的数据集中学习,通常会产生偏向于多数类的预测分类器,但对少数类的预测精度较差.针对少数类学习提出一种新的集成算法Cost-SMOTEBoost,该算法是SMOTE算法和AdaCost算法的结合.通过实验表明,Cost-SMOTEBoost算法在不降低精确率的情况下提高了召回率,从而提高了在分布不平衡数据集上的表现.  相似文献   

5.
主动学习时向专家查询得到的标注如果带有噪声,将会影响学习的性能.为减少噪声,人们提出了基于“少数服从多数”的多专家主动学习算法,但该算法的缺点是代价往往太高.文章采用了一种自我训练(self-training)方法,对某些平均置信度高的样本,直接确定其分类标注,不必向专家查询,以节省学习代价.同时,使用置信度差异作为度量标准,选取那些最不确定的样本向专家查询,提高了学习效率.在UCI数据集上验证了本文算法的有效性.  相似文献   

6.
针对经典的节点相似性链路预测算法只考虑网络拓扑结构或者节点属性信息的问题,使用词嵌入模型Word2vec学习得到节点文本属性信息的表示,进而改进TADW(text-associated deep walk)算法,弥补其语义信息表示能力的不足.基于改进的TADW图嵌入方法提出一种融合网络拓扑结构和节点属性信息的相似性指标,并基于此相似性指标提出链路预测算法.在三个真实数据集上的实验结果表明所提出算法可以提高预测精度,并具有更好的鲁棒性,同时使用图嵌入的方法有效解决了网络数据的稀疏性问题.  相似文献   

7.
一种改进的最小代价网络编码算法   总被引:2,自引:0,他引:2  
分析了网络编码内在特性,指出网络编码区别于传统多播并提升多播传输性能的根本原因在于网络中存在被不同传输路径所重用的关键链路.通过在构建网络编码多播的传输路径时形成较少的关键链路,提出了一种基于关键链路的最小代价网络编码算法.该算法是在最大流算法的基础上加以改进的,并结合了网络增广链和最小截集的性质,是一种有效的最小代价网络编码算法.基于随机网络的仿真实验证明,在实现多播理论容量的前提下,该算法能有效降低网络编码的代价.  相似文献   

8.
传统属性约简的目标是在决策表中的所有条件属性中,选择一组分类代价最小的约简,算法构建了测试代价最小的约简.以往的测试代价约简算法查找成功率不够理想,性能不稳定,提出了一种改进的测试代价约简算法.通过运行2个UCI数据集实验,证明算法是有效的,并为提高测试代价约简算法性能提供了新途径.  相似文献   

9.
针对代价敏感学习问题,研究boosting算法的代价敏感扩展。提出一种基于代价敏感采样的代价敏感boosting学习方法,通过在原始boosting每轮迭代中引入代价敏感采样,最小化代价敏感损失期望。基于上述学习框架,推导出两种代价敏感boosting算法,同时,揭示并解释已有算法的不稳定本质。在加州大学欧文分校(University of California,Irvine,UCI)数据集和麻省理工学院生物和计算学习中心(Center for Biological&Computational Learning,CBCL)人脸数据集上的实验结果表明,对于代价敏感分类问题,代价敏感采样boosting算法优于原始boosting和已有代价敏感boosting算法。  相似文献   

10.
通过重新定义传统GN算法的边介数计算,提出了一种基于链路预测方法的图聚类算法;并且在分析GNRA仍旧存在的不足的基础上,给出了其改进算法IGNRA.通过对常用的四组数据集进行实验比较发现:所提出的GNRA算法在效率上比传统的GN算法能够明显提高,而IGNRA相比较GNRA、GN具有最低的计算复杂度.  相似文献   

11.
代价敏感学习是机器学习中一个重要的领域.由Masnadi等提出的代价敏感的支持向量机通过将铰链损失函数代价敏感化来处理代价敏感问题,比传统的代价敏感学习方法具有更好的泛化精度.现实中的数据往往是通过在线增量式获取的,而传统的全量式学习算法每次增加样本时都需要重新从头计算,因此浪费了很多时间.为了使得代价敏感的支持向量机能够在在线学习的场景下具有更高的效率,提出了一种增量式的代价敏感支持向量机算法.该算法可以在新增样本时直接更新已有的训练过的模型,不需要从头开始重新训练.在多个数据集上的实验结果也显示出了该方法与传统的批处理方法相比,在速度上的具有显著的优势.  相似文献   

12.
提出了一种自适应代价优化算法ACO,利用"登山式"方法查找最适合重采样数据子集的最优误分类代价值用于建立基分类器,克服了固定式误分类代价不尽科学和客观的缺点,利用重采样技术实现了数据集样本不足时的分类器训练.通过"投票"方式对原始数据集中的实例重新标记类标,学习得到一个适应于类分布不均衡数据集的自适应的集成分类器.实验证明,用自适应代价优化算法实现的分类器在类分布不均衡的数据集上的分类性能明显优于CSC,MetaCost和naive Bayes等建立的分类器.  相似文献   

13.
代价敏感属性选择在数据挖掘和机器学习中起着关键性作用,代价敏感属性选择问题是经典属性选择问题的自然扩展,已成为越来越多学者的研究热点之一.首先给出多代价下代价敏感属性选择问题的数学模型,然后介绍现有的有代表性的四种代价敏感属性选择算法,最后在四个UCI数据集上进行实验,对四种代价敏感属性选择算法的效果和效率进行比较分析.  相似文献   

14.
引入图的误分类代价矩阵,选取以最小误分类代价为目标的加权子图作为图样本的特征属性,建立起图的决策树桩分类器,进行集成学习,得到一个对新图进行分类的判别函数.在生成候选子图时,利用子图的超图增益值具有上界的性质来裁剪增益值比较小的候选子图,从而减少候选子图数量,提高算法效率.实验结果表明,所提算法比其他图分类算法的误分类代价更小.  相似文献   

15.
代价敏感学习是数据挖掘和机器学习领域的重要课题.已有的研究方法多数针对单目标进行优化,并不适用于多目标代价敏感问题的解决.因此通过分析基于粗糙集领域的单目标代价敏感属性约简问题,定义了多目标代价敏感属性约简问题,并设计了一种简单高效的算法.在4个UCI数据集上的实验结果表明,该算法能获得令人满意的帕累托最优解集,以辅助用户进行方案的选择.  相似文献   

16.
针对传统自适应增强学习算法训练过程中只关注预测误差率最小的缺陷,本文提出了一种基于代价敏感系数的改进自适应增强学习算法并应用于混凝土抗压强度预测。首先考虑影响混凝土强度的8种参数作为特征变量,通过自适应增强学习算法集成回归树,依据样本权值抽样建立多个弱回归学习器。同时引入线性敏感系数与指数敏感系数来优化增强学习过程中样本权值的更新问题,采用引力搜索算法对代价敏感系数的基数进行最优选取。最后,根据权重比集成弱学习器得到最终预测模型。通过对所提出的两组不同代价敏感系数组合策略下的预测模型与随机森林、BP神经网络算法等模型的预测结果进行对比分析,验证了所提预测模型具有更好的预测性能。  相似文献   

17.
全球通信业务量大且分布不均衡的客观因素,使得卫星网络资源利用率较低的问题日趋严重。为了解决这个问题,提出了一种面向星座网络的关键链路路由算法。该算法在业务统计模型下,以传播时延和当前链路负载状态为链路代价选出候选路径。在此基础上引入关键链路的概念并建立关键链路代价增量预测模型,最终从候选路径中选择代价增量最小的为最优路由。算法还采用拥塞控制策略发现拥塞,减轻拥塞链路的负载,选择重新设计部分业务的路由。实验结果表明,算法在平均路径阻塞概率、吞吐率、路径时延以及负载均衡方面均有较好的提升;在满足时延要求的前提下,能够有效地分配网络资源,提高网络利用率,是一种较好的卫星网络路由算法。  相似文献   

18.
代价敏感属性约简问题作为经典属性约简问题的自然扩展,将代价引入数据,使得属性约简问题更加具有现实意义。文章基于分治思想,先按列将数据集拆分为若干个互不相交的子数据集,然后对各子数据集进行约简,并把约简后的子数据集多路合并。依次继续执行约简和合并操作,最终得到最小测试代价约简。每个子数据集的大小及子数据集的总个数自适应于各个数据集的规模而非固定不变。为验证算法的有效性,选择四个UCI标准数据集进行实验,并与其他算法进行结果对比。实验结果表明,该算法能在较短时间内获得可接受的结果,更适应实际问题的需要。  相似文献   

19.
为解决导航星座星间链路异常中断时的路由问题,提出一种考虑链路异常状态的路由改进算法。通过导航星座特有的星间测距信息进行链路异常检测与识别,根据检测出的链路异常状态对K短路径路由算法进行改进。对改进算法与K短路径算法及泛洪策略进行比较分析,研究结果表明:在处理链路异常中断时,改进算法比泛洪策略增加的额外链路负担更小,时效性更高;而在链路传输时延及链路切换次数上改进算法与K短路径算法相当。  相似文献   

20.
为了有效地对网络进行维护,提高网络性能,预知网络流量可以提前对网络出现的问题采取应对策略,从而对用户提供更好的服务。在神经网络预测模型中把隐含层的传递函数用小波函数替换,并采用共轭梯度下降算法,建立了一个小波神经网络的网络流量预测模型。通过实际流量数据对模型进行仿真,结果显示该模型与神经网络预测模型相比,该网络具有良好的预测效果,网络训练时间短,有效地提高了训练速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号