共查询到20条相似文献,搜索用时 15 毫秒
1.
类别不平衡问题是机器学习与数据挖掘领域中主要关注的问题之一,目前已有多种解决方法,而样本采样技术是其中最为简单有效、同时也是最为常用的一类方法.本文主要针对SMOTE(synthetic minority oversampling technique)这一最为流行的采样算法易于受到噪声样本影响及泛化能力差的缺点,提出了一种基于概率密度估计的改进算法.首先,假定各类样本均服从高斯混合分布,并采用高斯混合模型测得各样本的概率密度,针对各样本在类内与类间所测得概率密度间的排序比较关系来实现噪声信息的过滤.其次,在过滤后的少数类样本上进行概率密度的重新计算,并根据其特点将其划分为三类:边界样本、安全样本与离群样本.最后,针对上述三类样本,分别采取不同的策略来进行SMOTE采样.此外,为了进一步提升泛化性能,本文也对SMOTE算法的邻域计算规则进行了修正.通过多个基准的二类不平衡数据集对该算法进行了验证,实验结果表明其是有效且可行的,同时显著优于多种已有的采样算法. 相似文献
2.
针对图像特征提取算法-SIFT,特征描述器维数较高,特征匹配耗费时间较长,匹配过程中存在相同图像不能匹配和不同图像能够匹配等问题,提出了一种改进SIFT算法与KD-tree搜索匹配算法相结合的新方法。采用KD-Tree算法替代传统链表式搜索方法降低特征点匹配时间;把特征点间距离和特征描述子内积同时作为匹配标准,加入相应匹配阈值减少匹配错误率,并通过理论和实验证明采用欧几里德距离作为相似性度量具有更高的匹配成功率。实验结果表明,在图像特征匹配中,该算法能够有效减少特征匹配错误率,大幅度降低匹配时间,具有较好的实时性和鲁棒性。 相似文献
3.
4.
周向东 《太原理工大学学报》2009,40(5)
针对进化树(Eteee)中搜索到的最佳匹配单元(BMU)往往有较大聚类误差的问题,提出了一种改进型Etree.首先,当找到BMU后,不仅更新它的权值,而且逐层向上修改它祖先结点的权值直至根结点;其次,对Etree中较低层次的叶子结点采用较低的分裂阈值.另外,采用了一种改进方法来确定Etree中两个结点间的距离.实验结果表明,改进型Etree用较少的时间代价大大减少了聚类误差. 相似文献
5.
随着计算机技术的飞速发展,传统的数据加密标准DES算法渐被新的高级加密标准AES——RAjndael算法所替代。根据Rijndael算法中大量矩阵运算的特点,对加密和解密的轮变换进行了研究,给出了其优化实现,提高了AES算法的加解密速度;实践证明,该应用方法是有效的。 相似文献
6.
7.
利用特定的滤波器对自然风景图像、人物图像进行小波分解后,在低频区域中,小波系数的符号绝大部分为正.利用这一特征,对多级树集合划分(SPIHT)算法进行了改进,使得在同样的压缩比下,可以使信噪比得以提高. 相似文献
8.
首先,深入分析了频繁模式挖掘算法Eclat和Eclat+,在大数据集上挖掘长模式时,Eclat+的性能不及Eclat。基于此,提出一种改进的Eclat算法,新算法充分利用了垂直数据表示和交叉计数的高效优势,直接在垂直数据表示的数据集上通过广度优先搜索和交叉计数产生频繁模式。实验结果表明,在挖掘长模式时,改进的Eclat算法的运行速度较Eclat、Eclat+均有明显的提高。 相似文献
9.
10.
县小平 《太原师范学院学报(自然科学版)》2011,10(1):92-94
文章提出了一种基于用户兴趣的网页预分类的PageRank算法,改进后的算法是根据用户对某一类别网页的兴趣,将网页进行预分类.经验证,改进后的算法可以提高搜索引擎的查准率. 相似文献
11.
《哈尔滨商业大学学报(自然科学版)》2016,(6)
为了保持蝙蝠算法快速搜索能力,并提高算法寻优精度和搜索能力,分析蝙蝠算法适应度值方差与搜索过程中影响蝙蝠音量和脉冲发生率变化的参数的关系,为了维持解的多样性,动态调整蝙蝠算法搜索过程中影响蝙蝠音量和脉冲发生率变化的参数,并对适应度值进行扰动,提出了一种基于方差改进的蝙蝠算法(The improved Bat Algorithm based on the Variance,VBA),并通过7个标准测试函数分别对BA和VBA进行测试,结果表明,VBA的寻优性能优于BA. 相似文献
12.
Floyd算法是解决最短路径问题的一种有效方法,算法简单,边权值可正可负,同时也被用于计算有向图的传递闭包。但存在着时间复杂度高等问题,不适合计算大量的数据。从搜索方向和数据存储的角度,对其进行了改进。理论分析和实验结果表明,改进的算法在运行时间和程序占用内存方面均优于传统的Floyd算法。 相似文献
13.
一种改进的SIMPLE算法 总被引:1,自引:0,他引:1
本文对传统的SIMPLE算法进行了改进,提出了一种新的协调型计算方法,并通过两个具体算例的计算与SIMPLE算法和SIMPLEC算法进行了比较。结果表明,本算法有更好的收敛性。 相似文献
14.
一种改进的决策树算法 总被引:1,自引:0,他引:1
为解决决策树算法ID3的多值偏向的缺点,利用属性相似度偏向少值属性的特点,提出一种将属性相似度作为信息熵的系数的属性选择标准,从而提出相应的决策树生成算法.实验结果表明,新算法既避免了以信息熵作为属性选择标准的决策树算法的多值偏向,也避免了以属性相似度作为属性选择标准的决策树算法的少值偏向. 相似文献
15.
一种改进的GMDH算法 总被引:1,自引:0,他引:1
传统GMDH算法在进行多变量非线性建模时耗时较长,一定程度上限制了它的应用范围.针对这个问题,提出了一种改进的GMDH算法,扩大了每一个初始输入元素的信息含量,采用随机分组建立中间模型的方式代替原算法枚举出所有两两组合中间模型的方式,减少了中间模型的数量,提高了建模效率.将改进算法应用于中国GDP的趋势预测,结果表明与传统GMDH算法相比,在不牺牲预测精度的情况下,改进算法效率更高. 相似文献
16.
17.
一种改进的Apriori算法 总被引:1,自引:0,他引:1
Apriori算法存在许多可以改进的地方.例如它需要反复读取数据库,并且读取的次数由项目集中的项目个数来确定,I/O负载与最大项目集的项数成正比.本文提出一种只读一次数据库的的改进算法. 相似文献
18.
由于目前实际中的模糊控制器通常多采用Mamdani合成模糊推理并结合重心法进行清晰化,此类控制器运算量很大,相应的实用化产品对硬件和软件都有较高的要求,导致其适用性受到一些限制.为此采用概率论中“最佳预测”的概念推导出一种模糊控制算法,并考虑到适用性的需要对该模糊控制算法进行了改进.改进后的算法十分简单,并用当前流行的仿真软件Matlab对其进行了仿真分析.分析结果表明,该算法与普通模糊控制器及文献中介绍的快速智能PI控制器相比,其上升时间和稳态时间均大大减小,具有响应迅速、超调小的特点. 相似文献
19.
《南京大学学报(自然科学版)》2016,(4)
FastMap是经典多维标度法(classical multidimensional scaling,CMDS)的一种快速算法,它包含一系列的投影.在每次投影中,两个相距较远的点被选为枢轴点,连接枢轴点得到一个枢轴;然后将各样本投影到枢轴上;最后,修改所有样本间的距离.FastMap的不足在于只能得到CMDS的近似解.对FastMap进行了深入分析,指出FastMap的本质就是把各样本投影到由枢轴确定的一组正交向量上.由于这组向量通常不同于样本集的主轴,使得FastMap只能得到CMDS的近似解;并指出FastMap算法的最大投影次数等于样本集的内在维数.在此理论分析的基础上,提出了一种改进的FastMap算法—iFastMap(improved FastMap)算法.通过对FastMap坐标进行主成分分析,iFastMap得到了与CMDS完全一致的解;此外,从样本集中选取一个内在维数等于整个样本集内在维数的子集,将枢轴点的选取限定在这个子集上,并在每次投影后只修改枢轴点与各样本间的距离,iFastMap的速度得到进一步提高.实验验证了iFastMap与CMDS解的完全一致性及其高效性. 相似文献
20.
刘皓 《玉林师范学院学报》2020,(3):97-102
针对在光线较暗环境下对人脸识别率低的问题,本文提出一种Fisherface的改进方法。该方法可有效提高Fisherface方法在暗环境下对人脸识别的识别率。实验结果表明:在光照强度为10 Lx时,该改进方法的识别率提高了27.85%,显示出其在暗环境下有较好的识别效果,能够有效的扩展Fisherface方法的应用范围和鲁棒性。 相似文献