首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
在进行财务困境预测时, 为了客观全面地反映企业的财务状况, 纳入较多的预警指标, 数据集维度将变得很大, 传统方法求解此类问题效果并不理想. 流形学习处理高维数据具有较好的降维效果,多核SVM对于分布不平坦的数据具有很好的分类性能. 基于此, 提出了“流形学习+多核SVM”的混合算法财务预警模型, 该模型适用于具有大量指标集的财务预警. 实验结果表明, 与传统预警方法相对比, 其具有更优的预测性能.  相似文献   

2.
基于相异度核空间的支持向量机算法   总被引:1,自引:0,他引:1  
提出基于相异度核空间的混合流形学习与支持向量机(SVMs)算法用于解决高维数据分类问题. 该算法使用SVMs对流形学习降维后的低维嵌入做分类.通过加常数方法构造了衡量数据点相异度的特征空间. 证明了该特征空间不仅能够衡量数据点之间的相异度,还满足Mercer条件对于支持向量机分类核空间的半正定性的要求. 在仿真实验中,采用UCI机器学习数据库上标准分类数据集为样本. 对比构造的相异度核空间与常用核函数如线性核、多项式核、高斯核在支持向量机分类时的 分类精度来验证有效性和优越性.  相似文献   

3.
为了解决局部线性嵌入(locally linear embedding, LLE)流形学习算法无法自适应确定重构区间和不能进行增量学习等问题,提出了一种自适应聚类增量LLE(clustering adaptively incremental LLE,C-LLE)目标识别算法。该算法通过建立高维非线性样本集的局部线性结构聚类模型,对聚类后的类内样本采用线性重构,解决了LLE算法样本重构邻域无法自适应确定的问题;通过构建降维矩阵,解决了LLE算法无法单独对增量进行降维和无法利用增量对目标进行识别的问题。实验表明,本文算法能够准确提取高维样本集的低维流形结构,具有较小的增量降维误差和良好的目标识别性能。  相似文献   

4.
王勇  吴翊 《系统仿真学报》2008,20(22):6066-6069
等距特征映射(Isomap)是一种新颖、高效的非线性降维技术,它的一个突出优点是只有两个参数需要设定,即邻域参数和嵌入维数。我们提出了一种新的估计Isomap的最优嵌入维数的算法,该算法使用执行Isomap过程本身所产生的数据来估计流形的最优嵌入维数,同时能确定邻域参数的最优值。通过与常用的残差估计方法的实例对比,说明这种算法对人造数据集和真实数据集都很有效,而且能更加合理、更加客观地估计出流形的最优嵌入维数。  相似文献   

5.
为了有效地分析高维决策表,提出了基于流形学习降维的决策分析算法(decision analysis algorithm based on manifold learning,DAML). 算法使用等距映射法(ISOMAP)对原始数据做降维处理,在得到的主坐标数据上进行决策分析. 根据核主成分分析法与ISOMAP方法的关系得到主成分与主坐标的转换关系式,并计算原始数据主成分. 提出了基于等价支持子集的决策算法用于计算主成分属性重要性、属性区分能力及等价支持子集. 在得到等价支持子集的基础上抽取决策规则,根据决策规则预测算法预测未知数据. 选取UCI数据库中标准分类数据集作为仿真实验样本,并对比C4.5决策树算法、K最近邻居算法(KNN)与提出的决策规则预测算法在Iris、Breast cancer、Wine、Spectf heart和Ionosphere数据集上的分类精度来验证算法的有效性.  相似文献   

6.
由于传统主动学习方法的计算量随着问题规模的增大呈指数增长, 因此很难应用于大规模多类数据分类任务中。为解决该问题, 设计了一种基于子抽样的主动学习(subsampling-based active learning, SBAL)算法。该算法将无监督聚类算法与传统主动学习方法整合, 在二者之间增加了子抽样操作, 该操作能够显著降低算法的时间复杂度, 在保证实验准确率的基础上减少实验耗时, 从而更加高效地处理大规模数据集的分类问题。实验结果显示, 采用SBAL算法的实验性能优于传统主动学习算法, 证明了所提算法可以突破传统主动学习方法不能处理大规模数据集多类别分类问题的局限性。  相似文献   

7.
一种大规模数据库的组合优化决策树算法   总被引:3,自引:0,他引:3  
提出了一种适合于大规模高维数据库的组合优化决策树算法。相比于传统的类似算法,该算法从数据的离散化,降维,属性选择三方面进行改进,对决策树建立过程中不适应大规模高维数据库的主要环节进行了优化,有效解决了处理大规模高维数据库问题的效率和精度之间的矛盾。仿真试验表明,该算法在大大减少了计算代价的同时提高了决策树的分类精度。  相似文献   

8.
局部线性嵌入算法(locally linear embedding,LLE)是一种非线性降维方法.当数据量较大时,算法计算效率较低,算法运行所占用的内存空间较大.为了提高LLE算法的计算效率和减小算法运行时占用的内存空间,给出了基于RSOM(Recursive SOM)树聚类的LLE算法,通过RSOM树对数据集进行聚类,在保证输入样本依概率分布的同时显著降低算法复杂度,提高了映射效果.仿真实验表明,基于RSOM树聚类的LLE算法相对于原始的LLE算法,其算法效率有了显著提高,明显降低了算法运行所占用的内存空间,同时很好地学习了高维数据的流形结构.  相似文献   

9.
一种采用LLE降维和贝叶斯分类的多类标学习算法   总被引:2,自引:0,他引:2  
多类标数据中的样本可能属于一个或多个类标,因此其分类问题较单类标分类更为复杂。提出一种新的多类标学习算法,首先针对多类标数据的特征属性维数高的特点,采用LLE算法对多类标数据的特征属性进行降维,提取能较完整描述数据的一组低维特征属性集;然后将多类标样本集按所属的类标进行划分,并采用贝叶斯分类模型来学习各组样本集的分类特性;根据各个分类模型的判定类标,综合得到多类标样本的最终类标集。将该算法分别应用到自然场景图像和基因数据的多类标分类学习中,实验结果表明,该算法针对不同的多类标数据集均能取得很好的分类效果,且相比于其他多类标算法有更高的性能。  相似文献   

10.
针对无线局域网室内定位系统中,因参考点密集布设而带来的数据采集、更新及定位匹配运算量增加的问题,提出了一种新的基于半监督流形学习的降维判别嵌入定位算法。该算法利用少量已标记数据和部分未标记数据,通过求解目标函数最优化,对高维接收信号进行维数约减,保留最具判别力的定位特征,然后采用确定性定位算法找到定位特征与位置坐标的映射关系。实验结果表明,算法定位精度高于传统的定位算法,降低了离线阶段的数据采集工作量,便于后期数据库的实时更新。  相似文献   

11.
从三维模型中提取出的高维特征向量一般分布在原始空间的某个非线性低维子空间中,而测地距度量算法可以有效地甄别这种非线性分布.提出一种在相关反馈中,通过更新测地距离来捕捉三维模型特征点的分布特性的检索算法.为了解决相关反馈后期效果提升缓慢的缺陷,作者提出了模型潜力值理论来辅助使用了测地距核函数的支持向量机学习器改善相关反馈机制.  相似文献   

12.
基于邻域优化的局部线性嵌入   总被引:1,自引:0,他引:1  
文贵华  江丽君  文军 《系统仿真学报》2007,19(13):3119-3122
利用图代数计算数据之间的相关性,进而优化数据的局部邻域,并应用于改进局部线性嵌入.LLE算法。优化后的LLE算法考虑了数据集的聚类结构,但不需要分类信息或聚类算法做预处理,因而算法是无监督的,有通用性,简单易于实现。邻域优化后的局部线性嵌入算法克服了经典LLE不能很好地处理稀疏或含有噪音数据的缺陷。同时继承了经典LLE时间复杂度低的优点,可用于解决大规模数据问题。标准数据集上的实验结果证明了所提方法的有效性。  相似文献   

13.
针对支持向量机(Support Vector Machine,SVM)处理大规模数据集常出现的训练速度慢、计算代价大以及实时性差等缺点,将基于密度的样本块划分法和基于欧式距离的边界样本筛选方法相结合,提出了一种新型的支持向量机约简方法。该方法首先进行空间块的划分,根据空间块的密度提取候选样本区域,并通过基于欧式距离改良的相对距离提取出大概率分布支持向量的边界样本。该方法既保证了训练样本的精度,又降低了计算代价,提高了泛化能力。工业应用结果表明了该方法不仅精度不低于SVM,并且计算速度远快于SVM。  相似文献   

14.
Intuitionistic fuzzy hierarchical clustering algorithms   总被引:1,自引:1,他引:0       下载免费PDF全文
Intuitionistic fuzzy set (IFS) is a set of 2-tuple arguments, each of which is characterized by a mem-bership degree and a nonmembership degree. The generalized form of IFS is interval-valued intuitionistic fuzzy set (IVIFS), whose components are intervals rather than exact numbers. IFSs and IVIFSs have been found to be very useful to describe vagueness and uncertainty. However, it seems that little attention has been focused on the clus-tering analysis of IFSs and IVIFSs. An intuitionistic fuzzy hierarchical algorithm is introduced for clustering IFSs, which is based on the traditional hierarchical clustering procedure, the intuitionistic fuzzy aggregation operator, and the basic distance measures between IFSs: the Hamming distance, normalized Hamming, weighted Hamming, the Euclidean distance, the normalized Euclidean distance, and the weighted Euclidean distance. Subsequently, the algorithm is extended for clustering IVIFSs. Finally the algorithm and its extended form are applied to the classifications of building materials and enterprises respectively.  相似文献   

15.
由于存储成本低,查询速度快,哈希检索算法已被广泛应用于大规模影像检索。针对大规模遥感影像数据集训练低效问题,提出了面向查询点进行特征学习的遥感影像检索方法。首先,利用深度卷积网络对具有多语义标签的遥感影像数据训练集提取遥感影像特征;然后,面向查询点学习得到哈希函数并生成查询点的二进制哈希码;最后,通过迭代学习得到整个数据库的二进制哈希码来实现影像检索,有利于提高检索精度;同时,该方法避免了对整个数据库进行特征提取,从而可以更有效地利用大规模数据库中的监督信息。在3个不同数据集上的实验结果表明,该方法检索性能优于其他多种先进方法。  相似文献   

16.
为解决三维树木模型的检索具有正确率低、检索效率低、描述不匹配等问题,提出一种基于树型空间的三维树木模型匹配方法。该方法通过构建三维树木模型数据集的树型空间,辅以主轴匹配,轮廓匹配,枝干匹配等方式,经过树型空间中欧氏距离和测地线度量差异值,逐步匹配到相应的三维树木模型,该方法分别在通用模型数据集和自我设计的模型数据集进行了匹配性实现,结果表明可以较大幅度提升树木模型匹配的准确率,利于三维树木模型的大规模检索和重用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号