首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 623 毫秒
1.
为了更准确地预测股票的走势,提出了一种基于细粒度演化超网络的股票预测方法.对2011年证券年报数据进行处理,以预测其中股票在2012年的走势.采用卡方分裂算法和等宽度离散化相结合的方法对股票数据进行有效的离散化,以应对连续型数据简单二值化处理造成的信息损失,然后采用细粒度演化超网络模型预测每支股票在未来一年内的走势.试验结果表明:细粒度演化超网络对股票走势预测正确率是86.73%,股票上涨预测正确率是75.00%.得到了用细粒度超网络挖掘影响股票上涨的重要特征组合及其对应的取值范围,为投资者提供了一种可靠而又方便的选股新方法.  相似文献   

2.
针对粗糙集中连续属性需要离散化问题进行了研究.根据数据对象的可分辨性原理构造超立方体,在数据空间上对信息表中的连续属性进行整体离散化处理.根据条件属性与决策属性的一致性关系,依照条件属性在粗糙集边界域中的分类能力来确定条件属性的重要性,在此基础上选取重要划分点对信息表中的连续属性进行局部离散化,同时以信息熵作为迭代约束条件.数值示例和实验表明这种整体与局部相结合的离散化方法是有效可行的.  相似文献   

3.
为解决传统模式识别方法学习结果过于复杂且难以解读的问题,提出了一种基于遗传算法的演化学习超网络模型.与传统的基于梯度下降和超边替代的超网络学习算法不同,演化学习超网络模型在其学习过程中引入了遗传算法.将超网络的超边集合划分成多个子种群;对子种群中的个体进行选择、交叉和变异等遗传操作,并对每一代种群进行子种群间优秀个体的迁移.每个子种群并行执行演化操作,完成演化后得到一个具有决策能力的超网络分类器.利用演化超网络对急性白血病、肺癌和前列腺数据集进行分类试验.结果表明,演化学习超网络对3个数据集的分类准确率分别为96.21%,99.26%,96.09%.所提出的方法与其他传统的模式识别方法相比,具有更高的分类准确率,而且其学习结果具有很好的可读性,有利于挖掘与癌症诊断密切相关的基因对高阶关联关系.  相似文献   

4.
连续量决策信息表的离散化问题研究   总被引:1,自引:0,他引:1  
在粗糙集理论中,知识是以表格的形式表达的.当用粗糙集算法从连续量决策信息表中提取规则时,首先要对其进行离散化处理.针对连续量决策信息表离散化过程中存在的问题,本文中提出了2个定理并进行了证明.定理表明:在考虑决策信息表中属性值之间不可分关系的条件下,若决策信息表的值发生变化,则离散化结果必然发生变化.所以由单一样本构成的连续量决策信息表所得到的离散化结果不能用于实际的连续量系统中.  相似文献   

5.
在用粗糙集理论解决连续系统的问题时,要求信息表必须是离散值.在对由连续量构成的信息表离散化时,首先要对决策属性的值域进行离散化。文中针对这一问题提出了3种确定离散化区间的方法,即经验分割法、等频分割法和等距分割法;又提出了2种求区间离散值的算法,即区间重心法和区间值平均法,并通过算例验证这些算法均是可行的,其中等距分割法中的区间值平均法效果最为满意。  相似文献   

6.
为了获取连续值域信息系统的决策规则,本文突出了一种新的方涛,这种新的方法无需对连续值域信息系统进行离散化,因此减少了由于离散化预处理所丢失的信息.通过对文中允许误差的系统对规则获取效率的影响的讨论,可以发现,在实际应用中新的方法比传统的方法更有效.  相似文献   

7.
针对在数据挖掘中,连续属性常常需要预处理问题,应用粗糙集理论对连续属性的不完备问题、离散问题进行了研究,提出了一种连续属性预处理方法。基于条件属性与决策属性间的对应关系完成了不完备数据的填补。依据划分区间的概念、连续属性离散化含义及其本质特征,定义了划分区间的加法运算法则,以此对填补后的信息表进行了划分区间运算,并以分类质量作为离散过程迭代约束条件,实现了信息表中连续属性的离散化。通过C 编写的算法进行数值示例及测试数据库。实验结果表明此算法有效可行。  相似文献   

8.
提出一种基于连续属性离散化的知识分类方法.将条件属性按照重要度由高到低排序,并依照此排序将决策表中各条件属性依次离散化.在对决策表中条件属性的离散化过程中充分考虑已离散化的条件属性及决策属性,离散后的决策表不需要进一步约简.使用了模拟数据和UCI机器学习数据集中的数据进行算法测试,而且与其他离散化算法进行了对比,结果充分证明了新方法的有效性.  相似文献   

9.
基于粗糙集和自适应神经网络集成理论的边坡稳定性分析   总被引:1,自引:0,他引:1  
利用SOM网络--粗糙集-BP网络集成进行边坡稳定性预测的方案:首先应用SOM网络将边坡稳定性因素中的连续属性值离散化;然后基于粗糙集理论计算边坡稳定决策系统的约简,根据实际需要确定最优决策系统;最后在最优决策系统的基础上设计BP网络进行预测.边坡稳定性预测的实际结果验证了所提出的神经网络与粗糙集理论相结合的可行性,在数据充足的条件下,该方案可以推广到其它具有连续性值的情况.  相似文献   

10.
基于残差超网络的DNA微阵列数据分类   总被引:1,自引:1,他引:0  
DNA微阵列数据特征维度高,包含噪音,属性之间以及属性与样本类别之间有着复杂的关联性.然而传统超网络的超边一般是从训练集中随机选取属性而组成,难以保证超边质量,而且其分类性能受超边初始化过程影响很大,导致效果不稳定.针对传统超网络的这一局限,提出一种基于残差分析的超网络分类模型.残差算法根据显著性检验,首先假设属性相互独立,然后根据95%的置信水平,运用残差分析,用落入拒绝域的属性值对超网络的超边库进行初始化,以获取关联性较高的超边集合.然后采用梯度下降法进行超网络的演化学习.对急性白血病、前列腺癌和肺癌数据集的实验表明:与传统演化超网络分类器相比,该方法不仅有较高的分类精度,而且提高了分类的稳定性和收敛性.  相似文献   

11.
为能够更好地从高特征维度的DNA微阵列数据中挖掘癌症相关基因,实现对恶性肿瘤的分子分型,提出了一种基于演化超网络模型的DNA微阵列数据分类方法?演化超网络是受生物网络启发而建立的一种认知学习模型,其学习过程非常适用于发掘基因间的相互作用?该方法采用信噪比进行基因选择,选择后的基因经归一化后用于演化超网络的学习和分类?通过急性白血病和结肠癌2种数据集进行实验,结果表明,演化超网络在分类精度方面与当前其他方法有较高的可比性?  相似文献   

12.
手写签名作为易被大众所接受的生物特征身份认证方式,已成为模式识别领域一个重要研究热点.针对现有手写签名存在易模仿难鉴定的问题,提出一种结合演化超网络模型的手写签名认证方法.为了平滑噪声,构造出可读性强的笔迹特征集,采用向量化和平滑采集点的方法对手写签名样本进行预处理,从而提取出位置和方向特征属性,采用演化超网络模型对签名进行学习和鉴定.为验证该方法的有效性,对20个签名用户分别采集了40个真实签名和20个伪造签名数据进行实验.实验结果表明,该方法对用户签名的误拒率(false rejection rate,FRR)为4.75%,误纳率(false acceptance rate,FAR)为3.75%,识别率(verification accuracy,VA)为95.75%.同时和其他传统的识别算法相比,具有更高的识别率.  相似文献   

13.
摘要:复杂网络具有开放性、互联性和共享性,易受到大规模的入侵,采用传统“一对一”方式构建网络入侵检测器,检测费时,实时性检测差。为了提高复杂网络入侵检测性能,提出一种引入由粗到精分层概念的多层网络入侵检测模型,在传统的LSSVM分类器基础上,对分类过程进一步细分,建立一种由粗到精策略,构造多层的网络入侵分类器,在精细分类层,将引入拥挤度和隔离度因子的粒子群优化分类器,以提高入侵分类器性能。最后采用KDD 99数据集进行仿真测试。结果表明,相对于其它检测模型,该模型不仅加快了入侵检测速度,满足入侵检测实时性,同时提高了网络入侵检测率,为网络安全提供了有效保证。  相似文献   

14.
为了解决传统方法不能按照训练样本量设计最优网络模型,集成效率低的弊端,通过机器学习方法研究数据库小数据集并行集成方法。机器学习选用朴素贝叶斯算法,依据条件独立性假设,通过计算目标先验概率,采用贝叶斯定理求出其后验概率,对后验概率进行比较,完成决策分类,对基分类器进行训练,把不同朴素贝叶斯基分类器当成集成分类器,在原始数据库上对基分类器进行训练,依据分类结果对数据库中小数据集样本分布进行调整,将其当成新数据集对基分类器进行训练,按照基分类器的表现,通过加权将其组合在一起,产生强分类器,实现对数据库小数据集的集成处理。通过MapReduce并行处理完成并行数据集成,输出并行集成结果。通过仿真实验与实例分析验证所提方法的有效性,结果表明:所提方法在训练样本规模相同的情况下有最高的分类精度和最小的波动,在不同集成规模下的分类精度一直最高,波动最小;所提方法可达到数据的最优集成,数据失效比降低,合成比提高。可见所提方法集成精度高,计算稳定性强,集成效果好,效率优。  相似文献   

15.
将遗传模糊系统引入分类器融合,并且提出了一种快速的遗传模糊系统设计方法,在该方法中对传统的产生初始群体的方法和交叉操作进行了改进.本文方法在从ELENA数据集和UCI数据集中选择的3个大样本数据集上进行了测试,与当前有代表性的分类器融合方法进行了比较实验.实验结果表明,该方法在缩短训练时间以后仍然能够得到模糊规则数少,分类精度高的分类器融合系统.  相似文献   

16.
展示了一种新的基于网络评论语言学结构的情感倾向识别模型,固定情感词元模型(fixed sentiment terms model).该方法利用基于固定情感词元的3种特定搭配模式来构造识别算法,通过基于增量的tf-idf模型的相关用户反馈不断更新特征词元集合.通过与传统的情感识别方法相比较,此方法可以较为明显地提高情感分类的效率和准确率.  相似文献   

17.
由于采用传统的分类器进行检测时,存在检测率低而误报率高的问题.提出了一种基于免疫聚类的自适应分类器方法,采用多信息粒度的思想有效地克服了聚类算法与分类算法间的不一致性.通过在真实网络数据集上对多种入侵行为的检测结果表明:该分类器的检测率高、漏报率和误报率低,较RBF分类器和BP分类器具有更好的分类性能和推广性能.  相似文献   

18.
AdaBoost算法是一种将多个基学习器通过合理策略结合生成强学习器的集成算法,其性能取决于基学习器的准确率和多样性。但弱学习器分类精度不高往往也导致了最终强分类器性能较差,因此进一步为了提高算法的分类精确率,本文提出一种MDTAda模型,首先利用基尼指数迭代构造一棵不完全决策树,然后在决策树的非纯伪叶结点上添加简单分类器,生成MDT(模型决策树),将MDT作为AdaBoost算法的基分类器,加权平均生成强分类器。在标准数据集上的实验表明,相比传统的AdaBoost算法,本文提出的算法拥有更好的泛化性能和更优的间隔分布,且在与AdaBoost算法达到相同精度时所需迭代次数更少。  相似文献   

19.
设计一种基于AP聚类算法和SVM分类器相融合的新的混合分类器, 使用AP聚类算法优化数据集, 得到了高质量、 小样本的SVM分类器训练集. 实验结果表明: 与传统的SVM分类器相比, 混合分类器具有更高的分类精度; 在心脏病预测上, 该分类器的效果较好.  相似文献   

20.
提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号