首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
一种用于数据挖掘算法的数据生成方法   总被引:1,自引:0,他引:1  
由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程.  相似文献   

2.
针对互联网虚假评论大肆横行,在虚假评论研究领域却没有完全公开的中文数据集可供中文虚假评论检测研究的问题,提出了一种基于生成对抗网络的中文虚假评论数据生成模型.首先,对生成器生成的文字序列通过蒙特卡洛搜索获取一批样本;然后,采用强化学习方法将判别器、分类器和重构器的反馈化为奖励分数;最后,传回生成器,对生成器进行参数优化,以生成贴近真实世界的具有相应类标签属性及特征的虚假评论数据.以BLEU值为评估指标,实验结果表明,所提出的模型在本文数据集上取得了更好的BLEU值,具有较好的生成效果.  相似文献   

3.
数据类别不平衡问题是制约机器学习技术在入侵检测领域应用效果的重要因素。当训练数据不均衡时,训练得到模型的分类结果往往倾向多数类,从而极大影响分类效果。针对基于机器学习算法进行入侵检测时训练样本不均衡以及由于数据隐私性导致训练样本不足和更新慢的问题,提出一种基于生成对抗网络和深度神经网络相结合的入侵数据增强方法,以实现样本集的类别均衡。通过NSL-KDD数据集对模型评估,本文所提方法不仅具有较高的准确率,而且对未知攻击和只有少数样本的攻击类型具有较高的检测率。  相似文献   

4.
随着计算机科学的发展各领域之间的相互渗透逐渐形成了许多交叉研究方向,基于此本文给出软件自动化系统中的机器学习方法。主要讨论两个方面的问题:一是软件自动化中的机器学习,二是软件自动化中较为复杂的学习算法构架。  相似文献   

5.
为了解决传统方法不能按照训练样本量设计最优网络模型,集成效率低的弊端,通过机器学习方法研究数据库小数据集并行集成方法。机器学习选用朴素贝叶斯算法,依据条件独立性假设,通过计算目标先验概率,采用贝叶斯定理求出其后验概率,对后验概率进行比较,完成决策分类,对基分类器进行训练,把不同朴素贝叶斯基分类器当成集成分类器,在原始数据库上对基分类器进行训练,依据分类结果对数据库中小数据集样本分布进行调整,将其当成新数据集对基分类器进行训练,按照基分类器的表现,通过加权将其组合在一起,产生强分类器,实现对数据库小数据集的集成处理。通过MapReduce并行处理完成并行数据集成,输出并行集成结果。通过仿真实验与实例分析验证所提方法的有效性,结果表明:所提方法在训练样本规模相同的情况下有最高的分类精度和最小的波动,在不同集成规模下的分类精度一直最高,波动最小;所提方法可达到数据的最优集成,数据失效比降低,合成比提高。可见所提方法集成精度高,计算稳定性强,集成效果好,效率优。  相似文献   

6.
以目前流行的自动化测试框架为基础,以数据驱动测试框架为核心,采用数据驱动脚本技术,在设计自动化测试平台的过程中实现了测试数据与测试脚本的分离.同时借鉴了测试脚本模块化的思想,将测试脚本进行分层次、嵌套管理,完成了基于数据驱动的自动化集成测试平台的设计.  相似文献   

7.
基于均矢量相似性的机器学习样本集划分   总被引:1,自引:0,他引:1  
提出一种基于均矢量相似性的机器学习样本集分割方法(MSSS),根据样本集中每个样本矢量与均矢量之间的余弦相似性,将样本划分成训练集和测试集.为评价MSSS方法性能,分别用随机分割法(RSS)和MSSS方法,按不同比例划分来自UCI的4个数据集,对产生的训练集一测试集进行Hotelling T~2检验;另外,采用得到的训练集对分类BP神经网络进行训练,以相应的测试集测试神经网络.研究结果表明:对用RSS划分4个数据集产生的训练集一测试集进行Hotelling T~2检验,发现均存在F值超出界值的现象,而MSSS均未出现;使用MSSS训练的神经网络所产生的训练-测试误差差异、准确率差异均比使用RSS训练的神经网络所产生的小,说明用MSSS划分产生的训练集与测试集的一致性比用RSS划分产生的好.  相似文献   

8.
9.
吴兵  刘明 《科技资讯》2015,13(2):143-144
数据驱动方法(data-driven)是一种基于语料库数据的研究方法。该方法于20世纪90年代初由Tin Johnson提出,并引起很多中外研究者的关注。随着计算机技术以及专门用途语料库在外语教学特别是大学专门用途外语教学(ESP)中的应用与普及,运用数据驱动的教与学模式必将成为一个新的发展趋势。大学本科基础阶段实施ESP教学是大学英语教学改革的方向之一。然而由于各种客观因素,ESP教学在中医院校一直处于尴尬的境地。通过分析数据驱动学习(Data-driving Learning DDL)在外语教学中的特征,探讨了中医院校ESP教学实现的方法和技术。通过这些方法,学生不仅掌握了中医英语核心词汇,减少了盲目性,掌握了地道的语言,而且提高了学习效率,实现了自主学习。  相似文献   

10.
11.
Ontology mapping is the bottleneck ot handhng confilicts among heterogeneous ontologies and of implementing reconfiguration or interoperability of legacy systems. We proposed an ontology mapping method by using machine learning, type constraints and logic mining techniques. This method is able to find concept correspondences through instances and the result is optimized by using an error function; it is able to find attribute correspondence between two equivalent concepts and the mapping accuracy is enhanced by combining together instances learning, type constraints and the logic relations that are imbedded in instances; moreover, it solves the most common kind of categorization conflicts. We thenproposed a merging algorithm to generate the shared ontology and proposed a reconfigurable architecture for interoperation based on multi agents. The legacy systems are encapsulated as information agents to participate in the integration system. Finally we give a simplified case study.  相似文献   

12.
基于支持向量机的矿浆管道堵塞信号识别方法   总被引:1,自引:0,他引:1  
针对传统统计学理论的局限性,提出一种基于支持向量机的矿浆管道堵塞信号识别方法.该方法可以有效地识别矿浆管道中压力信号、流量信号的异常,通过分析压力信号、流量信号的异常从而准确识别堵塞信号.对于矿浆管道堵塞发生的早期发现起到一个很好的预警效果.研究结果表明,该方法分类效果好,泛化能力强,在识别正确率上优于径向基核函数人工神经网络方法,为矿浆管道安全生产监测提供了可靠的理论支持.  相似文献   

13.
To meet the demands of rapid development of pipeline constructions in China, a complete set of full automatic external welding machine for annular welds of pipeline and welding procedure have been developed thereof. The system has been applied in the “West-East Pipeline Project” and its performance is proven. With this welding machine the welding parameters can be either preset before or adjusted in real time during the welding process, which avoids the blemishes of same type domestic and international products. Thus it is best propitious to in-situ construction conditions and workers‘ technical level in China. In this article the development of mechanical and control systems of this product is introduced and typical welding procedure parameters are provided.  相似文献   

14.
针对机器学习中含残缺项的数据不能被有效利用,导致分类和回归准确率不高的问题,提出了一种近似补全方法——k-ANNO方法。给定残缺的数据样本,该方法首先通过离线构建的图结构来近似搜索与该样本最接近的k个近邻顶点,然后采用快速二次规划估计各近邻的最优权重,最后基于权重值来补全样本中的残缺项,用户可以根据实际需求在补全效率与准确性之间折中。k-ANNO方法较好地解决了机器学习中普遍存在的数据残缺问题,有效抑制了数据残缺对分类和回归精度的干扰。利用多份公开数据集评估了k-ANNO方法的补全效果,结果表明:当加速比在2~10之间时,k-ANNO方法的分类错误率比已有的均值补全、C均值补全、自组织映射补全方法低1%~4%,回归均方根误差比已有方法低约0.5~2.0;当样本规模为4 000时,在不同加速比参数下,k-ANNO方法的计算效率比朴素k近邻方法高约35%~320%。  相似文献   

15.
提出了一种网格自动划分的方法映射数值求解方法,并结合冶金中的传热问题,阐述其具体实施过程·以TurboC为开发工具,编制了复杂求解域的有限元网格自动划分程序,该程序在TurboC20集成开发环境上,调试运行通过·通过验证,本方法不但对凸域行之有效,而且较成功地解决了凹域问题·  相似文献   

16.
提出了一种全四边形网格生成算法.该算法先离散区域的边界,然后从边界开始向内部生成网格,根据边界上相邻节点内角的特征采用不同的生成策略.实现时进一步采用局部处理的方法,效率较高.由于只考虑区域的局部特征,网格质量较好,通用性较强.最后给出了网格生成的实例.  相似文献   

17.
刘风秋  李健宗 《广西科学》1995,2(1):15-19,48
提出了一套新的完整的平面有限元网络自动剖分方法,着重介绍网格自动剖分的基本原理、推导过程、程序设计思路以及其它计算数据的前处理。  相似文献   

18.
针对目前癫痫自动检测算法多集中于为单个患者建立检测模型,泛化能力较弱的问题,提出一种基于机器学习的跨患者癫痫自动检测算法.该算法使用多个癫痫患者的脑电数据,先对数据进行预处理后分析脑电数据间存在的特征,再对特征进行筛选,训练出一个跨患者的癫痫自动检测模型.该算法不需为每个患者建立单独的检测模型,实现了仅使用一个检测模型...  相似文献   

19.
针对基于模型以及基于规则的故障诊断方法的局限性,运用数据驱动的方法对变速器传感器进行故障诊断。使用逐步回归算法建立传感器模型,将实际传感器输出与传感器模型输出相减得到残差序列;用小波包变换(WPT)对残差序列进行分解,提取节点的香农熵作为特征值;最后,用概率神经网络(PNN)对不同传感器故障的特征值进行识别。使用硬件在环仿真获取车辆行驶过程中的变速器信号对该方法进行验证。结果表明:该方法的诊断正确率达到98.50%,在不同的样本划分情况下诊断正确率变化很小。此外,还对其他多个变速器传感器进行了故障诊断,诊断正确率均在较高值,证明了该方法的普适性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号