首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
本体学习技术是利用本体工程技术和机器学习技术等众多学科技术来实现本体(半)自动构建的一项技术。通过研究中文本体学习这一领域存在的问题,提出了基于遗传算法和种子概念的本体概念提取算法。介绍了当前基于非结构化数据源的本体概念主要提取算法,在遗传算法和种子概念的基础上,设计了一种基于非结构化数据源的本体概念提取算法。实验证明,本算法在特定领域本体学习方面取得了良好的效果。  相似文献   

2.
研究基于Boosting的柑桔溃疡病自动识别算法.提出了一种基于特征选择准则的Boosting 学习算法,采用对称交叉熵作为弱分类器的相似度评价.将弱分类器相似度与Boosting学习过程相结合学习出更优化的弱分类器,对溃疡病斑图象进行特征选取和学习,建立了自适应的病斑特征模型,最后利用该模型完成溃疡病自动识别.实验结果表明,这种算法避免了Boosting算法进行特征提取时的缺点,减少了选取结果中的冗余,尤其在进行高维特征选取时,能够提高特征选取速度,使选取的特征更具代表性.  相似文献   

3.
胡正平  吴燕  张晔 《系统仿真学报》2005,17(11):2610-2612
为克服经典区域增长算法中生长规则以及特征选取的困难,提出了基于支持向量机的多目标并行区域增长图像分割算法。首先交互选择多个不同区域的种子点(假设邻近种子点的一小部分区域属于同一目标区域,不同种子点邻域分别属于不同目标区域),利用其邻域构造训练样本;然后利用这些已知的训练样本训练支持向量分类器;在区域增长过程中,利用训练所得的支持向量模型建立增长规则。为了避免初始种子点位置选择对算法性能的影响,采用了多区域并行竞争增长策略。仿真实验获得了较好的分割效果,表明提出的算法是合理可行的。  相似文献   

4.
交货期窗口下的并行机调度问题的遗传算法   总被引:9,自引:0,他引:9  
给出了一种求解不同交货期窗口的并行机调度问题的混合遗传算法,根据问题的特征采用扩展排列编码方式表示工件的分配和排列,利用给出的调度优先级规则和最好适应值规则相结合的启发式算法对每台机器上工件的顺序进行调整,实验表明所给的算法是有效的。  相似文献   

5.
针对网络的异常检测方法对未知攻击难以提供更多有用信息的缺点,提出一种基于分类器的异常检测模型。模型首先采用支持向量机对网络连接进行异常检测,然后将检测获得的异常作为输入进入聚类模块以得到其更多信息,其中聚类模块由自组织映射算法与信息获取算法共同完成。通过对检测到的异常进行信息获取的方法可以获得未知入侵的更多有价值的信息。最后应用kddcup99数据集进行仿真实验,实验结果表明,该检测模型具有较好的检测率和较低的误报率,并且该模型对于获得未知入侵的更多信息是有效的。  相似文献   

6.
针对经典区域增长算法中生长规则以及特征选取困难的问题,提出基于可拒识双层支持向量机模型的多目标并行区域增长图像分割算法。首先交互选择多个不同区域的种子点,并交互选择属于每个目标区域的子块和非目标区域的子块形成双层支持向量机训练样本;然后利用这些已知的训练样本训练双层支持向量分类器;在区域增长过程中,首先利用第一层的最大间隔超平面的支持向量分类器(SVC)进行分类判决,对属于该区域的点再利用第二层的支持向量域数据选择器(SVDD)进行拒识或接受处理,最后利用两层分类器的结果进行综合判决。为避免初始种子点位置选择对算法性能的影响,采用了多区域并行竞争增长策略。仿真实验获得了较好的分割效果,实验结果表明,提出的算法是合理可行的。  相似文献   

7.
基于隐马尔可夫模型的文本信息抽取   总被引:30,自引:2,他引:28  
文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐马尔可夫模型进行文本信息抽取。仿真结果表明,新的算法在精确度和召回率方面有明显的提高。  相似文献   

8.
一种新的基于NGA/PCA和SVM的特征提取方法   总被引:1,自引:0,他引:1  
提出了一种使用小生境遗传算法(NGA)和主成分分析(PCA)对支持向量机(SVM)进行封装的方法来选择特征子集。该方法首先使用PCA得到特征向量,然后产生若干随机特征向量子集,从而得到新的特征空间,将所有训练样本映射到这个特征空间来训练支持向量机,再使用支持向量机的半径间隔方法对每个特征向量子集的性能进行评价,最后使用小生境遗传算法来共享适应度,以及进行选择、交叉和变异操作得到新的特征向量子集,重复这个过程直至得到最优的特征向量子集。使用UCI数据集进行了相关的实验,实验结果表明了该方法可以减少特征的数量以及提高分类正确率。  相似文献   

9.
为降低H.264跳帧转码运算复杂度,在帧间模式选择中引入支持向量机(support vector machine, SVM)技术,提出一种SKIP模式提前判决算法,具体讨论了关键的特征向量与核函数的选择方法。同时,利用宏块时域相关性缩减预测模式数量,实现率失真优化提前终止。其次,通过定义宏块运动程度参数,针对不同运动程度的视频序列自适应地选择运动矢量合成算法和运动搜索策略,有效减少在已获得最佳运动矢量后仍进行运动搜索的运算冗余。实验证明,此算法极大降低了算法复杂度(平均84%)的同时保证了较高的视频质量,与现有算法相比,具有更强的鲁棒性和更广泛的适用性。  相似文献   

10.
针对渐进直推式支持向量机学习算法存在每次标注的无标签样本数太少,当样本较多时,频繁的成对标注和重复训练使得该算法复杂及增加的缺陷,提出了一种快速算法。该算法在训练过程中利用区域标注法取代PTSUML的成对标注法,在继承了其渐进赋值和动态调整的规则的同时,提高了算法的速度。雷达实测数据实验结果表明该算法是有效的。  相似文献   

11.
对数据进行非监督聚类是中医临床研究的主流和难点.提出了一种非监督的复杂系统熵聚堆算法.它改进了关联度系数,不但能实现自组织非监督聚类,而且可以实现一个变量分在不同的类里;提出并证明了N-class相关的概念,加快算法的收敛速度.它运用到中风病临床数据中,非监督地提取出了中风病中常见的证候,结果十分符合临床; 参考数据的辨证结果对算法进行了验证,得到算法的敏感度为97.3%, 这验证了算法的有效性.它为中医临床治疗中风病的规范化奠定了数理基础.  相似文献   

12.
教育数据挖掘(educational data mining)是当代教育信息化发展的前沿研究领域,正在吸引越来越多教育学家和数据科学家的关注."大数据"时代背景下,随着数据处理规模的不断激增,现有的数据挖掘模型在单一处理节点的计算能力遭遇瓶颈,各类面向大数据处理的分布式计算框架应运而生.借助这些框架,面向解决高校就业数据挖掘问题的机器学习模型便可以满足未来大规模数据处理的需求,在未来数据集体量庞大的信息集成系统中为数据挖掘和决策支持提供帮助.以此为背景,本研究对比现有数据模型对研究目标对象的分类性能,提出了以引入输入特征加权系数来计算特征的信息增益作为特征最优分裂评判指标的改进随机森林模型来提升数据分类性能,通过仿真测试改进模型对于现有模型分类性能的提升情况,与此同时为解决大数据时代背景下面向海量数据分类任务的单节点性能瓶颈问题,提出了基于分布式改进随机森林算法的大规模学生就业数据分类预测模型.通过使用MapReduce分布式计算框架实现已训练模型在本地磁盘与分布式文件系统之间的序列化写入与反序列化加载过程,进而实现了基于改进随机森林模型的大规模数据分类模型的分布式扩展.  相似文献   

13.
王孙安  王斌  庄健 《系统仿真学报》2004,16(6):1165-1167
针对工业过程中子系统同构异参难以控制的问题,提出了一种获取控制规则的方法。该方法效仿人工免疫网络维持免疫应答稳定平衡的机理在线学习不同操作工人的控制经验,通过免疫进化和学习来优化已有的控制经验,并对该算法进行了初浅分析,且应用于生物发酵罐的温度控制。仿真和实验表明:该算法具有分布学习的能力,控制效果优于手工控制,能够较好的解决同构异参过程控制问题。  相似文献   

14.
由于民航周围电磁环境复杂, 一旦产生电磁干扰(electromagnetic interference,EMI), 就不易被排查, 特别是随机性较强的宽带干扰。对此, 提出一种基于支持向量机(support vector machine, SVM)的干扰源识别方法。通过实时测量干扰信号的频谱数据, 并分析其特点, 选择包络因子、频谱能量、频谱峰值、均值和方差5个特征向量, 用主成分分析法降低数据冗余程度, 最后采用SVM来判断干扰源类型。仿真结果证明, 所提算法能有效识别6类典型机场宽带干扰源, 识别精度可达98.33%。  相似文献   

15.
采用并行协同进化遗传算法的文本特征选择   总被引:1,自引:1,他引:0  
现有的文本特征选择方法都是串行化的, 应用于海量文本数据集时时间效率较低, 因此利用并行思想来提高文本特征选择的效率, 已成为文本挖掘领域的一个研究热点. 本文将 遗传算法和并行协同进化算法结合起来, 在粗糙集的基础上设计了一个并行协同进化遗传算法 并将该算法用于文本特征选择. 该方法采用遗传算法搜索特征, 利用并行协同进化算法来提高 时间效率, 从而较快地获得较具代表性的特征子集. 实验结果表明该方法是有效的.  相似文献   

16.
以绿色制造为背景,假定机器设备具有不同的能源消耗成本或维护成本,研究了一类考虑成本限制的平行机调度问题.调度的目标是最小化最大延迟时间.为该问题建立了整数规划模型MIP,设计了改进的EDD (earliest due date firstly)算法,命名为MEDD.由于考虑成本限制,证明了MEDD算法的可行性,并进而理论分析了算法的最坏误差界.通过算例说明了算法的执行情况,同时采用大量随机数据实验验证算法的性能.对于小规模问题,将MEDD的解与MIP的精确解进行了对比;对于大规模问题,由于MIP精确解难以获得,以MIP对应的线性规划松弛模型MLP的最优值为下界对MEDD算法的解进行了衡量.实验结果表明了所构建MEDD算法的有效性.  相似文献   

17.
区间型时间序列数据大量存在,但在时序数据的预测方法中,对这种类型的数据进行点预测没有相关研究。借助支持向量机(SVM),在区间时间序列数据回归算法的基础上,通过区间数据相空间重构,建立了时间序列的支持向量区间预测SVIP方法。在实验仿真环节中,通过两个仿真实例验证了该方法的良好性能,同时与采用Elman神经网络方法的预测结果进行了分析比较,说明了SVIP方法的优点。  相似文献   

18.
针对实际工程系统故障建模困难、现有故障预报方法实时性差的问题.从一类挖掘的角度,设计了一种基于一类支持向量机的时间序列暂态挖掘算法,提出了一种既不需要系统近似模型也不需要故障训练数据和先验知识的直接故障预报方法.在系统运行的同时实现学习和预报.提高了实时性.同时该方法简单易用,克服了传统方法在预报故障前需要预测系统未来状态的缺点.具有很强的应用意义.以釜式反应嚣为对象进行的仿真实验证明了方法的有效性.  相似文献   

19.
基于多维伪F统计量的基因表达动态聚类分析方法研究   总被引:2,自引:1,他引:2  
K-均值聚类分析算法是一种广泛应用于基因表达数据聚类分析中的迭代变换算法,它通过指定类别数K-基于给定的聚类目标函数,并采用迭代更新的方法,使得最终的聚类结果的目标函数值为极小值,达到较优的聚类效果。针对K-均值聚类分析算法存在参数依赖性强,且在整个聚类过程中类的数目无法改变的缺点,引入动态调整聚类个数的思想和多维伪F统计量,提出了一种基于多维伪F统计量的基因表迭动态K-均值聚类算法。实验结果表明该算法可以动态调整聚类个数,给出最佳聚类数目,从而获得较好的聚类质量.  相似文献   

20.
为了提高稀疏最小二乘支持向量机对高维、异构数据的泛化性能,提出新型的基于压缩感知的稀疏多核最小二乘支持向量机算法。首先根据压缩感知理论,用正交匹配追踪算法对最小二乘支持向量机的支持向量进行稀疏化,再利用线性多核扩展法求出新的核函数矩阵。将新的核矩阵应用到最小二乘支持向量机,得到稀疏多核最小二乘支持向量机的解,用稀疏的支持向量实现函数回归。理论分析与数据实验对比结果表明该模型对于高维、异构数据能够更快更准确地进行训练,大大提高了模型的泛化能力和运算速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号