首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
对属性层级模型(AHM)和确定性输入、噪声"与"门模型(DINA)2个认知诊断模型,讨论不同因素对判准率的影响.实验表明,含有可达阵的测验比不含可达阵的测验判准率高.对于线型结构测验长度达到一定值以后,增加测验长度对诊断准确率的改进不大.虽然总体而言,DINA分类准确性要优于AHM,属性结构紧密度越大,判准率越高;但是AHM估计结果符合属性层级结构,而DINA估计结果却可能违背属性层级关系,这和2011年De Carlo的发现不相同.  相似文献   

2.
在时序数据库中,有许多成熟的技术和方法用来对布尔型属性之间的关系进行挖掘,但对于数值型属性变化趋势关联关系的研究却不是很多.本文提出了一种数值型属性变化趋势的研究模型QMP(QuantityMovementPattern),依据该模型可利用数据挖掘算法发现不同数值型属性之间变化趋势之间的关系.文中分析了该模型的几种实现算法,并给出了一种快速实现算法及实验数据.  相似文献   

3.
针对贝叶斯优化算法(BOA)中学习贝叶斯网络结构时间复杂度较高的问题,提出了一种可以快速收敛的基于K2的贝叶斯优化算法(K2-BOA).为了提升收敛速度,在学习贝叶斯网络结构的步骤中进行了2处改进:首先,随机生成n个变量的拓扑排序,加大了算法的随机性;其次,在排序的基础上利用K2算法学习贝叶斯网络结构,减少了整个算法的时间复杂度.针对3个标准Benchmark函数的仿真实验表明:采用K2-BOA算法和BOA算法解决简单分解函数问题时,寻找到最优值的适应度函数评价次数几乎相同,但是每次迭代K2-BOA算法运行速度提升明显;当解决比较复杂的6阶双极欺骗函数问题时,K2-BOA算法无论是运行时间还是适应度函数评价次数,都远小于BOA算法.  相似文献   

4.
针对K2算法学习贝叶斯网络(BN)结构苛刻的先验节点顺序条件,提出先验信息重构方法来提高算法适用性,让K2算法得到更加精准的网络结构。对于K2算法在较小样本数据中结构精度低的问题,使用模拟退火(SA)算法对其进行优化。利用重构先验信息构建初始网络结构,改进SA算法的邻域求解方法,以求得网络的最优结构。通过学习4个BN结构,将改进的混合算法分别与K2算法和马尔可夫链蒙特卡洛(MCMC)算法进行优劣仿真比较。仿真结果表明:在相同的网络结构和先验条件下,该文改进的混合算法都能更好地识别网络结构,在各网络结构中无论先验经验是否准确,在结构精确度和海明距离方面都具有较强的学习能力。  相似文献   

5.
李晓晴  于海征 《科学技术与工程》2022,22(24):10602-10610
贝叶斯网络源于人们对人工智能领域不确定性问题的研究,是进行不确定问题推理和数据分析的重要工具。结构学习是贝叶斯网络研究的核心内容,K2算法是结构学习的经典算法之一。为解决K2算法学习效果强烈依赖于节点序的问题,本文提出一种新的混合结构学习算法:双重K2算法。该算法首先将节点信息作为初始节点序,通过K2算法的搜索策略得到初始网络结构;然后在初始网络结构上利用拓扑排序得到修正后的节点序;最后K2算法通过修正后的节点序学习得到最优的网络结构。通过实验验证,在精度和效率上,双重K2算法效果优于其它经典算法。  相似文献   

6.
针对Landsat-8数据地表温度(land surface temperature,LST)反演中单通道(single-channel,SC)算法和劈窗算法(split-window algorithm,SW算法)在不同区域的反演精度的不一致性问题,以NOAA地表辐射通量网(surface radiation budget net-work,SURFRAD)中不同地表覆盖类型和不同海拔高度的3个站点为验证站点,选取2018年1月1日—2019年6月30日质量较好的37景不同季节的Landsat-8影像,基于站点实测温度,对比分析Jiménez-Mu?oz等提出的普适性SC(generalized SC,GSC)算法与SW算法的地表温度反演精度.结果表明:GSC算法与SW算法的反演精度呈现出一定的季节依赖性.在春季与冬季,GSC算法的平均绝对误差(mean absolute error,MAE)在1 K左右,SW算法的MAE高于1 K,GSC算法的均方根误差(root mean square error,RMSE)较SW算法分别低约0.37、0.13 K.GSC算法的精度较高,其中,在春季,GSC算法的精度比SW算法精度高约0.53 K;在冬季,GSC算法的精度比SW算法精度高约0.14 K.在夏季与秋季,GSC算法与SW算法的MAE都小于2 K,但SW算法的精度较高.其中,在夏季,GSC算法的精度比SW算法精度低约0.35 K;在秋季,GSC算法的精度比SW算法精度低约0.25 K,GSC算法的RMSE较SW算法高约0.24 K.2种算法与实测温度的相关系数分别为0.9907、0.9922,表现出较为强烈的相关性,SW算法相关性更高.  相似文献   

7.
距离机制是K近邻算法的关键部分,传统的方法是采用欧式距离来讨论各个属性取值的差异,而对于同一属性取值的差异就显得很简单.采用可拓学来定量描述事物属性的关联函数的性质,构造可拓距离应用到K近邻算法中,设计出可拓K近邻算法.为了验证算法的可行性和准确率,分别应用到二维数据的故障诊断和标准数据集的聚类分析中,实验证明该算法是可行和有效的.  相似文献   

8.
代价敏感学习算法的目的是最小化各种代价总和,与其他学习算法一样,它必须面对过度拟合这个挑战性问题,即分类器可以较好地拟合训练数据,但对测试或实际数据的效果较差.针对代价敏感学习的这些缺点,提出两个克服过度拟合的策略.第一个滤波技术策略针对TCSDT分类建立,滤波后的概率估计值被用于对每个分离属性的潜在误分类代价计算,并延缓潜在大误分类代价的分离属性的优先选择,最后,采用交叉验证方法决定m的值.第二个策略与基于标准错误的Laplace剪枝方法不同,阈值剪枝采用一个预先定义的阈值集合(跟代价有关)来确定决策树的一个叶节点是否被剪除.这两策略可独立或联合用于避免TCSDT分类的数据过度拟合.实验表明,所提出的两算法不但在代价敏感学习中有优势,在非代价敏感学习也具有优势,可以有效地减弱过度拟合,有很强的健壮性,UCI数据集实验结果显示算法的拟合能力平均优于存在方法10%以上.  相似文献   

9.
传统的关系模式的BCNF分解算法必须判断“一个关系模式是否为BCNF”,该判断是一个NP-完全问题,因此传统算法缺乏实用性.本文避免这一判断,给出一个关系模式的BCNF分解的新算法,它的时间复杂性是O(kn~2)级的,其中n为模式中的属性个数,K为产生的模式个数.  相似文献   

10.
认知诊断测验设计实质上是测验Q矩阵设计,设计应最大限度覆盖诊断的构念,充分发挥代表认知模型的属性层级关系的重要作用.主张测验充分表达被试知识结构,提倡测验Q矩阵和被试知识状态共享同一层级结构,以实现对被试更加准确的诊断.对于非独立型层级结构,无法实现属性使用次数平衡而应采用题目属性向量使用平衡策略.对Liu Ren(2017)的测验设计提出质疑.  相似文献   

11.
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高.针对这个不足,提出一种特征加权的K-means算法进行优化.首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其...  相似文献   

12.
为解决实时分析处理的海洋 Argo 浮标剖面观测数据特有的数据密度较高、快速响应且需要识别任意形状簇等问题, 提出了一种可通过单次扫描数据集进行有效处理的低复杂度聚类算法 DBIRCH( Density-BasedBalanced Iterative Reducing and Clustering Using Hierarchies)。 该算法通过使用新引入的参数密度阈值修正因子,动态的更新限制 CF(Clustering Feature)树生长的约束系数子空间阈值, 同时结合密度关联思想在不同邻域内多次建立 CF 树且合并, 最终以核心 CF 树子节点为聚类结果输出, 避免了 BIRCH(Balanced Iterative Reducing and Clustering Using Hierarchies)算法对参数的过度依赖, 同时因能处理任意形状簇从而提升了数据处理的整体鲁棒性, 提高了处理 Argo 剖面监测数据的时效性和算法的整体吞吐速度。 为测试算法的综合性能, 使用真实 Argo浮标剖面实时监测数据集, 并根据不同的参数对算法做出多组对比实验, 同时使用不同评价指标对算法从运行时间和聚类准确率上进行综合评估, 从全局角度分析该算法在 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)、 BIRCH 及 DBIRCH 3 种不同算法中综合聚类性能最优。 实验结果表明, 在3 种算法中,BIRCH 算法运算速度最快, 但准确率最低; DBSCAN 算法聚类性能高于 BIRCH 算法, 但运算速度最慢; 改进的DBIRCH 算法运算效率略低于 BIRCH 算法, 但聚类准确率最高。  相似文献   

13.
制造服务流程是一种基于业务流程的制造服务链,它有顺序、选择、循环、并行等4种基本结构,而循环能转化为顺序结构,因而选择结构和并行结构才是真正的分支结构。分支结构的各分支往往会有服务能力差异,这会导致:选择分支会因为概率分配不当将延误时间,而并行分支则会因此出现等待情况,这样,势必会影响制造服务流程整体的执行效率。为此,提出了QoS保证的一种时间改进的制造服务流程优化方法。构建了制造服务流程基本结构的属性计算方法,在分析了几种分支结构的时间与其他属性因子之间的影响关系后,基于QoS约束,构建了分支结构时间优化的分层分块线性规划模型,并设计了分层分块的线性优化算法。经实验,优化后的业务流程执行时间提高了5.4%,表明所建模型及其优化算法是有效且合理的,对云制造的应用具有积极意义。  相似文献   

14.
针对传统Otsu算法在藻类养殖区分布信息的自动化提取过程中存在欠/过分割、计算量大和运算效率低等问题,提出一种优化的藻类养殖区自动化提取Otsu算法(GA-Otsu).GA-Otsu算法在最大类间方差的基础上,引入类内方差,共同参与阈值选取,提高藻类阈值选取的准确性,并用遗传算法代替遍历法快速搜索最优解,实现藻类养殖区...  相似文献   

15.
时空聚类(spatial-temporal density based spatial clustering of applications with noise,ST-DBSCAN)算法只能处理固定属性的时空数据,且其人为设定阈值的方法具有较大随机性会导致聚类结果不理想.基于ST-DBSCAN算法存在的不足,提出了一种改进的多属性时空聚类算法.改进后的新算法采用绘制时空对象距离频数柱状图来设定自适应阈值,通过引入Gower相似系数、Dice相似系数与欧几里德距离来构建多属性相似度模型,计算多个事务对象之间属性特征的相似度大小,从而将ST-DBSCAN时空聚类算法扩展到更多属性的时空数据聚类分析中.以北京市计算机行业职位招聘信息数据进行实验仿真,实验结果表明,新提出的阈值设定方法可以有效识别部分低密度簇,提高聚类的准确性和有效性;改进后的算法具有较好的普适性与包容性,能对多属性的时空数据进行很好的聚类分析.  相似文献   

16.
汇编语言程序相似性检测混合算法   总被引:1,自引:0,他引:1       下载免费PDF全文
根据汇编语言自身的特点,提出了结合属性计数和结构度量技术的相似性检测混合算法.在该方法中,将程序段的数目、子程序定义和调用的次数、循环指令loop出现的次数、转移指令出现的次数作为结构信息,73个使用频率较高的关键字作为属性信息.在从汇编语言程序中提取这些信息后,利用卡方检验来判断2个程序的相似性.实验结果表明,从混合...  相似文献   

17.
大量分布式电源接入配电网使其结构复杂多变,导致标准遗传算法故障定位效率和准确性受到影响。根据配电网运行的实际情况搭建故障定位数学模型,对标准遗传算法的开关函数和评价函数进行改进,提高了算法的容错性和准确性;引入配电网分级处理的概念,对配电网进行分区处理,将整个配电网分为若干个独立区域,缩短了算法中解的维度,从而提高算法定位的效率;最后通过MATLAB对不同故障类型算例进行仿真,结果表明改进后的遗传算法在含分布式电源的配电网中有很好的容错能力,通过对其仿真时间和精准度进行分析,结果表明算法运算效率和准确性都很高。  相似文献   

18.
针对毫米波雷达数据均匀性差,数据量小,噪点多等问题,提出一种基于DBSCAN (density-based spatial clustering of applications with noise)的雷达自适应聚类算法.改进算法能够根据K近邻距离和目标反射截面自适应调整聚类半径.首先给出一种聚类半径根据K近邻距离动态调整的机制:目标第K个近邻的距离与阈值相比较,以确定阈值半径取值.再提取雷达提供的目标反射截面,基于该值计算目标假象半径作为聚类半径的补充量.实现根据目标反射截面与数据稀疏程度自适应聚类的效果.将改进算法与不同参数的DBSCAN聚类算法在真实雷达点云数据进行实验对比.相较于选取合适参数的DBSCAN算法,改进算法能够更好适应毫米波雷达点云特征,对行人目标识别准确率提高4.18%,对车辆目标识别准确率提高5.63%.  相似文献   

19.
洪月华  徐霜  梁家荣 《广西科学》2013,20(2):128-131,136
为了实现对无线传感器网络监测得到的高维冗余且不确定的数据进行分类识别,提出一种由遗传算法和粗糙集进行优化的BP神经网络数据分类器模型,并形成了数据挖掘分类算法。该模型通过粗糙集理论的属性约简算法删除训练样本的冗余属性,利用遗传算法对神经网络的权值和阈值进行优化,并进行神经网络学习。数据挖掘分类算法学习速度快,能够有效提高无线传感器网络中数据的分类效率。  相似文献   

20.
在网络入侵异常检测中,数据预处理是一个非常重要的步骤,数据预处理的好坏直接影响后续检测的准确性.本文针对基于层次聚类的网络入侵异常检测中两个问题,在数据预处理阶段做出改进,一是属性冗余和属性权重问题,运用粗集理论对各个属性赋予权重并进行属性约减,二是粗集理论中连续数据离散化问题,提出了针对数据特点的自适应离散化算法,该算法是根据样本属性值分布来决定离散间隔,最后针对两个改进方法进行了实验,并与采用现有离散化方法进行了对比,实验结果证明了该算法的有效性和准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号