首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
探讨了IRT背景下非随机缺失数据的合适处理方法.采用IRTLAB模拟产生50批500个被试在20个0-1记分项目上的反应数据,产生了不同比率的MNAR; 再用IN、NP、FR、CM、MI和EM共6种方法分别处理MNAR,使用BILOG-MG软件估计被试的能力参数,并计算在不同条件下各种方法的BIAS、BIASabs、R(θ,θ)和RMSE.研究发现:随着缺失比率的增加,参数误差越来越大; FR会导致IRT参数估计产生较大的误差,且不稳定,而MI与EM算法则相对稳定; 综合BIAS和RMAE等几个指标,NP在处理MNAR时产生的误差较小也更稳定.因此,在IRT背景下估计被试能力参数时,应选择NP、MI或EM方法处理缺失数据  相似文献   

2.
在项目反应理论(IRT)框架下,主要任务是对被试进行能力参数估计和项目参数估计。由于参数估计主要是极大似然法,而这种方法用到Newton—Raphson的多重迭代,因此,初始估计的精度要求较高。本文使用两种估计作为(IRT)的初始估计能使迭代较快收敛,对参数估计起到很好的作用。  相似文献   

3.
该文在不同条件的组合下考查了EM算法和MCMC算法对3种常用的认知诊断模型(DINA模型、DINO模型和G-DINA模型)的参数估计返真性问题.借助项目参数或作答概率分布的偏差、均方根误差、平均绝对离差以及被试的平均属性判准率等指标,评价这2类算法的表现.模拟研究结果表明:MCMC算法更适用于低质量题目、小样本、测验短的条件,而在其他条件下EM算法的表现与MCMC算法的表现相当.  相似文献   

4.
项目反应理论(Item response theory, IRT)是教育心理测量理论中发展较快的理论之一,称名反应模型是IRT中一个基本的项目反应模型. 该文借助2015年de la Torre提出的一种参数估计方法—打折似然方法,将它与拟牛顿法中的BFGS方法结合对称名反应模型的参数进行估计. 模拟研究表明:新的估计方法可有效地减少计算量.  相似文献   

5.
针对马尔科夫链蒙特卡洛(MCMC)做参数估计因初值不好而链长太长且耗时太久的缺陷,利用MonteCarlo模拟进行研究,结果发现:使用MCMC进行估计项目反应理论中2PLM的未知能力参数和项目参数,当样本量或项目量较大,且链长较短时,初值作用明显,比较准确的初值估计精度更高.这个发现可以在一定条件下,弥补MCMC耗时太久的缺陷.  相似文献   

6.
该文选择了一种极小判别信息估计(MDIE)方法,用于项目反应理论中参数估计.根据项目反应理论的思想将MDIE中观察的离散概率分布向量由EM算法中的人工数据导出,得出一种新的估计方法,称之为MDIE/EM.Monte Carlo模拟显示对于被试人数多、项目个数中等情形,以估计精度为评价指标,新估计方法优于BILOG给出的估计.  相似文献   

7.
经典测验理论与项目反应理论的对比研究   总被引:8,自引:0,他引:8  
经典测验理论(CTT)的主要缺点有对测题难度、区分度及测验信度的估计依赖于被试组,对被试能力的估计依赖于所使用的测验题目,只提供平均测量精度等.而项目反应理论(IRT)则有参数不变性的优点,并能给出不同水平被试的测量精度.CTT有使用方便的优点,而IRT的理论体系尚需进一步完善.二者将互相促进,共同发展.  相似文献   

8.
探讨了GIRT的2参数模型参数估计的稳健性和估计精度,并探讨了GIRT与IRT下的2参数模型估计结果的一致性.研究结果发现:在小规模评估时,GIRT的2参数模型参数估计具有较强的稳健性和较好的估计精度;与IRT框架下同类模型的估计精度相比,2个模型的估计精度相近.表明GIRT模型是一种可供选择的、可行的、有效的群体评估方法.  相似文献   

9.
应用两参数正态双卵模型,对反应时间数据建立了关于项目反应与反应时间的分层联合模型.利用Box-Cox变换,完成了基于马尔科夫链蒙特卡洛算法(MCMC)的贝叶斯方法参数估计;应用偏差信息准则(DIC)比较了不同模型对数据的拟合效果,验证了对反应时间数据做Box-Cox变换之后其正态性效果要明显优于对数变换.  相似文献   

10.
在项目反应理论(IRT)框架下,采用计算机化自适应测验技术实现对情绪智力的智能测评.基于IRT系列分析(含单维性检验、模型拟合检验、局部独立性检验以及项目质量分析),构建了符合IRT测量学要求的情绪智力测评的题库,并以此为基础探讨了计算机化自适应测验技术在情绪智力智能测评(CAT-EI)中的应用.实验结果表明:(i)CAT-EI相关算法具有较高的参数估计精度,同时具有较理想的测量信度和效度;(ii)CAT-EI可使用较少的题量(Mean=9.88题)达到使用整个题库(67题)的测量精度,它一方面能做到减轻被试的测试负担,另一方面实现了对情绪智力高效、快速、准确的智能测评.总之,该研究为实现对情绪智力智能测评提供了一种新的测量技术支持.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号