首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 506 毫秒
1.
项目反应理论主要研究被试在测验项目上的反应和成绩与潜在特质间的关系,能否有效的估计模型中的参数是项目反应理论能否得以应用的前提。数据的完整性对参数估计有一定的影响。而项目反应过程中,数据的缺失是常见的。缺失数据的机制影响了处理方法。因此,针对不可忽略缺失数据,利用潜变量建模法,采用等级评分模型拟合观测指标,Rasch模型拟合缺失指标。同时用Gibbs抽样法抽取参数,给出估计。通过模拟研究,验证了所用方法有效的减小了由于忽略缺失数据估计参数时产生的偏差。  相似文献   

2.
项目反应理论(IRT)是教育测量中的重要模型.在被试的项目反应存在缺失的情况下,曾莉等给出了0、1评分的IRT模型参数估计的2种MCMC算法.本文将这2种算法推广到等级反应模型(GRM),并将估计结果与传统的Multilog软件(将缺失统一替换为0)的估计结果进行比较.通过模拟研究,比较了在不同缺失机制、不同参数先验分布、不同被试人数和不同缺失比例下2种MCMC参数估计的结果,为实际应用中GRM的参数估计方法的选择提供参考.  相似文献   

3.
针对统计方法难以解决小样本条件下项目反应理论(IRT)项目参数问题,提出了运用广义回归神经网络(GRNN)集成对小样本条件下项目参数进行估计的方法,运用计算机模拟的方法产生项目参数的真实值,根据双参数逻辑斯蒂模型得到被试的反应矩阵。运用经典测验理论方法得到项目难度和区分度的统计量,将其作为神经网络的输入,以模拟产生IRT的项目参数作为网络的输出,对GRNN进行训练。并且对30个神经网络加以集成,将它们在测试阶段得到输出值的平均值作为IRT参数的估计值。结果表明,神经网络集成可以得到比统计方法和单个神经网络更好的参数估计结果。  相似文献   

4.
在项目反应理论(IRT)框架下,主要任务是对被试进行能力参数估计和项目参数估计。由于参数估计主要是极大似然法,而这种方法用到Newton—Raphson的多重迭代,因此,初始估计的精度要求较高。本文使用两种估计作为(IRT)的初始估计能使迭代较快收敛,对参数估计起到很好的作用。  相似文献   

5.
将c、γ参数加入到Samejima等级反应模型中形成4参数等级反应模型(4参数GRM),该模型包含了两级记分1、2、3、4参数Logistic模型、Samejima等级反应模型.4参数GRM适合测验中的多级和两级记分试题,也可以适合两级记分试题的猜测现象和失误现象.Samejima等级反应模型下,被试作答的猜测现象会导致能力高估现象,失误现象会导致能力低估现象.在4参数GRM下,被试能力高估现象和低估现象均得到了有效的纠正.  相似文献   

6.
根据同一被试在锚题上的得分概率向量的模式应该十分相似的直观想法,该文提出了一种新的项目反应理论框架下的等值准则——余弦准则.我们采用GPC模型,利用Monte Carlo模拟方法将余弦准则与Haebara等值准则(Hcrit)和Stocking-Lord等值准则(SLcrit)进行比较.研究结果表明,当项目参数估计精度较高或中等而A的取值范围在0.9~2.0之间,新方法往往比Hcrit和SLcrit方法估计的误差小且有显著性差异.  相似文献   

7.
3参数等级反应模型及其参数估计   总被引:1,自引:1,他引:0  
基于Samejima等级反应模型,将项目猜测度融合到3参数等级反应模型中,且开发了相应的项目参数估计程序,使用模拟数据和实测数据对程序进行了检验;并且证明了如果忽略项目的猜测度,会使能力估计的精度虚假地升高.  相似文献   

8.
基于混合项目反应理论模型, 实现了对客观题组和主观测试组成项目结构的模型构建, 并给出一种改进人工蜂群算法实现该混合模型的参数估计. 在模拟数据上通过与Winbug的对比结果验证了利用改进人工蜂群算法估计混合模型参数的有效性.  相似文献   

9.
该文在不同条件的组合下考查了EM算法和MCMC算法对3种常用的认知诊断模型(DINA模型、DINO模型和G-DINA模型)的参数估计返真性问题.借助项目参数或作答概率分布的偏差、均方根误差、平均绝对离差以及被试的平均属性判准率等指标,评价这2类算法的表现.模拟研究结果表明:MCMC算法更适用于低质量题目、小样本、测验短的条件,而在其他条件下EM算法的表现与MCMC算法的表现相当.  相似文献   

10.
利用广义阶层线性模型研究具有DIF铆题时的测验等值,在进行等值时能有效地控制DIF效应,并与传统方法--有DIF铆题但等值时忽视DIF的存在下等值进行比较,从DIF效应值大小、铆题中DIF项目数和被试数等3个因素来考察两种方法对参数的估计或等值精度的影响.模拟研究发现采用广义阶层线性模型较传统方法参数估计或等值精度要高,除了DIF项目数和DIF效应值外,被试数也是影响参数估计精度的-重要因素.  相似文献   

11.
传统的纸笔测验无法有效地满足全部被试的能力估计的要求,计算机化自适应测验(CAT)能够不断根据被试的作答来估计其能力,并抽取与此能力相适应的项目来,选题是CAT的关键.先介绍了CAT的概念和原理,然后借助项目信息函数重点研究了一种CAT的选题方法.  相似文献   

12.
在项目反应理论(IRT)框架下,采用计算机化自适应测验技术实现对情绪智力的智能测评.基于IRT系列分析(含单维性检验、模型拟合检验、局部独立性检验以及项目质量分析),构建了符合IRT测量学要求的情绪智力测评的题库,并以此为基础探讨了计算机化自适应测验技术在情绪智力智能测评(CAT-EI)中的应用.实验结果表明:(i)CAT-EI相关算法具有较高的参数估计精度,同时具有较理想的测量信度和效度;(ii)CAT-EI可使用较少的题量(Mean=9.88题)达到使用整个题库(67题)的测量精度,它一方面能做到减轻被试的测试负担,另一方面实现了对情绪智力高效、快速、准确的智能测评.总之,该研究为实现对情绪智力智能测评提供了一种新的测量技术支持.  相似文献   

13.
应用项目反应理论的区分度、难度和信息函数峰值3个参数对Armsden和Greenberg(1991)的父母同伴依恋量表进行修订,目的:使修订后的量表更能精确地调查中国初中生的依恋现状。结果:父母同伴依恋量表符合单维性检验,可以根据项目反应理论进行修订。新量表的区分度a值和难度b值具有合理的取值范围。新量表的测验信息峰值函数变小,具有更高的信度。新父亲和同伴依恋量表均包含两个因子:信任和沟通。新母亲依恋量表包含的因子个数和原量表相同:信任、沟通和疏离。经正式施测,修订后的量表可以有效地调查中国苗族初中生的依恋现状。  相似文献   

14.
探讨了MCMC算法在多级评分项目反应模型参数估计中的实现及其估计精度.针对等级反应模型,基于数据扩充技术,提出了一种高效灵活的Gibbs抽样方法,得到了各个参数的Markov链.随着潜在变量的引入,每个参数的满条件分布为相应参数的先验分布的截断分布.这种抽样方法适用于任何类型的先验分布,不受先验分布形式的约束.对应每个...  相似文献   

15.
针对在实际测验中各等级的猜测参数、失误参数可能存在不一致性问题,该文提出等级反应模型的改进模型.以2等级项目为例,通过模拟数据检验模型发现:使用4参数GRM模型估计参数的误差随着猜测参数和失误参数的各个不一致性而增大,而改进后的模型具备更好的稳定性.在实际的地理测验中,发现等级反应项目中的猜测度较低,但失误现象明显,并且参数之间的差异性较大,不可以忽略.  相似文献   

16.
项目反应理论主要有3个基本假设:单维性,局部独立性和单调性。但是这3个假设存在一些弊端亟待解决。一些科学研究表明,用单维模型来模拟多维测量数据往往会增大测量误差,导致对学生的能力做出不正确的推论。因此,研究者基于各种不同的测验背景,将单维项目反应模型推广到多维项目反应模型。多维项目反应模型涉及到的参数较多,如果采用传统的估计方法,如边际最大似然法和贝叶斯众数估计法处理起来比较困难。然而,在项目反应理论中,Gibbs抽样法可以作为一种高效灵活的估计方法加以应用。基于Gibbs抽样的增加数据的技巧,给出了多维二参数Logistic项目反应模型的Bayes估计方法。随着潜在变量的引入,每个参数的满条件分布都很容易得到,并且不受先验分布选取的限制,这样Gibbs抽样的方法就很容易实施。  相似文献   

17.
通过对隐私保护频繁项集挖掘问题的研究,发现现有的单参数随机化回答模型调控的数据范围宽、粒度粗,导致无法实现精细化、差异化的隐私保护的问题.在沃纳模型、单参数等随机化模型的基础上,提出个体分组多参随机化PN/g模型,给出其在隐私保护频繁项集挖掘中的支持度重构方法.研究结果表明:该模型面向多样化、差异化的隐私保护需求,将N个不同个体分为若干组,每组设置不同的随机化参数,可实现差异化的隐私保护效果.实例分析表明:结合所提出的支持度重构方法,可实现基于分组随机化的隐私保护频繁项集挖掘,在保护不同群体隐私的同时,挖掘到有效的频繁项集与关联规则.  相似文献   

18.
讨论项目反应理论的3个主要数学模型,用实例说明如何应用项目反应理论来评价试卷质量,并把所得结果与经典项目分析作比较.  相似文献   

19.
构建基于计算机自适应的大学生社会责任感测验的题库,并基于真实数据模拟CAT过程,检测CAT的测验效率并探讨用CAT测量社会责任感的可行性.使用探索性因素分析对测验进行单维性检验,根据项目反应理论选择高质量的项目,构建基于计算机自适应的大学生社会责任感测验(CAT-SRS).然后,基于纸笔测验的实测数据进行CAT模拟,验证CAT-SRS的有效性.研究结果表明:CAT-SRS符合项目反应理论等级反应模型的假设,各个参数比较理想,测量结果与5个原量表纸笔测验结果的相关性较高.CAT-SRS可在测验长度较短时实现对大学生社会责任感的准确测量.  相似文献   

20.
大学英语的教学效果涉及全国几百万学子的外语能力,其意义直接影响着我国经济和社会的发展.作为一种经典的能力测验评分手段,项目反应理论应用于大学英语教学效果的评价是一种新的尝试.本文利用项目反应理论,对大学英语考试构建了一个多级评分的考生能力评价模型,它可以作为单级评分的二参数logistic模型的推广.同时对于能力参数,我们给出了极大似然估计的迭代步骤.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号