首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
经典测验理论与项目反应理论的对比研究   总被引:8,自引:0,他引:8  
经典测验理论(CTT)的主要缺点有对测题难度、区分度及测验信度的估计依赖于被试组,对被试能力的估计依赖于所使用的测验题目,只提供平均测量精度等.而项目反应理论(IRT)则有参数不变性的优点,并能给出不同水平被试的测量精度.CTT有使用方便的优点,而IRT的理论体系尚需进一步完善.二者将互相促进,共同发展.  相似文献   

2.
范晓玲  廖利国 《科技信息》2009,(34):341-342
对于教育评价计量单位的"分"来说,只有分数等值,测验同一心理特质的不同版本的测验分数之间才具有可比性,从而保证测验的公平性。要使这些分数可以直接比较就必须进行测验等值,测验等值已成为教育测量研究和应用的一个重要问题,也成为教育管理部门重视的问题。与经典测验理论(CTT)相比,基于项目反应理论(IRT)的等值方法,被认为是比较理想的。  相似文献   

3.
目前,心理测量领域中主要存在三大理论派别,即经典测验理论(CTT),概化理论(GT)和项目反应理论(IRT),前两者同属于随机抽样理论,GT是对CTT的扩展和改进,是现代心理测量界最有影响的理论之一.在回顾了概化理论的研究内容和有关理论的基础上,介绍了概化理论产生的背景、优缺点、主要概念和研究设计以及在我国的应用研究.  相似文献   

4.
本文利用经典测量理论(CTT)和项目反应理论(IRT),对用于我国民族地区义务教育数学学业水平测试的试卷质量进行了质性和量化分析,并对CTT和IRT得出的部分结果进行了对比分析.结果表明,测试卷质量总体良好;IRT具有项目参数和被试能力参数不变性的特征,能更加真实全面地反映出学生的能力水平.  相似文献   

5.
在项目反应理论(IRT)框架下,采用计算机化自适应测验技术实现对情绪智力的智能测评.基于IRT系列分析(含单维性检验、模型拟合检验、局部独立性检验以及项目质量分析),构建了符合IRT测量学要求的情绪智力测评的题库,并以此为基础探讨了计算机化自适应测验技术在情绪智力智能测评(CAT-EI)中的应用.实验结果表明:(i)CAT-EI相关算法具有较高的参数估计精度,同时具有较理想的测量信度和效度;(ii)CAT-EI可使用较少的题量(Mean=9.88题)达到使用整个题库(67题)的测量精度,它一方面能做到减轻被试的测试负担,另一方面实现了对情绪智力高效、快速、准确的智能测评.总之,该研究为实现对情绪智力智能测评提供了一种新的测量技术支持.  相似文献   

6.
信度的实质是二元随机变量(x,t)的一个数字特征.在不同的条件下,信度可用稳定性系数或内部一致性系数来估计.本文对这些估计的性态进行讨论,指出;1)不能把总体方差与样本方差混为一谈;2)所有“平行测量”之间有相同的相关系数(并不一定为1);3)K-R_(20)公式中因子N/N-1的运用值得商榷.  相似文献   

7.
对称相对熵测验等值法   总被引:1,自引:1,他引:0  
在项目反应理论(IRT)框架下讨论测验等值问题,给出了对称相对熵等值法(SRE)及其计算公式,讨论了它的一些基本性质,进行了大量蒙特卡洛模拟.找到了一个客观的可以对不同等值方法全面进行比较的方法,将SRE与国际上流行的Stocking-Lord测验特征曲线等值法(SL)、以及IRT等值史上较早提出的Haebara项目特征曲线等值法(H)进行对比.Wilcoxon符号秩检验模拟结果表明:在Samejima等级评分模型下,SRE总比SL和H表现更优越;在0-1评分模式的2参数Logistic模型下,SRE也不比SL差,而SRE和H各有千秋.  相似文献   

8.
在某些教育测量中,不仅要求在合格与不合格分界处有一个误差小、鉴别力强的划界分数,同时还希望在优与非优分界处有另一个误差小、鉴别力强的划界分数,这就要求把测验信息函数的目标状态设计成双峰曲线.本文以项目反应理论为指导,就双峰曲线划界分点的确定及相应测验项目选择问题进行了解析论证,并给出了算法设计流程.  相似文献   

9.
测验理论的中心问题之一就是如何编制出高质量的测验来,测验的信度是评价测验质量的重要指标之一。国内有关信度的文章或巳出版的有关测验的书籍中对信度的叙述大多是叙述性的。本文试图基于这些叙述性的定义给出严格的数学或统计学上的定义,并对信度系数的一系列估计公式给予证明,尤其还从变异源的角度给出信度的方差分析计算法。  相似文献   

10.
项目反应理论(Item response theory, IRT)是教育心理测量理论中发展较快的理论之一,称名反应模型是IRT中一个基本的项目反应模型. 该文借助2015年de la Torre提出的一种参数估计方法—打折似然方法,将它与拟牛顿法中的BFGS方法结合对称名反应模型的参数进行估计. 模拟研究表明:新的估计方法可有效地减少计算量.  相似文献   

11.
评卷登分系统的设计和分析   总被引:1,自引:0,他引:1  
登分工作是评卷工作的最后一个环节,计算机软件登分系统已经成为一种主要的分数登录方式,本文从实际工作出发,在登分的工作流程和计算机软、硬件系统的配置以及该系统的问题点等方面进行了详细分析和设计。  相似文献   

12.
从计算机班和英语班分别选出 47名和 36名学生 ,计算他们的两种评分 ,一种是原始分 ,另一种是基于统计方法的标准分 ,比较两种评分之后 ,表明标准分更为合理。  相似文献   

13.
目的 :比较自行设计的腹膜炎评分和国际公认的 APACHE 评分。方法 :连续 35 4例继发性腹膜炎 (SP)病例同时应用腹膜炎评分和 APACHE 评分 ,比较二者之间的异同点及其相关性。结果 :二者之间呈明显线性正相关 (r=0 .89,P<0 .0 1) ,但在评分参数、总分范围、用途和能否动态评分等方面存在差异。结论 :联合应用腹膜炎评分和 APACHE 评分是最佳选择。  相似文献   

14.
15.
对比APACHEⅡ和POSSUM评分评价胃肠道肿瘤手术风险的价值   总被引:1,自引:0,他引:1  
目的:APACHEⅡ和POSSUM是2种常用的判断外科病人危机的评分系统。本文对比2种评分系统对胃肠道肿瘤手术后死亡率评估的价值。方法:对171例胃肠道肿瘤患者进行APACHEⅡ和POSSUM评分,同时观察术后死亡率并与预测值进行比较。结果:实际死亡率与POSSUM预测值无统计学差异而与APACHEⅡ预测值有统计学差异。结论:POSSUM评分能较好地预示胃肠道肿瘤手术后死亡的发生。  相似文献   

16.
比较了原始分与标准分的区别,指出标准分使不同科目、不同时间的考试分数的比较变得可能,因而更为科学。CET采用新的方式报道考生得分,能提供更多的、更准确的统计信息。同时,在问卷调查报告的基础上,也提出了对改革的一些建议。  相似文献   

17.
为提高组合检索系统的性能,提出一种基于混合模型的多搜索引擎融合方法.该方法利用高斯、指数密度函数分别描述相关、非相关文档的相关分值分布,用基于混合模型的算法规范化处理相关分值,估计非相关文档的相关分值,并进行分值合并.这样做既考虑到相关、非相关文档在分值分布上的差异,又考虑了用户对成员搜索引擎的性能评价.实验结果表明,利用该方法的平均查准率要比成员搜索引擎平均提高37.8%,也明显高于Sum-CombSUM、Sum-CombMNZ和Standard-CombSUM3种常用的融合方法。  相似文献   

18.
普通高校体育课成绩标准化的探讨   总被引:1,自引:0,他引:1  
针对普通高校体育课考试中存在的实际问题 ,经过调查研究认为 :普通高校体育课成绩应实行标准化的评分方法。体育课成绩标准化处理的依据为正态分布理论。在原始分数分布不合理的情况下 ,建议以 70分为参照点 ,标准化评分的计分范围以± 3S的转换数学模型较合理 ,其转换数学模型公式为 :Z6=70 +X - X6S × 1 0 0  相似文献   

19.
本文根据统计学和测量学的理论,试对原始分数(X)、标准分数(Z)和标准百分(T)等三种评分方法进行比较研究,并在此基础上提出小学毕业生学业成绩综合评定的科学方法。  相似文献   

20.
对我院学生奖学金评定方法的改革研究   总被引:1,自引:0,他引:1  
分析了我院目前学生奖学金评定方法中所存在的问题,提出正态分布理论,采用标准总分方法,对当前奖学金的评定方法进行改进,使之我院学生奖学金的评定工作更趋于科学化、定量化.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号