首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到8条相似文献,搜索用时 0 毫秒
1.
标准参照测验采用子分数衡量学生在具体内容、知识或技能上的掌握情况,这有助于发挥考试的学习功能.在少量题目上作答数据估计子分数,其信度较难保证.子分数估计方法可充分利用相关辅助信息获得信度较高的子分数,这对补救教学至关重要.在简要介绍测量模型之后,叙述了子分数的7类估计方法的思想和计算过程,并分析了各方法的应用和表现,需重点关注群体和个体、复杂结构、优化测验设计和其他施测方式下子分数估计.  相似文献   

2.
主要从项目、测验、被试能力三方面来探讨信息函数在标准参照测验中的应用.研究结论表明:信息函数较经典测量理论能更精确地评价项目质量、测验质量及被试能力水平,因而对测验及学生能力水平的评价更科学,同时对测验的编制有更强的指导作用,值得推广.  相似文献   

3.
基于IRT指导的标准参照测验编制的算法设计   总被引:2,自引:2,他引:0  
以项目反映理论为指导,给出标准参照测验划界分数的估值方法.讨论了在满足预定测量精度要求下最少项目数的选择策略,并设计了相应的算法,解决了组卷工作中的相关技术问题.  相似文献   

4.
针对标准参照测验题库建设中的项目参数估计方法所存在的问题,分析了先前的GRNN方法估计项目参数研究中所存在的不足,对原有方法进行了改进,并以二值记分下的单参数Logistic模型为研究对象进行了模拟实验。结果表明,在考生样本很小的情况下,当训练项目达到一定数目时,将会得到比较实用的GRNN估计结果。方法具有较高的实用价值。  相似文献   

5.
在一个大规模教育测量中,以小学四年级和初中二年级的数学测验为例,使用基于项目反应理论(item response theory,IRT)的测验决策一致性系数作为评价测验信度的标准之一,并比较在测验中选取不同分界分数、分数量尺时决策一致性系数的差异.结果发现:相比经典测验理论(classical test theory,CTT)下的信度系数,基于IRT下的测验整体信度要高于CTT下的信度;划定的分界分数(cut score)个数越少,决策一致性系数越大;分界分数位置会影响决策一致性系数,能力水平在分界分数附近的考生更容易被划分到不同类别中;将测验原始分数转换成量表分数后,多个原始分数对应一个转换分数的规则会增大决策一致性系数.  相似文献   

6.
项目反应理论主要有3个基本假设:单维性,局部独立性和单调性。但是这3个假设存在一些弊端亟待解决。一些科学研究表明,用单维模型来模拟多维测量数据往往会增大测量误差,导致对学生的能力做出不正确的推论。因此,研究者基于各种不同的测验背景,将单维项目反应模型推广到多维项目反应模型。多维项目反应模型涉及到的参数较多,如果采用传统的估计方法,如边际最大似然法和贝叶斯众数估计法处理起来比较困难。然而,在项目反应理论中,Gibbs抽样法可以作为一种高效灵活的估计方法加以应用。基于Gibbs抽样的增加数据的技巧,给出了多维二参数Logistic项目反应模型的Bayes估计方法。随着潜在变量的引入,每个参数的满条件分布都很容易得到,并且不受先验分布选取的限制,这样Gibbs抽样的方法就很容易实施。  相似文献   

7.
讨论项目反应理论的3个主要数学模型,用实例说明如何应用项目反应理论来评价试卷质量,并把所得结果与经典项目分析作比较.  相似文献   

8.
评价语言测试质量的三种理论模型,即经典测验理论、概化理论和项目反应理论的基本内容和假设基础,分别从理论基础、题项分析方法等方面讨论了三种理论的优缺点,为语言测试质量评价理论模型的合理选择提供了依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号