首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
评价一套测验质量的高低,主要通过试题和被试反应之间的关系来判断。Rasch模型作为一种理想化的数学模型,可以通过实证数据与模型的拟合程度来评价试题的质量。而因素分析作为经典测量理论的统计方法,可以采用因素载荷以及数据和模型的拟合情况来评价测验质量高低,但不具备Rasch模型所具有的客观性和等距性。通过对贵阳市某高中的一次数学测验,采用两种方法对其进行质量分析。结果表明,Rasch模型更具有优势。  相似文献   

2.
CSIBTEST方法是基于参照组和目标组2个测验信度对真分数进行估计,再按交叉位置分数将匹配分数划分为2类子样本,并分别计算其卡方统计量,然后将这2个独立的卡方统计量相加得到自由度为2的检验统计量.鉴于测验信度具有群体依赖性,即不同群体的测验信度可能不尽相同,而CSIBTEST方法将参照组和目标组分别划分为2类子样本,有必要对子样本上的测验信度也进行估计,由此拓展了CSIBTEST.新方法先使用CSIBTEST获得交叉位置参数,相当于进行DIF预分析,再使用子样本上的信度估计用于真分数估计,以在对匹配变量进行纯化后获得检测统计量.模拟研究结果显示:相比SIBTEST和CSIBTEST,匹配变量纯化的测验偏差检验方法对存在DIF试题有着更高的统计检验力.  相似文献   

3.
传统的纸笔测验无法有效地满足全部被试的能力估计的要求,计算机化自适应测验(CAT)能够不断根据被试的作答来估计其能力,并抽取与此能力相适应的项目来,选题是CAT的关键.先介绍了CAT的概念和原理,然后借助项目信息函数重点研究了一种CAT的选题方法.  相似文献   

4.
评估试题难度的检验   总被引:3,自引:0,他引:3  
提出一个统计模型,用于检验试题库中由专家给出试题难度这一指标的准确性。具体给出了专家给出的试题难度与实际被试总体的试题难度之间的线性函数关系,并用Hotelling统计量来检验这个关系。  相似文献   

5.
多级评分CAT的认知诊断方法   总被引:1,自引:0,他引:1  
认知诊断因其能识别被试认知状态已成为CAT研究的重要部分之一,但目前研究大多都基于0-1评分,这与我国试题也采用多级评分现状不相适应.因此,研究基于多级评分的认知诊断具有重要意义.该文主要研究开发多级评分模型下有认知诊断功能的CAT测试系统,采用等级反应模型(GRM),使用先认知诊断后估计能力的方法.该系统的认知诊断正确率较高,且诊断结果较稳定,能力估计也较准确,测验安全性好.  相似文献   

6.
介绍了计算机自适应测验(CAT)的基本原理及优越性,指出它可以解决传统的纸笔测验自身无法解决的弊端,能够快速准确地估计出被试的真实水平,极大激发被试的考试动机,真正实现因人施测.  相似文献   

7.
在新课程改革过程中,涌现出一些新的教学模式,如杜郎口教学模式.当前全国学习杜郎口的学校数量不少,但各学校情况不同,教学模式只能因校情而变,改变后的模式称为类杜郎口教学模式.类杜郎口教学模式取得的效果如何,是否适合该校的实际情况,这就需要通过运用某种统计检验方法对学生考试成绩进行检测来得出判断.文中运用拟合优度检验的方法对甘肃省天水某初级中学七年级学生语文考试成绩进行分析,来检测类杜郎口教学法是否适合该校的语文课程教学、教学过程是否正常,为学校教学改革提供参考.  相似文献   

8.
为了探讨蒙古族初中生外显和内隐蒙古族认同及其影响因素,选取内蒙古包头市某蒙古族中学和民族中学的初中生为被试,分别采用外显问卷调查的方式和单类内隐联想测验的方法探讨其外显和内隐蒙古族认同.结果表明:(1)在外显和内隐层面上,蒙古族初中生对蒙古族均具有积极的认同.(2)外显蒙古族认同主要受到父母民族身份、日常生活中是否使用蒙古语两个因素的影响;内隐蒙古族认同主要受被试日常生活中是否使用蒙古语、上中学前是否就读蒙古族学校两个因素的影响.  相似文献   

9.
事业单位新进人员通用能力考试最优简版探究   总被引:2,自引:0,他引:2  
利用《北京市新进人员通用能力考试》专业技术岗位1 335名考生成绩,在主成分分析确定该考试仅含一个公因子的情况下,根据因子载荷值的大小,分测验数目从2~9依次增加分别组成8个简版测验.在给定简版考试成绩与全版考试(full form)成绩误差分布的前提下,计算各个简版最大分散度条件下的α错误的概率、统计检验力以及考生覆盖率.按照误差尽量小、α错误概率小于0.05、统计检验力大于0.90且考生覆盖率95%以上的标准,逐一比较各个简版的性能,结果发现由逻辑推理、阅读理解、图表解读与短文加工4个分测验组成的简版性能最优.由此提出考试简版测验开发中应综合考虑测量误差、α错误、统计检验力、覆盖率、考试时间5项标准.  相似文献   

10.
为了解决网络应用程序引起的服务器敏感信息泄露问题,提出了基于动态污点跟踪的敏感文件泄露检测方法.该方法先标记敏感文件的读写缓冲区为污点源,然后实时跟踪文件缓冲区的处理流程,监测污染源是否传播到其他内存位置,或者写入其他文件.最后检测发送缓冲区是否包含污点数据,以确定是否发生敏感文件的泄露.实验结果表明:提出的方法不仅能够监控用户指定的敏感文件,还能防止应用程序将敏感信息写入其他文件或者发送到网络上.  相似文献   

11.
大规模考试的公平性备受关注,探索能够生成多份平行测验并能保证测验质量的组卷方法十分重要.原用于计算机自适应测验(CAT)的基于最大优先级指标已开始用于组卷,但只局限于单题之间的匹配.为了增加求解空间,该文提出了一种基于最大优先级指标的双题匹配的组卷方法,实现题库中双题与种子试卷双题之间匹配,并结合平行试卷质量调整方法,...  相似文献   

12.
针对分层情况下的疾病流行率问题,考虑了金标准存在时,在各层的敏感度和特异度不同时二项比例(疾病流行率)的齐性检验;提出了基于渐近检验过程的7种统计量和基于Bootstrap重抽样检验过程的4种统计量,并通过蒙特卡罗模拟研究来比较了各种检验的犯第一类错误的概率和检验功效;研究表明:score统计量、似然比统计量和4种基于bootstrap重抽样的检验统计量具有良好的统计性质,推荐用于实际中;最后,实际数据进一步验证了方法的有效性。  相似文献   

13.
大型飞机主起落架连接区静力试验误差控制技术   总被引:1,自引:0,他引:1  
主起落架作为飞机的重要部件,其基于全机的连接区静强度试验是飞机地面静强度试验必须的试验项目.试验中主起落架载荷大、变形大,该部位载荷施加的准确性会直接影响试验考核是否满足要求.为了提高该部位载荷施加准确性,提出基于全机约束点反馈的试验误差控制技术,通过分析全机约束点载荷误差的影响因素,筛选确定影响试验考核部位的载荷施加准确性的主要因素,并对主要因素进行优化处理.以某型飞机主起落架连接区为研究对象开展静力试验.结果表明,大型飞机主起落架连接区的试验误差控制技术可保证试验约束点反馈趋势与预期一致,试验误差控制达到了更高的水平且可靠性更高.飞机姿态主动控制及起落架随动加载等技术有效实现试验误差控制,提升了试验加载精度,可为同类试验提供参考.  相似文献   

14.
针对标准参照测验题库建设中的项目参数估计方法所存在的问题,分析了先前的GRNN方法估计项目参数研究中所存在的不足,对原有方法进行了改进,并以二值记分下的单参数Logistic模型为研究对象进行了模拟实验。结果表明,在考生样本很小的情况下,当训练项目达到一定数目时,将会得到比较实用的GRNN估计结果。方法具有较高的实用价值。  相似文献   

15.
两个独立二项分布参数之间的风险比的非劣效性检验在医学统计研究中是一个非常有意义的问题. 常用的限制性极大估计方法在大多数情况下都不能控制第一类错误. 本文提出用基于信仰推断法来解决基于两个独立二项分布参数之间的风险比的非劣效性检验问题. 模拟结果显示: 在小样本的研究情况下,这种基于信仰推断法的MF检验方法能很好地控制第一类错误, 检验功效也不差.  相似文献   

16.
在0-1计分下,为了解决最大信息量组块分层策略(MIS-B)中未考虑内容平衡的问题,通过加入改良多项式模型来平衡内容属性.计算机模拟试验显示:选题策略在保持MIS-B能力估计精准度这一前提下降低了项目重叠率,提高了题库使用均匀性和项目曝光率的均匀性.  相似文献   

17.
数字通信系统中误码率的估计方法   总被引:4,自引:0,他引:4  
在数字通信系统中 ,经常测试或验证系统和器件的误码率指标 ,若要获得精确的测试结果 ,必须进行无限长时间的试验。根据统计置信度原理 ,只要验证数字系统或器件的误码率指标是否优于某一规定标准 ,即可在测量精度和测试时间之间进行折衷处理 ,而且仍能保证测试结果的可信度。文章具体介绍了统计置信度的概念及数学式推导过程 ,并对利用统计置信度估计数字通信系统和器件误码率的方法、过程和实验数据配置等问题进行了分析  相似文献   

18.
With biological and economic importance,threshold traits are discrete in phenotype but have the same polygenic genetic basis as quantitative traits. The traditional linkage analysis for quantitative traits is invalid for threshold traits due to their special characters. The transmission disequilibrium test (TDT) has received great attention recently in localizing human disease genes due to its simplicity and powerfulness. But TDT only deals with data from independent nuclear families and it will lose information about extended pedigree that incorporates information not only from parents and siblings but also from other relatives. The pedigree disequilibrium test (PDT) proposed by Martin in 2001 can be used to analyze the extended pedigree in human.In this study, PDT was introduced into the QTL mapping of threshold traits for farm animals, and was modified in order to accommodate the pedigree structures of farm animals.The modified PDT was renamed pedigree transmission disequilibrium test (PTDT) and its power and type I error were investigated and compared with that of PDT by Monte Carlo simulation. It was shown that PTDT is a robust and valid approach to mapping QTL of threshold trait. When the parental information is complete, PTDT and PDT are almost the same in terms of power and type I error. However, if the parental information is missing to a certain extent, PTDT is higher in power and lower in type I error than PDT. These results imply that PTDT can be a novel approach to QTL fine mapping of threshold traits based on the existing coarse mapping information.  相似文献   

19.
李谊纯  林振良  李庆 《广西科学》2019,26(6):634-640
模型验证是河口海岸模型建立和应用的关键步骤,传统的方法包括主观评价、可视化技术、误差估计及统计检验等量化方法,但各种验证方法的性能优劣尚无明确的结论。为探讨各种方法的性能,本文对常用的几种量化方法的性能进行比较,并提出了一种基于统计检验的定量的模型验证方法。研究表明:即使在模型数据的误差明显时,Skill、相关系数和决定系数也可能保持较大的值,因此使用这些量化指标进行模型验证需谨慎。相对于绝对误差、均方根误差、Skill等常用量化指标,统计检验法既能有效地量化模型模拟的误差,亦能有效减小模拟结果中的异常值对整体模拟效果的影响。由于误差分布的原因,统计检验方法不适用于往复流的流向验证。  相似文献   

20.
选题策略是计算机化自适应测验(CAT)的核心.该文提出了一种新的选题策略,是一种相对严格的“升a”方法,它选择区分度参数的百分等级尽可能接近测验进程的项目,而且还可以通过调整控制参数的取值来满足不同测验场景的需求.Monte Carlo实验结果表明:该方法在测验精度、项目曝光率控制和题库利用率等方面均表现良好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号