排序方式: 共有51条查询结果,搜索用时 15 毫秒
1.
2.
3.
本文首先分析了经典测验理论存在的局限,然后在潜在特质理论和项目特征曲线两大概念基础上阐述了项目反应理论及其基础模型的测量学原理,介绍了多个项目反应理论基础模型.最后简要介绍了七项当前应用项目反应理论指导大型题库建设和指导编制各种新型测验的热点内容. 相似文献
4.
新一代测量理论在测验设计、计量分析和结果解释等方面,都强调将认知科学与心理计量学相结合。文章基于贝叶斯网对定性的认知模型(属性层级)建立概率模型,并将其整合到认知诊断模型中,可实现认知模型与计量模型相结合进行诊断数据分析。采用MCMC算法分析带分数减法数据,比较不同属性结构下模型的表现,结果表明基于贝叶斯网构建的认知诊断模型可提供丰富且有效的诊断信息,可为验证认知模型提供一种途径。 相似文献
5.
6.
该研究对拓广等级展开模型(GGUM)进行了拓展,取消GGUM中关于主观反应类别阈限对称的假设,并将拓展之后的新模型和GGUM同时用于生活取向测验修订版(LOT-R)的被试反应数据分析,采用新编的单项目、两项目对和三项目组χ2/df计算程序计算和比较新模型和GGUM在该测验数据上的拟合差异。结果显示,新编程序与Stark等人开发的MODFIT程序具有同样的有效性,新模型在这些指标上的值显著小于GGUM,并且均小于3,表明新模型较GGUM更适合于分析LOT-R的反应数据,说明新模型更适用于分析具有多个评定等级的人格测验数据。根据以上结果,该研究认为,未来人格测验的数据分析应该使用没有对主观反应类别阈限进行对称限定的新拓展的模型更合理。 相似文献
7.
传统上,群体评估都是以个体的评估结果的平均值为基础进行的。而群体水平IRT理论则可以避开对个体的评估,直接实现对群体的评估,它具有许多传统方法难以企及的优点。本文将群体水平IRT模型应用于2007年某省高考英语阅读理解的410所学校的能力评估,评估结果发现:410所学校的英语阅读理解能力几乎都在[-1,1]区间内,没有能力极高或极低的学校。对这些学校而言,测验中所有项目的难度较易,区分度适中。所有的评估结果与IRT模型的评估结果在 的水平上相关显著,表明GIRT模型在实践中是可以选择的一种群体评估方法。 相似文献
8.
IRT中的计量模型较多,不同计量模型适合不同特点的数据资料,实际工作者应根据实际情况选择适当的IRT模型来分析数据。我国是个考试、测评大国,测评的题型丰富多样,在实际应用IRT时,一个模型往往很难反应所有数据资料本身的特点,这时可考虑应用多个IRT模型(即“混合模型”)来分析,以达到对数据的最佳拟合。本文对混合模型的思想方法及原理、参数估计的实现、以及模型性能进行了研究,发现:(1)本文自主开发的混合模型参数估计程序Mix_Tu具有较高的返真性,且与国际知名测量软件Parscale相当。(2)在“项目异常”情况下,Mix_Tu程序对参数b和c的估计受数据异常程度的影响要大于Parscale程序,而对参数a的估计受数据异常程度的影响要小于Parscale程序,而在参数theta上两个程序相当。(3)在“被试异常”情况下,Mix_Tu程序对所有参数的估计受数据异常程度的影响均要小于Parscale程序,Mix_Tu程序表现的更为稳健。 相似文献
9.
本研究介绍并引进了现代测量理论中的前沿技术—— 多维项目反应理论, 采用MCMC算法实现了其参数估计; 并将MIRT应用于瑞文高级推理测验, 以探讨MIRT在心理测验中的具体应用。研究结果表明:(1)本研究自主编制的MIRT参数估计程序基本可行, 其估计的精度与国外研究结论相当甚至更好。(2)在测验维度和样本容量两因素完全随机实验设计下(2×3), 随着被试和题目样本容量的增加, MIRT参数估计的精度越高且估计的稳定性越强; 但随着测验维度的增加, MIRT参数估计精度和稳定性均随之降低。(3)MIRT对心理测验的分析比UIRT能提供更为精确和细致的信息。它对心理测验的编制、开发及评价具有重要的指导和参考价值, 值得引进及借鉴。 相似文献
10.
现在,等值越来越受到各考试测验机构及测量学研究人员的重视,特别是项目反应理论等值的优越性更使他们有了信心。然而,很多人却没有注意到被试能力分布形态可能给等值结果带来的影响效果及程度。本研究以项目反应理论两级记分模型的项目参数等值在不同被试能力分布形态下的结果差异作为重点,探讨被试抽样偏差可能给项目特征曲线等值带来的误差问题。研究结果表明,被试能力分布形态会显著地影响项目参数等值的系数,特别地,能力分布的偏态系数与等值方程的截距存在显著的线性相关关系,但能力分布形态的变化对等值方程中斜率的影响并不明显 相似文献