排序方式: 共有108条查询结果,搜索用时 15 毫秒
21.
方差分析的统计检验力和效果大小的常用方法比较 总被引:1,自引:0,他引:1
本文对用方差分析统计检验力和效果大小进行估计的几种不同方法作了简要的介绍和比较。 相似文献
22.
摘要: 在计算机自适应测验中, 对0-1评分模型按a-分层选题是高效安全的策略,但多级评分模型的项目难度/步骤参数有多个而无法直接应用这种选题策略。信息函数能够很好地综合项目所有参数及能力参数,但最大信息量选题策略会影响考试安全。本文提出一种变加权选题策略,它通过调用一个与信息量相关联的函数,该函数与信息量成正比,与区分度的某个幂函数成反比,从而达到既能综合项目所有参数又按a分层的效果。在GPCM模型下用蒙特卡罗实验进行比较研究,结果显示新的选题策略总体效果比已有相关结果好。 相似文献
23.
24.
25.
具有认知诊断功能的计算机化自适应测验的研究与实现 总被引:3,自引:2,他引:1
构造具有认知诊断功能的计算机化自适应测验(Computerized Adaptive Testing,CAT),关键在于设计不同于传统CAT的选题策略。本文采用先认知诊断后估计能力的方法,在诊断阶段用状态转换图描述特定认知领域中所有知识状态及这些状态之间的联系,以图的深度优先算法为基础设计选题策略;而在能力估计精细化阶段,每个被试所测项目,不仅与其能力估计值相匹配,且只与其所掌握的属性相关。本文采用蒙特卡罗模拟针对三种不同的属性结构进行试验,结果良好 相似文献
26.
27.
在两参数模型(2PM)下模拟计算机化自适应测验(CAT)初始阶段的三种作答情境,由模拟结果发现只有当被试作答情境为睡眠现象时会导致能力低估现象,猜测现象时会导致能力高估现象,并探讨了"CAT初始阶段作答影响最终成绩"考试现象发生的具体情境范围。由模拟结果分析可得,CAT考试现象是被试作答异常现象(猜测、睡眠现象)和CAT数学模型(2PM)共同影响的结果。在四参数模型(4PM)、2PM-Biweight下进行CAT模拟,被试能力高估现象和低估现象都得到了较好的纠正。 相似文献
28.
非参数认知诊断分类方法非常适合课堂评估,其诊断结果采用0-1形式而缺乏概率化表征,不能精细地区分被试属性掌握程度的差异或变化,还缺乏可用于评价真实测验分类结果的信度和效度指标。要刻画被试属性掌握程度的差异,首要的问题是要为非参数认知诊断方法提供一种可以量化属性掌握概率的方法。针对此问题,基于二项分布和玻尔兹曼分布提出非参数认知诊断方法下诊断结果的概率化表征方法,并用于构建分类准确性和分类一致性指标。模拟研究与实测数据分析结果显示:概率化表征方法与非参数认知诊断方法的分类结果高度一致;概率化表征方法与认知诊断模型所得的属性掌握概率十分接近;概率化表征方法所得的属性(模式)掌握概率可用于计算属性(模式)分类准确性和分类一致性指标,在实际测验情景下可作为信度和效度指标,评价诊断结果的重测一致率和判准率。 相似文献
29.
30.