首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 156 毫秒
1.
与传统的纸笔测验(Paper And Pencil Based Test, P&P)相比计算机化自适应测验(Computerized Adaptive Testing, CAT)根据被试的作答反应自适应地选择题目, 它不仅缩短了测验长度, 还极大地提高了测验的准确性。然而, 目前绝大多数CAT不允许被试修改答案, 研究者主要担心修改答案会降低CAT的有效性。允许修改答案符合被试一贯的测验习惯, 修改之后的分数更能反映被试真实的水平, 从而能够进一步促进CAT在实际中的应用。现有的研究主要从三个方面提出了可修改答案CAT的控制方法:一是测验设计; 二是改进选题策略; 三是建构模型。未来的研究应进一步探讨这些方法之间的比较与结合, 以及对可修改答案认知诊断CAT (Cognitive Diagnostic CAT, CD-CAT)的研究。  相似文献   

2.
具有认知诊断功能的计算机化自适应测验的研究与实现   总被引:3,自引:2,他引:1  
林海菁  丁树良 《心理学报》2007,39(4):747-753
构造具有认知诊断功能的计算机化自适应测验(Computerized Adaptive Testing,CAT),关键在于设计不同于传统CAT的选题策略。本文采用先认知诊断后估计能力的方法,在诊断阶段用状态转换图描述特定认知领域中所有知识状态及这些状态之间的联系,以图的深度优先算法为基础设计选题策略;而在能力估计精细化阶段,每个被试所测项目,不仅与其能力估计值相匹配,且只与其所掌握的属性相关。本文采用蒙特卡罗模拟针对三种不同的属性结构进行试验,结果良好  相似文献   

3.
等级反应模型下计算机化自适应测验选题策略   总被引:7,自引:3,他引:4  
陈平  丁树良  林海菁  周婕 《心理学报》2006,38(3):461-467
计算机化自适应测验(CAT)中的选题策略,一直是国内外相关学者关注的问题。然而对多级评分的CAT的选题策略的研究却很少报导。本研究采用计算机模拟程序对等级反应模型(Graded Response Model)下CAT的四种选题策略进行研究。研究表明:等级难度值与当前能力估计值匹配选题策略的综合评价最高;在选题策略中增设 “影子题库”可以明显提高项目调用的均匀性;并且不同的项目参数分布或不同的能力估计方法都对CAT评价指标有影响  相似文献   

4.
基于GPCM的计算机自适应测验选题策略比较   总被引:1,自引:0,他引:1  
刘珍  丁树良  林海菁 《心理学报》2008,40(5):618-625
选题策略是计算机自适应测验(Computerized Adaptive Testing , CAT)研究的一项重要内容,它的好坏直接关系到考试的信度、效度及考试的安全性。CAT的许多研究与应用,都建立在0-1二级评分模型基础上,对多级评分CAT的选题策略的研究很少报导。目前国内虽已开展了基于GRM的CAT研究,但基于GPCM的CAT的研究尚未见有关报道。本文通过计算机模拟程序,对基于拓广分部评分模型(Generalized Partial Credit Model, GPCM)下的CAT的四种选题策略在多种情况下进行了比较研究。研究结果表明:被试能力呈正态分布时,选题策略的使用效果与项目步骤参数分布有很大的关系。(1)项目步骤参数均服从正态分布时,采用能力与项目步骤参数匹配选题策略效果最佳;(2)项目步骤参数均服从均匀分布时,能力与项目步骤参数平均数匹配选题策略效果最佳  相似文献   

5.
林喆  陈平  辛涛 《心理学报》2015,47(9):1188-1198
允许题目检查能够促进计算机化自适应测验(CAT)在实际中的应用。在不影响能力估计精度和测验公平性的前提下, 允许CAT题目检查能够缓解考生考试焦虑, 减少无关因素引起的测量误差。区块题目袋方法是连续区块方法与题目袋方法的结合, 不仅能允许CAT题目检查, 还能够弥补题目袋方法的不足。研究结果表明:(1)合理作答策略下, 区块题目袋方法的估计精度在低能力水平上要优于题目袋方法; (2)在应对类似Wainer作答策略时, 区块题目袋方法的估计精度在所有能力水平上均优于题目袋方法。(3)随着区块数的增加, 区块题目袋方法的能力估计精度越接近无修改的基线水平。  相似文献   

6.
通过两位数乘法算式答案判别任务研究无意识元认知调控下策略转换的的认知加工特征。整个算式答案判别任务分为两种策略使用情境:一种为只可以使用尾数策略的任务情境;另一种为既可以使用尾数策略,又可以使用奇偶策略的任务情境。实验结果表明:1)无意识元认知具有高选择性、高效性和高潜力,能在策略使用情境转变之后,快速察觉并选择使用更为简单、高效的奇偶策略;2)尾数策略使用的强大思维定势阻止奇偶策略的意识化,致使绝大多数被试未能发现任务情境的变化而在内隐状态下使用了奇偶策略;3)策略在内隐或外显状态下使用具有同等效力,策略内隐使用具有高效性和高潜力。  相似文献   

7.
领域知识与自我解释策略间关系的实验研究   总被引:6,自引:0,他引:6  
从领域知识的个体差异的角度,研究领域知识与自我解释策略之间的关系,探讨自我解释在示例学习中的作用。研究结果表明,(1)在学习示例时,高领域知识组被试倾向于使用发现意义和建立新旧信息间联结的解释策略对示例进行认知加工;低领域知识组被试主要采用句法加工策略对示例进行加工;(2)领域知识对监控活动的制约,主要体现在被试监控到理解失败之后所采取的对策上。高领域知识组被试利用解释策略解决问题,低领域知识组被试利用句法加工策略解决问题。  相似文献   

8.
采用两种时距估计方法,检验时距锚定值对时距估计的影响,并探讨了时距信息的心理表征方式。63名在校大学生参加了本次实验。实验1采用口头报告法,表明较大的时距锚定值(5s,5000ms)条件下,被试估对时距的估计值较大,而较小时距锚定值(1s,1000ms)条件下被试估计的时距值较小;语义相同但表述方式不同的锚定值(1s与1000ms,5s与5000ms)条件下的时距估计值没有显著差异。实验2采用产生法,进一步表明时距表述方式对产生时距没有显著影响。以上结果表明,时距估计受时距锚定值的影响,时距信息可能以语义形式进行表征,而不是简单的数字加单位的表层表征形式  相似文献   

9.
项目突显方式对视觉搜索策略的影响   总被引:2,自引:1,他引:1  
搜索策略是将视觉注意导引到目标最可能出现位置的直接认知控制。本研究采用眼动跟踪技术与视觉搜索时间——鼠标点击时间的分离技术,探讨计算机视觉界面不同项目突显方式下的搜索策略问题。结果表明:(1)有无项目突显方式、不同的突显有效性水平,被试采用了导向式和序列式两种不同的搜索策略;(2)被试采用导向式搜索策略时,被试在第一个感兴趣区域首注视点百分比小于58.3%,在视觉搜索过程中的注视点数量明显较小、扫视轨迹长度和注视时间明显较少;(3)被试采用序列式搜索策略时,被试在第一个感兴趣区域首注视点百分比大于58.3%,在视觉搜索过程中的注视点数量明显较多、扫视轨迹长度和注视时间明显较长;(4)采用导向式的视觉搜索策略能显著减少被试的视觉搜索时间,提高视觉搜索的绩效,但不能显著减少被试的鼠标点击时间;(5)因为视觉界面上突显的设置改变了用户的搜索策略,所以提高了视觉搜索绩效。  相似文献   

10.
应用OMST在线装配模式,提出自适应分组认知诊断测验(CD-AMGT)。由于知识状态的先决关系是偏序关系,而且构成格(lattice),利用知识状态当前估计值在格中的上下确界对被试真实知识状态的可能范围进行界定,由此装配下一分组,分组中结合PWKL策略或SHE策略进行选题以兼顾诊断精度、效率和安全性。模拟实验表明,CD-AMGT与PWKL、SHE对比,当题目类型丰富时,以分类准确率略微降低为代价,其题库使用均匀性和计算用时均表现出较大优势。  相似文献   

11.
允许修改答案的认知诊断计算机化自适应测验(Reviewable Cognitive Diagnostic Computerized Adaptive Testing,RCD-CAT),有利于更准确诊断被试的知识状态,题目口袋法(Item Pocket,IP)为被试提供了缓存作答并修改的机会,改进的题目口袋法(Modified IP,MIP)对IP内修改的题目重新计分。模拟研究比较了IP、MIP、stocking Ⅰ和stocking Ⅱ在RCD-CAT效果,结果发现:stocking设计的效果最优,其中stocking Ⅱ的效果略优于stocking Ⅰ,IP法和MIP法判准率要低于传统CD-CAT,stocking设计在RCD-CAT具有较好的应用前景。  相似文献   

12.
This study investigates using response times (RTs) with item responses in a computerized adaptive test (CAT) setting to enhance item selection and ability estimation and control for differential speededness. Using van der Linden’s hierarchical framework, an extended procedure for joint estimation of ability and speed parameters for use in CAT is developed following van der Linden; this is called the joint expected a posteriori estimator (J-EAP). It is shown that the J-EAP estimate of ability and speededness outperforms the standard maximum likelihood estimator (MLE) of ability and speededness in terms of correlation, root mean square error, and bias. It is further shown that under the maximum information per time unit item selection method (MICT)—a method which uses estimates for ability and speededness directly—using the J-EAP further reduces average examinee time spent and variability in test times between examinees above the resulting gains of this selection algorithm with the MLE while maintaining estimation efficiency. Simulated test results are further corroborated with test parameters derived from a real data example.  相似文献   

13.
目前参数估计多采用统计方法,存在耗时长、要求被试样本容量大和项目数多等缺点。本文将BP神经网络和降维法相结合,对GRM的项目参数和考生能力参数进行估计。蒙特卡洛模拟结果显示:(1)不管是人多题少还是题多人少,该网络设计下的参数估计精度都较高;(2)可以应用到多个不同等级评分的参数估计中,甚至是超过15个等级的项目参数,估计精度也较高,这是其他参数估计方法所不可比拟的;(3)运行的时长和统计估计方法相比大大缩减。  相似文献   

14.
计算机形式的测验能够记录考生在测验中的题目作答时间(Response Time, RT),作为一种重要的辅助信息来源,RT对于测验开发和管理具有重要的价值,特别是在计算机化自适应测验(Computerized Adaptive Testing, CAT)领域。本文简要介绍了RT在CAT选题方面应用并作以简评,分析了这些技术在实践中的可行性。最后,探讨了当前RT应用于CAT选题存在的问题以及可以进一步开展的研究方向。  相似文献   

15.
在心理测量和教育测量中,二级项目和题组项目是两类常见的项目类型。由这两种项目混合构成的测试在实践中有着重要的应用。被试在答题时,由于个人的潜在能力和项目难度不匹配,常常会产生异常反应,这些异常反应会影响IRT中潜在特质估计的准确性。仿真实验证明,二级项目题组混合IRT模型的稳健估计方法在出现异常值的情况下,能够比极大似然估计对被试的潜在特质做出更加准确的估计,能够满足实际测试的需求。  相似文献   

16.
当CD-CAT测验需要同时诊断被试的解题策略、认知状态并评估被试的宏观能力时,就需要在选题过程中兼顾这三个测量目标。用两种不同方式将多策略香农熵(MSSHE)指标与Fisher信息量相结合,提出多策略情境中的DWI指标MSDWI)选题法与“先用MSSHE后用Fisher信息量”的两步选题法。基于多策略RRUM模型(MS-RRUM),将这两种方法与随机选题法在不同属性数量条件下进行模拟比较,结果表明:当属性数量为4个或6个时,两步选题法在策略判准率、认知状态判准率和能力估计三个方面都有最佳的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号