期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王卓然郭磊边玉芳《心理学报》2014,46(12):1923-1932

检测项目功能差异(DIF)是认知诊断测验中很重要的问题。首先将逻辑斯蒂克回归法(LR)引入认知诊断测验DIF检测, 然后将LR法与MH法和Wald检验法的DIF检验效果进行比较。在比较中同时考察了匹配变量、DIF种类、DIF大小和受测者人数的影响。结果表明：(1) LR法在认知诊断测验DIF检测中, 检验力较高, 一类错误率较低。(2) LR法在检测认知诊断测验的DIF时, 不受认知诊断方法的影响。(3) LR法可以有效区分一致性DIF和非一致性DIF, 并有较高检验力和较低一类错误率。(4)采用知识状态作为匹配变量, 能够得到较理想的检验力和一类错误率。(5) DIF越大, 受测者人数越多, 统计检验力越高, 但一类错误率不受影响。相似文献

2.

认知诊断测验的属性分类一致性和分类准确性指标

汪文义宋丽红陈平丁树良程艳《心理学探新》2016,(3):264-269

分类一致性和分类准确性是衡量考试信效度的两个重要评价指标。基于项目反应理论下分类一致性和分类准确性指标,提出认知诊断测验的属性(模式)分类一致性和分类准确性指标,讨论分类一致性指标、分类准确性指标与属性估计误差之间的关系,并由属性掌握概率的估计标准误推导出属性分类准确性的上限。结果显示:属性(模式)分类一致性可准确估计重测一致性;分类准确性指标计算简单,可准确估计认知诊断测验的判准率。相似文献

3.

汉语词汇测验中的项目功能差异初探 总被引：6，自引：1，他引：5

曹亦薇张厚粲《心理学报》1999,32(4):460-467

该文运用两种不同的方法对实际的汉语词汇测验中的３６个词汇进行了ＤＩＦ探测。对于１４００多劬的初三学生分别作了男女生与城郊学生间的比较。在男女组分析中检出７个属于一致性ＤＩＦ的项目;对于城郊学生组经两种方法同时确定的ＤＩＦ项目有７个,其中５个是一致性ＤＩＦ,２个是非一致性ＤＩＦ的项目。该文还讨论了产生ＤＩＦ的可能因素。相似文献

4.

认知诊断计算机化自适应测验中的项目增补

陈平辛涛《心理学报》2011,43(7):836-850

项目的增补对认知诊断计算机化自适应测验(CD-CAT)题库的开发与维护至关重要。借鉴单维项目反应理论(IRT)中联合极大似然估计方法(JMLE)的思路, 提出联合估计算法(JEA), 仅依赖被试在旧题和新题上的作答反应联合地、自动地估计新题的属性向量和新题的项目参数。研究结果表明：当项目参数相对较小且样本量相对较大时, JEA算法在新题属性向量和新题项目参数估计精度方面表现不错; 而且样本大小、项目参数大小以及项目参数初值都影响着JEA算法的表现。相似文献

5.

基于项目自动生成的认知诊断测验开发

下载免费PDF全文

涂冬波蔡艳戴海琦《心理科学》2013,36(1):210-215

认知诊断、项目自动生成是现代心理测量领域的重要发展领域,二者的结合更是心理测量领域亟待开展的重要课题。本研究以小学数学问题解决认知诊断项目自动生成为例,探讨认知诊断领域的项目生成技术及算法。研究发现：(1)计算机自生成的项目参数与原模板参数具有较高的一致性。(2)同一项目模板下生成的不同试题的测量学特征基本不变。(3)同一批被试在自动生成的两份试卷的前、后测的能力( )值高度相关(r=0.811),前、后两次对被试诊断结果的一致性高达86.5%。这表明本文所设计的认知诊断测验项目的自动生成技术及其算法基本可行,小学数学问题解决认知诊断项目的自动生成效果较好。这也为其它认知诊断领域的项目自动生成提供了技术借鉴和支持。相似文献

6.

具有认知诊断功能的多阶段自适应测验及其影响因素研究

高椿雷罗照盛郑蝉金喻晓锋彭亚风《心理科学》2016,39(6):1492-1499

MST结合了纸笔测验和CAT的优势,现阶段在美国的许多大型考试中得到了应用。本文结合MST、认知诊断、CD-CAT和OMST的思想对CD-MST的可行性进行研究。CD-MST具有认知诊断和自适应的功能,能够使用较少的题目为被试提供即时的、准确的、丰富的诊断信息;同时它计算速度较快,允许考生返回检查和修改,更符合实际考试情境,且在测验的编制上更容易控制。本研究考察了选题策略和题库质量对不同测验设计的CD-MST的影响,并同CD-CAT进行了比较。通过模拟研究发现：MPWKL、GDI和SHE选题策略同样也适用于CD-MST的选题,在题库质量好的情况下这三种选题策略的判准率同CD-CAT持平。CD-MST的测验时间要比CD-CAT缩短2/3以上。相似文献

7.

认知诊断测验蓝图的设计 总被引：5，自引：0，他引：5

下载免费PDF全文

丁树良汪文义杨淑群《心理科学》2011,34(2):258-265

通常认为由属性和项目关联阵（即Q矩阵）的列对应的项目充任认知诊断测验中行为样本,其实这种做法不能有效防止理想反应模式的误判。如在测验之前便可确定欲测之属性及层级关系,找到可达阵,可证明可达阵的各个列对应的项目类在认知诊断测验中必不可少,否则在理想反应模式下就一定有一些被试会被误判。本文给出充分必要Q矩阵的概念,以区别Tatsuoka(1995,2009) 讨论过的充分Q矩阵概念。充分必要Q矩阵才能有效指导测验的编制。相似文献

8.

分类视角下认知诊断测验项目区分度指标及应用

汪文义宋丽红丁树良《心理科学》2018,(2):453-458

在认知诊断中还没有指标能在无作答数据情况下直接评价项目的属性分类准确率或属性判准率。项目水平上的属性分类准确率,与项目属性向量、项目参数、先验分布和作答反应等有关。综合各个影响因素定义了项目水平上的属性期望分类准确率指标,并将其用于组卷。模拟研究显示：新指标可十分准确地评价项目的属性判准率,新指标对于项目筛选十分重要;以模式分类准确率为评价指标,基于新指标的组卷方法与经典的组卷方法表现相当。相似文献

9.

具有认知诊断功能的计算机化自适应测验的研究与实现 总被引：3，自引：2，他引：1

林海菁丁树良《心理学报》2007,39(4):747-753

构造具有认知诊断功能的计算机化自适应测验（Computerized Adaptive Testing,CAT）,关键在于设计不同于传统CAT的选题策略。本文采用先认知诊断后估计能力的方法,在诊断阶段用状态转换图描述特定认知领域中所有知识状态及这些状态之间的联系,以图的深度优先算法为基础设计选题策略;而在能力估计精细化阶段,每个被试所测项目,不仅与其能力估计值相匹配,且只与其所掌握的属性相关。本文采用蒙特卡罗模拟针对三种不同的属性结构进行试验,结果良好相似文献

10.

教育认知诊断测验与认知模型一致性的评估

丁树良毛萌萌汪文义罗芬 CUI Ying 《心理学报》2012,44(11):1535-1546

构建正确的认知模型是成功进行认知诊断的关键之一,如果认知诊断测验不能完整准确地代表这个认知模型,这个测验的效度就存在问题.属性及其层级可以表示一个认知模型.在认知模型正确基础上,给出了一个计量公式以衡量认知诊断测验能够多大程度上代表认知模型;对于不止包含一个知识状态的等价类及其形成原因进行了分析,对Cui等人的属性层级相合性指标(HCI)提出修改建议,以更好地探查数据与专家给出的认知模型的一致性. 相似文献

11.

Q矩阵包含错误的诊断测验分类准确性比较

下载免费PDF全文

喻晓锋罗照盛高椿雷秦春影《心理科学》2014,37(6):1478-1484

Q矩阵是认知诊断测验的重要组成部分之一,围绕Q矩阵构建的诊断模型对Q矩阵中包含的错误较敏感。贝叶斯网分类模型是基于网络结点之间的关系构建的模型,将朴素贝叶斯网作为诊断模型,与DINA模型进行比较。模拟实验结果表明：Q矩阵中是否包含可达矩阵和错误界定的项目数量对DINA模型影响较大,对贝叶斯网模型影响较小;项目数量对DINA和贝叶斯网模型影响都较大;样本大小对贝叶斯网模型影响较大,对DINA模型影响较小。模拟研究结果显示,当Q矩阵中不包含可达阵、包含5个以上错误项目或样本数较大时,贝叶斯网分类模型优于DINA模型;而当Q矩阵中包含可达阵和5个(以下)错误项目时,DINA模型优于贝叶斯分类模型。相似文献

12.

具有认知诊断功能的区块化自适应测验的提出及验证

高椿雷揭玖晴罗照盛《心理科学》2020,(3):740-747

CD-CAT以Q矩阵理论为基础，存在着处理属性个数限制的缺点。为了解决该问题，本文提出了具有认知诊断功能的区块化自适应测验（CD-BAT）。CD-BAT将单个的CD-CAT作为区块进行处理，把前一区块的信息作为先验信息用于后一区块的估计过程，并不断更新和修正前一区块的估计结果。模拟研究表明，CD-BAT的判准率略优于CD-CAT，题库质量下降时，这种优势逐渐加大。随着CD-BAT的区块的增加，其属性判准率呈现上升趋势。相似文献

13.

认知诊断评价中测验结构的优化设计

彭亚风罗照盛喻晓锋高椿雷李喻骏《心理学报》2016,48(12):1600-1611

Q矩阵是认知诊断评价的基础和核心要素, 它反映了测验的构念和内容设计, 直接影响着测验诊断分类的效果。本文采用Monte Carlo模拟, 研究了6种属性层级关系下, 不同的Q矩阵设计对于认知诊断效果的影响。用模式判准率的均值和标准差分别从分类准确性和稳定性的角度来评价诊断效果。实验结果表明：(1) 不同属性层级关系下, 分类准确性会随着测验长度的增加而提高, 但当测验长度增加到一定程度时, 会出现“天花板效应”; (2) Q矩阵中R*的个数(NR*)会影响测验的分类准确性及稳定性：NR*越大, 测验的分类稳定性越高, 当测验长度为属性个数的整数倍, 且NR*为测验长度相对属性个数的最大奇数倍时分类准确性最高; (3) Q矩阵中除R*以外的项目考察的属性个数会随着属性层级关系的不同对测验的分类准确性和稳定性产生不同的影响。根据实验结果, 本研究提出了进行诊断评价时Q矩阵优化设计的一些建议。相似文献

14.

多级评分的认知诊断计算机化适应测验

蔡艳苗莹涂冬波《心理学报》2016,48(10):1338-1346

本文在0-1评分的CD-CAT基础上, 拓展出了适合多级评分CD-CAT (psCD-CAT)的认知诊断模型及选题策略, 为实现多级评分CD-CAT提供了方法支持。Monte Carlo模拟实验结果表明：本文拓展的多级评分CD-CAT具有较理想的属性诊断正确率及测验效率和题库安全性, 可以用于多级评分数据的CD-CAT; 模拟实验还表明, 整体来看PS-PWKL和PS-HKL两种选题策略具有较高属性判准率、题库安全性和高测验效率, 且均优于PS-KL选题策略。总之, 本研究对于进一步拓展CD-CAT在实践中的应用提供了认知诊断模型与选题策略等。相似文献

15.

认知诊断测验的自动组卷方法

马大付秦春影杨建芹徐新爱喻晓锋《心理学探新》2023,(6):550-557

认知诊断评估的重要一环是构建符合约束(统计约束与非统计约束)的诊断测验。其中构建测验的认知诊断自动测验组卷(cognitive diagnosis automated test assembly, CD-ATA)方法十分关键,受到广泛关注。文章通过梳理有关CD-ATA的研究,从组卷方法的类别、开发思路、组卷过程、方法对比及选用进行阐述与评析。最后,在已有方法基础上指出未来可从融合测验设计、非参数组卷、平行测验组卷、开发组卷软件、开展实证研究五个方面进行研究与探讨。相似文献

16.

认知诊断计算机化自适应测验的选题策略

唐倩毛秀珍何明霜何洁《心理科学进展》2020,28(12):2160-2168

随着认知诊断计算机化自适应测验(cognitive diagnostic computerized adaptive testing, CD-CAT)理论与实践的发展, 兼顾知识状态与能力的双目标CD-CAT逐渐受到重视。选题策略是CAT的核心, 通过梳理传统CD-CAT和双目标CD-CAT选题策略的研究, 并对它们的特点、关系及表现进行介绍和评析。最后, 基于认知诊断模型与CAT实践发展指出未来应加强一般化认知模型、复杂测验条件认知诊断模型下选题策略的研究; 应开发双目标诊断测验的项目和测验特征指标; 还应加强非参数选题方法和CD-CAT的实践应用研究。相似文献

17.

选项具有诊断信息的多选题认知诊断测验编制

李瑜丁树良《心理学探新》2014,(3):276-283

编制选项具有诊断信息的多选题是提高多选题认知诊断测验诊断效果的有效方法.研究从认知诊断的目标出发,根据认知诊断测验质量的评价标准,结合多选题的特点,探讨选项具有诊断信息的多选题认知诊断测验编制的原则.同时,结合多选题的特点和多选题采用称名计分方式的需要,对编制选项具有诊断信息的多选题提出两点要求.根据多选题认知诊断测验编制的原则和要求,给出具有可操作性的多选题认知诊断测验编制的步骤.模拟研究结果表明：根据所提出的原则和要求编制的多选题认知诊断测验具有较好的诊断效果,说明这些原则和要求合理、可行.由于这些原则、要求和步骤具有较强的可操作性,因此它对于编制多选题认知诊断测验具有一定的指导意义. 相似文献

18.

计算机适应性测验条件下认知设计项目预测参数的影响

杨向东《心理学报》2010,42(7):802-812

自动化项目生成(Automatic Item Generation)中的项目参数是基于认知项目设计的刺激特征集预测的, 在不确定性来源上较之用经验数据标定的参数更为复杂。文章通过实证研究分析了在计算机适应性测验条件下基于认知设计系统法生成的抽象推理测验(ART)项目预测参数对能力参数估计的精确性。研究表明, 项目预测参数比相应标定参数分布更为趋中。这种回归效应既影响到能力参数估计误差大小, 也导致适应性测验过程中项目选择的差异。在控制了项目选择差异之后, 能力参数估计误差较之基于项目标定参数的能力估计误差大, 但差别并不明显。两者相应的能力估计值相关很高, 对应能力值之间的差异很小, 且几乎贯彻整个能力分布区间。相似文献

19.

时距估计年龄差异的认知机制

张志杰黄希庭《心理科学》2007,30(3):524-528

采用双任务的实验范式,通过对（5s、13s和26s）三个目标时距的产生法和复制法的结果来探讨时距估计年龄差异的认知机制。实验结果表明,在不同目标时距和不同的估计方法上均存在显著的年龄效应。年老被试在产生法上比年轻被试显著高估时距,存在非时间任务和年龄的交互作用,随着任务难度的增加年老被试会比年轻被试产生更长的时距。而在复制法上年老被试比年轻被试显著低估时距,但是只有在长时距条件下（26s）存在非时间任务和年龄的交互作用。本研究结果表明年老被试在产生法上对时距的高估可能与内部时钟减慢和注意资源减少有关,而在复制法上对时距的低估可能反映注意资源的减少。此外,对于长时距的时间复制,情节记忆的损伤也是导致时距估计年龄差异的一个可能原因。相似文献

20.

计算机化自适应测验在认知诊断中的应用

唐小娟丁树良俞宗火《心理科学进展》2012,20(4):616-626

作为认知诊断与计算机化自适应测验相结合的产物, 认知诊断计算机化自适应测验(Cognitive Diagnostic Computerized Adaptive Testing, CD-CAT)是对被试知识状态的自适应。它既有传统CAT所面临的普遍性问题, 也有在认知诊断中遇到的特殊问题：由于认知诊断中涉及属性这一概念, CD-CAT与传统CAT有很大的差别。本文紧紧围绕属性引起的差异, 分别从认知诊断模型、题库建设、起始规则、选题策略、被试知识状态估计和终止规则等几部分详细介绍CD-CAT的研究进展和存在的问题。相似文献