首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
测验理论的新发展:多维项目反应理论   总被引:3,自引:0,他引:3  
多维项目反应理论是基于因子分析和单维项目反应理论两大背景下发展起来的一种新型测验理论。根据被试在完成一项任务时多种能力之间是如何相互作用的,多维项目反应模型可以分为补偿性模型和非补偿性模型两类。本文在系统介绍了当前普遍使用的补偿性模型的基础上,指出后续研究者应关注多维项目反应理论中多级评分和高维空间的多维模型、补偿性和非补偿性模型的融合、参数估计程序的开发和多维测验等值四个方面的研究。  相似文献   

2.
杨向东 《心理科学进展》2010,18(8):1349-1358
从测验项目解决的认知过程的视角分析了在不同测验理论框架下的测量模型中的基本假设, 指出测量模型是测验开发者有关测验项目反应机制的理论假设的具体表征, 是系统检验测量假设和过程的统计框架。然而, 不管是经典测验理论、概化理论, 还是早期的项目反应理论模型, 相关假设都过于简化, 缺少相应实质理论的支持。与之相比, 认知测量模型强调与个体在测验项目反应过程中的认知过程、认知策略和知识结构的对应性, 提供了在实质理论基础上界定测量建构、设计测验项目、进行建模分析和解释的可能性, 为日益边缘化的心理测量学和主流心理学研究的融合奠定了基础。  相似文献   

3.
本主要介绍了态度研究中的一种理论模型——双重态度模型。该模型的理论框架主要包括:该模型中内隐态度的界定;双重态度的理论假设;基本类型;双重态度与相关概念的区别。另外本还回顾了有关双重态度的实证性研究。  相似文献   

4.
本文首先分析了经典测验理论存在的局限,然后在潜在特质理论和项目特征曲线两大概念基础上阐述了项目反应理论及其基础模型的测量学原理,介绍了多个项目反应理论基础模型.最后简要介绍了七项当前应用项目反应理论指导大型题库建设和指导编制各种新型测验的热点内容.  相似文献   

5.
题组作为众多测验中的一种常见题型,由于项目间存在一定程度的依赖性而违背了局部独立性假设,若用项目反应模型进行参数估计将会出现较大的偏差.题组反应理论将被试与题组的交互作用纳入到模型中,解决了项目间相依性的问题.笔者对题组反应理论的发展、基本原理及其相关研究进行了综述,并将其应用在中学英语考试中.与项目反应理论相对比,结果发现:(1)题组反应模型与项目反应模型在各参数估计值的相关系数较强,尤其是能力参数和难度参数;(2)在置信区间宽度的比较上,题组反应模型在各个参数上均窄于项目反应模型,即题组反应模型的估计精度优于项目反应模型.  相似文献   

6.
分部评分模型与其它几种多级模型的比较   总被引:1,自引:0,他引:1  
纪凌开 《心理科学》2004,27(4):1000-1001
项目反应理论(IRT)是当前教育与心理测量领域的一个重大进展,也日益成为当今测验领域的一个热点。本文对IRT理论中的二个重要评分模型PCM与GPCM作了简要的介绍。并较详细地对PCM与GPCM模型的逻辑结构及其适用范围进行了论述,指出了它们与其它几种重要模型之间的关系及不同之处。  相似文献   

7.
肖涵敏  杜文久  张婷婷 《心理学报》2011,43(12):1462-1467
多级评分项目由于可以提供更多关于被试的信息而被广泛的使用。本文首先通过引用一个多级评分的数学试题, 给出了项目节点这一概念。假设被试在项目节点上的正确反应概率为二参数逻辑斯蒂模型之下, 本文通过分析三种不同类型的多级评分项目, 得出了三个评分模型, 其中一个和等级反应模型在形式上是一样的。鉴于我国目前考试测量所使用的多级评分项目的形式, 可以运用本文所述的项目节点的方法将项目评分模型统一提出。  相似文献   

8.
当前大多数融合反应时的IRT模型仅适用于0-1评分数据资料,极大的限制了IRT反应时模型在实际中的应用。本文在传统的二级计分反应时IRT模型基础上,拟开发一种多级评分反应时模型。在层次建模框架下,分别采用拓广分部评分模型(GPCM)和对数正态模型构建融合反应时的多级评分IRT模型(本文记为JRT-GPCM),并采用全息贝叶斯MCMC算法实现新模型的参数估计。为验证新开发的JRT-GPCM模型的可行性及其在实践中的应用,本文开展了两项研究:研究1为模拟实验研究,研究2为新模型在大五人格-神经质分量表中的应用。研究1结果表明,JRT-GPCM模型的估计精度较高,且具有较好的稳健性。研究2表明,被试的潜在特质与作答速度具有一定的正相关,且本研究结果支持Ferrando和Lorenzo-Seva(2007)提出的“距离-困难度假设”,即当被试的潜在特质与项目的难度阈限距离越远,那么被试会花费更多的时间对项目进行作答。总之,本研究为拓展反应时信息在心理测量及教育中的应用提供新的方法支持。  相似文献   

9.
在两项研究中,我们检验了用以判断姿式的维度结构的跨文化的适用性。在研究一中,686名日本被试用16个在意义上相差5个点的量表项目对40种姿式的表达进行了评定。被试在假设的双重情景中推断出一个编码人对自身(即对被试解码)的态度。一个主要成分的因素分析为三个独立的维度提供了证据,这三个独立维度与施洛斯伯格(1954)、奥斯古德(1966)和威廉姆斯与桑德恩(1965)所提出的类似。这三种因素被称为自我满足因素、人际间的积极因素和人际意识因素。在研究二中,336个日本学生用16个相差5个点的项目对40种姿式表达再度进行了评定,但对假设的编码人的身份试图加以控制。这项研究基本上重复了研究一的结果。有趣的是虽然我们发现了与西方所做的研究中相同的因素,但在我们的研究中,因素的顺序与以前的研究正好相反。本文对这些发现在维持人类关系中根据所提出的文化差异进行了讨论。  相似文献   

10.
主观评分中多面Rasch模型的应用   总被引:1,自引:1,他引:0  
主观评分中存在的不一致性导致主观评分的信度降低。多面Rasch模型基于项目反应理论,可以应用于评分员效应的识别和消除,从而提高主观评分的信度。该文介绍多面Rasch模型的理论和应用框架,介绍了国外相关的典型应用,并且讨论了该模型的应用条件。  相似文献   

11.
比较是社会判断的核心过程。近期,Mussweile提出了选择通达理论模型,该模型区分了比较中两个基本的假设过程,整合了比较中的多种结果,为人们更好地理解判断的本质提供了一个新视角。本文主要介绍了选择通达的过程、结果及其存在的普遍性,并讨论了参照点运用和选择通达机制之间的区别和联系。  相似文献   

12.
时间信息的加工一直是当代阅读心理研究的热点。以往研究对时间信息表征的性质、维度特征、提取机制等问题存在诸多争论, 主要表现为强印象假设与场景理论的冲突。我们认为, 文本阅读中时间信息的加工包括两个阶段:加工时间词以及低水平的更新情景模型阶段和通达与整合先前信息阶段, 强印象假设和场景理论争论的实质在于前者解释的是加工的第一个阶段, 而后者解释的是加工的第二个阶段, 因此, 总是难以调和。本项目首先在更高的理论层面上将二者加以整合, 然后采用经典的认知心理学研究方法与现代的眼动研究技术相结合的方法, 通过对文本阅读中时间信息表征性质、加工的维度特征、提取过程的激活与抑制特征等问题的探讨, 为本项目提出的时间信息加工的二阶段模型提供行为实验与眼动实验证据, 从而解决该领域中强印象假设与场景理论的长期争论。本项目的理论构想与研究技术对文本阅读其他问题的探讨具有重要的方法论意义。  相似文献   

13.
项目反应理论是测量被试潜在特质的现代测量理论, 潜在类别分析是基于模型的潜在特质分类技术。混合项目反应理论将项目反应理论与潜在类别分析相结合, 能够同时对被试分类并量化其潜在特质。在阐述混合项目反应理论概念、原理的基础上, 介绍了MRM、mNRM和mPCM等几种常见混合模型及其参数估计方法, 并从心理与行为特征分类、项目功能差异检测、测验效度评价等方面评述了其在心理测验中的应用发展轨迹。  相似文献   

14.
HSK主观考试评分的Rasch实验分析   总被引:1,自引:0,他引:1  
主观评分中存在的不一致性导致主观评分的信度降低。多面Rasch模型基于项目反应理论,可以应用于评分员效应的识别和消除,从而提高主观评分的信度。该文介绍多面Rasch模型的理论和应用框架,设计了基于该模型的HSK主观考试评分质量控制应用框架,利用HSK作文评分数据进行了实验验证。  相似文献   

15.
多维项目反应理论等级反应模型   总被引:2,自引:0,他引:2  
杜文久  肖涵敏 《心理学报》2012,44(10):1402-1407
基于因子分析和单维项目反应理论的多维项目反应理论是测量理论的新发展方向之一。但是, 多维项目反应理论仍处于不成熟的发展阶段, 多数研究也只是以二级评分为主。本文首先介绍了逻辑斯蒂形式的多维等级反应模型, 并以二维等级反应模型为例, 分析了模型的数学函数图像及其性质。然后, 推导出了多维等级反应模型的项目信息函数, 并结合实例进行了讨论。进一步地, 本文阐述了使用联合极大似然估计和马尔科夫链蒙特卡洛方法估计多维等级反应模型参数的思想。最后, 指出了一些有待研究的问题。  相似文献   

16.
Tatsuoka Q矩阵理论的修正   总被引:4,自引:3,他引:1  
K.K.Tatsuoka和她同事开发的规则空间模型(RSM)是一种在国内外有较大影响的认知诊断模型,但是Tatsuoka的RSM中Q矩阵理论存在缺陷和错误,这些失误使得RSM中用布尔描述函数(BDF)计算被试理想项目反应模式(IRP)的方法缺乏理论依据.这里揭示了Tatsuoka的Q矩阵理论的缺陷和错误并引进既不使用BDF又便于应用的计算IRP的方法;接着还介绍一种由可达阵计算简化Q阵的方法,该方法显示了可达阵在构造认知诊断测验的重要性.这些结果对丰富Q矩阵理论及正确使用RSM进行认知诊断有一定的意义.  相似文献   

17.
采用项目反应理论(IRT)的多侧面Rasch模型(MFRM),分析评价中心技术中无领导小组讨论(LGD)的测评结果,探讨被试能力水平、评委评分宽严度、评分内部一致性、维度难度和评定等级等问题,进而讨论各种偏差。通过 MFRM 分析人事测评结果,可深入了解被试能力的真实差异、甑别维度难度、探查测评误差源,从而完善测评试题编制、评估或诊断评委合格性、提高测评维度与测评目的匹配性,为拓展项目反应理论在人事测评中的应用提供独特视角。  相似文献   

18.
学习(潜能)和(行为水平)变化的多维Rasch模型(MRMLC)是一种常见的动态评估项目反应理论(IRT)模型。本文根据该模型的基本特征提出了一次性估计和分步估计两种能力参数估计方法。并且采用蒙特卡罗计算机模拟研究对这两种估计方法进行了比较。模拟研究结果表明,一次性估计法比分步估计法的准确性和稳定性要好。  相似文献   

19.
刘红云  骆方 《心理学报》2008,40(1):92-100
作者简要介绍了多水平项目反应模型,对多水平项目反应理论与通常项目反应理论之间的关系进行了探讨,得到了多水平项目反应模型参数与通常项目反应模型参数之间的关系,并讨论了多水平项目反应模型的推广模型。通过一个实际例子,用多水平项目反应模型对测验中项目的特征进行分析;检验个体水平和组水平预测变量对能力参数的影响;对项目功能差异进行分析。最后文章就多水平项目反应理论模型的优势与不足进行了讨论  相似文献   

20.
经济法试题DIF的参数法检测研究   总被引:2,自引:1,他引:1  
该研究基于项目反应理论的Samejima等级反应模型(GRM),在MULTILOG软件支持下,应用参数检测方法,对某年度全国性资格考试的某科目试卷中经济法部分的21个项目做了DIF检测分析。结果如下:存在性别DIF的项目一个,存在民族DIF的项目四个,存在工作性质DIF的项目一个。其中项目68在民族层面上表现为一致性DIF,项目64既存在民族DIF又存在工作性质DIF。通过对项目统计量、反应曲线的分析和专家的讨论,文章最后还分析了产生这些DIF的几个可能的原因。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号