首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
本文以项目反应理论为基础对联合型瑞文测验进行了项目分析。分析主要包括如下几个方面:项目特征曲线,项目信息函数,测验信息函数,项目效度和项目偏差。分析结果揭示了一些值得探讨的问题以供测验的编制,修订和使用者参考。  相似文献   

2.
三种心理测量理论的信度观   总被引:5,自引:0,他引:5  
目前,心理测量领域中主要存在三大理论派别。本文分别对这三种理论即经典测验理论、可概括性理论和项目反应理论作了简要介绍,着重分析这三种理论的信度观。文章讨论了这三种信度观的理论基础和研究方法,比较了它们的异同,指出经典测验理论存在的一些不足及概化理论和项目反应理论所作的改进。概化理论是对经典测验理论的扩展,它用多维的信度指标(概化系数)替代了经典测验理论的信度系数,项目反应理论则从信息量的角度出发,用项目信息函数、测验信息函数等指标更具体深入地反映项目、测验的测量可靠程度。  相似文献   

3.
项目反应理论等级反应模型项目信息量   总被引:7,自引:1,他引:6  
信息函数作为项目反应理论中的一个重要概念,在进行项目和测验分析的工作中,以及在指导测验编制的工作中,有着非常重要的应用价值。信息函数的应用在计算机化自适应测验中更是重中之重,也受到最大关注。然而,关于多级记分项目信息函数特性的研究还比较少。本研究模拟了被试特质水平参数数据和项目参数数据,其中被试特质水平参数生成了121个被试特质水平参数点,项目参数生成了4批不同区分度参数数据,每批数据有126个不同难度等级参数组合模式的项目,每个项目有5个难度等级。通过数据分析后发现,等级反应模型项目提供最大信息量所对应的被试特质水平,是与该项目几个相互临近的难度等级组相适应,既不是只与其中一个难度等级对应,也不一定是与所有难度等级对应。本研究称这种规律为“临近难度等级占优”。这个发现无疑对测验质量分析和测验编制工作,包括计算机化自适应测验编制,具有重要的指导意义  相似文献   

4.
涂冬波  蔡艳  戴海琦  丁树良 《心理学报》2011,43(11):1329-1340
本研究介绍并引进了现代测量理论中的前沿技术—— 多维项目反应理论, 采用MCMC算法实现了其参数估计; 并将MIRT应用于瑞文高级推理测验, 以探讨MIRT在心理测验中的具体应用。研究结果表明:(1)本研究自主编制的MIRT参数估计程序基本可行, 其估计的精度与国外研究结论相当甚至更好。(2)在测验维度和样本容量两因素完全随机实验设计下(2×3), 随着被试和题目样本容量的增加, MIRT参数估计的精度越高且估计的稳定性越强; 但随着测验维度的增加, MIRT参数估计精度和稳定性均随之降低。(3)MIRT对心理测验的分析比UIRT能提供更为精确和细致的信息。它对心理测验的编制、开发及评价具有重要的指导和参考价值, 值得引进及借鉴。  相似文献   

5.
项目反应理论的分数分布的预测作用   总被引:1,自引:0,他引:1  
曹亦薇 《心理科学》1998,21(4):375-376,372
1引言在心理和教育测量的实践过程中,测试者常常会从已实施过的测验项目里根据需要挑选一组项目重新组成新的测验。如果测试者事先能够通过一定的方法预测到关于这组测验分数的大致信息,这对编制不同要求的测验、检查教学效果以及评价学生能力有很大的帮助。在项目反应理论(IRT)中,预测分数的一般做法是通过测验特性函数来计算的(HambletomandSwaminathan,1985)。但是这样计算的结果只能知道在能力参数θ的某个水平上的分数.从本质上来说这是属于条件概率的点估计。为了了解在能力θ的整个范围里的测验分数的变化趋向,本文利用…  相似文献   

6.
项目难度与被试能力分布最优匹配的模拟研究   总被引:2,自引:1,他引:1  
李金波  王权 《心理学报》1998,31(2):197-203
该文运用蒙特卡罗方法对被测试能力分布与测验项目难度分布的匹配问题进行模拟分析,分析表明当能力分布为正态分布正偏态分布和负偏态分布时分别与测验项目难度分布与为正态分布,正偏态分布和负偏态分布匹配,比别的匹配有更高测验期望信息值,测验最大信息测验 系数,并且测验信息曲线最大值的能力点与能力分布的众数愈相一致,测验项目参数估计值性真实值的相关也更高。  相似文献   

7.
适应性测验作为一种测验形式,与传统的纸笔测验形式相比,具有省时、高效等很多优越性。测验应该适合于被试的理念最初可见于比内的智力测验。上世纪七十年代以来,适应性测验的研究从经典测量理论阶段发展到项目反应理论阶段,经历了从二阶段、三阶段、多阶段测验、固定分支测验和分层适应性测验的发展,到现在的计算机化适应性测验研究。随着项目反应理论和计算机技术的发展,计算机化适应性测验已经在教育和心理测验领域中得到广泛应用。目前对它的研究日益深入,主要有项目克隆、项目曝光、多维适应性测验、被试诊断、人格适应性测验等问题。  相似文献   

8.
CTT与IRT方法对人格测验结果处理的比较研究   总被引:3,自引:1,他引:2  
为了说明使用经典测量理论(CTT)方法和项目反应理论(IRT)方法计算出的人格测验结果的差异,本研究使用IRT和CTT这两种方法分别计算出模拟人格测验和实际人格测验的测验结果,并对此进行比较。研究表明,两种不同的方法得到的测验结果之间平均有0.11个标准差以上的差异。进一步研究发现,在对测验结果进行分析时,IRT方法比CTT方法更为有效。  相似文献   

9.
项目反应理论是测量被试潜在特质的现代测量理论, 潜在类别分析是基于模型的潜在特质分类技术。混合项目反应理论将项目反应理论与潜在类别分析相结合, 能够同时对被试分类并量化其潜在特质。在阐述混合项目反应理论概念、原理的基础上, 介绍了MRM、mNRM和mPCM等几种常见混合模型及其参数估计方法, 并从心理与行为特征分类、项目功能差异检测、测验效度评价等方面评述了其在心理测验中的应用发展轨迹。  相似文献   

10.
自闭症儿童的中心信息整合及其与心理理论的关系   总被引:9,自引:0,他引:9  
桑标  任真  邓赐平 《心理科学》2006,29(1):52-56
研究用积木测验和镶嵌图形测验测量中心信息整合,用5个信念任务测量心理理论能力,比较了12名自闭症儿童和同等言语能力的28名正常儿童的表现,并分析了心理理论和中心信息整合的相关。结果表明:(1)中心信息整合的测量指标积木测验和镶嵌图形测验成绩保持中高度相关;(2)自闭症儿童中心信息整合显著弱于正常儿童;(3)心理理论和中心信息整合成绩相互独立。  相似文献   

11.
测验垂直等值是指将测试同一心理特质的不同水平的测验转换到同一个分数量尺上的过程。IRT与MIRT是实现垂直等值的主要方法。IRT无需假设被试的能力分布, 参数估计不依赖于样本, 是构建垂直量表的有效方法, 但测验不满足单维假设时其应用受到限制。MIRT结合IRT和因素分析的特点对IRT进行了拓展, 可更有效估计多维测验的项目参数和被试能力参数, 在垂直等值中有重要应用。已有研究主要探讨IRT和MIRT在垂直等值应用中的适用性、标定方法和参数估计方法, 比较研究两种方法的特性。未来研究应纳入更多变量条件进行比较研究, 拓展方法的应用。  相似文献   

12.
目的:修订梅尔美术判断测验(Meier Art Judgment Test)并对其信度、效度进行检验。方法:通过对来自6所大学、中专共2270人施测梅尔美术判断测验,采用CTT区分度和IRT的模型拟合检验、区分度筛选项目,以霍兰德艺术分测验、学生艺术创作水平自评与艺术过往经历分量表为效标,以及采用效标组法(美术与非美术专业)检验效标关联效度。结果:保留的61题都拟合IRT的2参数logistic模型,量表得分与各效标得分相关显著,美术与非美术专业学生得分存在显著差异; 但测验信息量分析表明,对高能力被试的测量误差相对较大。结论:修订的量表能测量个体的美术判断能力; 今后改进方向应该是增加更难的试题。  相似文献   

13.
Letter: Universal Declaration of Human Rights by the World's Religions
Commenting on "Leaping into the Boundless: A Daoist Reading of Comparative Religious Ethics" by Francisca Cho, "Moral Reason, Risk, and Comparative Inquiry" by Robin W. Lovin, "Heuristic Power as the Test of Theory" by Ronald M. Green, and "The Author Replies" by Francisca Cho  相似文献   

14.
The purpose of this study was to examine the criterion-related and construct validity of the Career Maturity Inventory Competence Test. The Competence Test, Attitude Scale, and Cognitive Vocational Maturity Test were administered to 260 ninth-grade pupils in a rural junior high school to determine whether the variables were interrelated as hypothesized in theCrites (Theory and research handbook for the Career Maturity Inventory. Monterey, Calif.: CTB/McGraw-Hill, 1973) model of career maturity. The results show that, as predicted, the Competence Test is more highly correlated with the Cognitive Vocational Maturity Test than it is with the Attitude Scale. Also, as predicted, the subscales of the Competence Test are intercorrelated between .40 and .69. However, the correlations of the Attitude Scale with the Competence Test total score and the Cognitive Vocational Maturity Test total score are higher than the theoretical expectation.  相似文献   

15.
项目反应理论(IRT)是近年来探讨较多的一种心理测量理论。由于其所具有的一些优于经典测验理论(CTT)的特性,正得到愈来愈多的重视和应用。该研究旨在应用IRT来编制现代性量表。人的现代化是整个社会现代化过程中不可缺少的部分,因此编制衡量人的现代性的量表有一定的理论和实践意义。研究结果表明,应用IRT编制量表,在满足假设的情况下,可使量表既简便,又有较高的精度,效度研究表明本研究编制的现代性量表有较高的效度。  相似文献   

16.
大学英语四、六级考试分数等值研究   总被引:5,自引:0,他引:5  
朱正才 《心理学报》2005,37(2):280-284
对现有的大学英语四、六级考试分数等值模式中存在的若干问题进行了深入的分析,并提出了新的解决方案——一个基于铆题设计和两参数IRT模型的解决方案。主要包括:(1)用两参数逻辑斯蒂模型替代原来的Rasch模型,以改进题目模型的适合性;(2)用共同题目的等值设计取代原来的共同被试等值设计,解决共同被试等值设计中,等值考生的动机水平难以控制的难题;(3)建立专用的等值用题库,并且一次性完成其中铆题的预测和参数标定工作,以解决原来等值模式中存在的误差累积问题。同时,由于铆题的保密工作难度较小,因此,等值专用题库对保证等值结果的可靠性也具有重大意义;(4)本文还对新的分数等值方案进行了真实的考试数据等值计算实验,并得到了一个令人满意的分数等值结果。  相似文献   

17.
青少年道德判断能力的研究   总被引:4,自引:0,他引:4  
德国道德心理学家林德提出“道德行为与发展的双面理论”,并设计了著名的“道德判断测验”,在20多年的研究中取得了很多重要成果。我们以中文版的“道德判断测验”为测量工具,以724名12-27岁青少年学生为被试进行实证研究,研究结果表明:学生的C分数随年级提高而有所提高,但不同年级之间有一定波动,说明学校教育有助于提高学生的道德判断能力,但存在不稳定因素。男女生C分数不存在显著差异,学校内部各年级之间也不存在显著差异,不同性质的学生之间不存在显著差异;  相似文献   

18.
Impairments of Theory of Mind (ToM) abilities occur in a wide range of brain disorders. Therefore, reliable and ecologically valid examination of these abilities is a crucial part of any comprehensive neuropsychological assessment. An established and ecologically valid, English-language test identifying deficits in ToM abilities is “The Awareness of Social Inference Test – Social Inference Minimal (TASIT-SIM)”. However, no comparable German-language ToM test currently exists. In this study, we aimed to develop the first German-language adaption of TASIT-SIM in healthy adults. We selected 13 scenes [four scenes per message type (i.e., honesty, simple sarcasm, paradoxical sarcasm) and one practice scene] out of the 30 TASIT-SIM scenes. In collaboration with a film institute, we filmed each scene at three different intensities. These intensity version scenes were then administered to 240 healthy adults, equally distributed in sex and age, ranging from 35 to 92 years. By applying Rasch analysis, we selected intensity versions that showed neither floor nor ceiling effects in the majority of ToM questions in participants whose ToM abilities were in the medium range. In conclusion, we have developed the first German-language adaption of TASIT-SIM, i.e., the “Basel Version of the Awareness of Social Inference Test – Theory of Mind (BASIT-ToM)”. The BASIT-ToM incorporates the strengths of TASIT-SIM, while overcoming its limitations such as inconsistencies in cinematic realization and ceiling effects in healthy participants. Next, the BASIT-ToM needs to be validated in healthy people and clinical populations.  相似文献   

19.
This study has two main purposes: (a) to assess the functioning of the Geriatric Depression Scale in its Spanish version in old visually-impaired people, and (b) to assess the relevance of measuring depressive symptoms within a comprehensive assessment of psychological adjustment related to vision impairment in that population. Respondents were 329 people affiliated to the ONCE who were a representative sample of the target population. The assessment of the first goal let us to establish two cut-off points, and led to new methodological developments that combine Item Response Theory and Classical Test Theory. The results indicated that the scale is particularly useful in the target population and that it is very relevant in the assessment of psychological adjustment related to visual impairment in old people.  相似文献   

20.
概化理论(GT)和项目反应理论(IRT)从两个不同的方向发展了经典测量理论, GT和IRT中的多面Rasch测量模型(MFRM)在主观评分中都可以用来估计评分中各变异来源对变异的贡献, 对测评的信度进行估计, 提出测评改进意见。12名运动员参加了2008北京奥运会男子10米跳台跳水决赛, 比赛共6个回合, 7名裁判独立对他们在各个回合的表现进行打分。GT和MFRM比较一致地认为运动员自身、回合、运动员与回合的交互效应是运动员得分的重要变异来源, 而裁判员对运动员得分差异的贡献不显著。MFRM同时还估计出难度系数是影响男子跳台跳水成绩的重要变异来源, 在评分等级6.5附近存在步校准错乱, 得出的运动员成绩排序与2008奥运实际排序有所不同。在GT中难度系数作为隐藏侧面, 其效应未能分离出来。GT和MFRM从两个不同的方面给测量提供改进意见: GT发现可以通过增加回合数来提高g系数, 而增加裁判数对其影响不大。MFRM给出各侧面的要素(如某裁判、运动员等)的估计值及其标准误, 它给出的诊断性拟合统计也有助于甄别异常得分或评分模式。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号