首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 93 毫秒
1.
关丹丹  张厚粲 《心理科学》2004,27(2):445-448
本文首先对信度概念进行了明确,指出信度是评价测验结果可靠与否的一个指标,而不是测验工具的不变属性。针对测验结果的信度估计的可变性,介绍了上世纪末Vacha-Haase提出的信度概括化研究方法.即一种用来探索得分信度估计的可变性、并对引起变异的预测源进行探讨的一种元分析方法。最后通过对信度概括化研究手段的分析,指出信度概念的再认识与信度概括化研究将会给心理测验工作者带来新的启示。  相似文献   

2.
本文在经典测量理论的框架之内,就信度的概念与运用阐述了三个相关问题:首先,指出信度适用于测量分数而非测量工具,然后,阐述为什么最常用的信度估计是α系数,最后,就α系数的正确使用提出了建议。  相似文献   

3.
概化理论(GT)与经典测验理论(CTT)是随机测量模型下信度评量的重要理论来源。本文将重复测量作为理解概化理论产生与建构的切入点,剖析了GT在测验假设、全域分思想与误差观三方面的特点,提出了目前GT在理论与应用方面存在的若干问题与不足。  相似文献   

4.
经典测量理论与项目反应理论是教育心理测量理论中的两大支柱,两种理论之间既有联系,又有区别,因而,也凸现出了两种理论各自的优势与缺陷。对此,根据不同的心理或教育测量的目的,我们要选择更为适合的理论模型与测量方法。  相似文献   

5.
田伟  辛涛  康春花 《心理科学进展》2014,22(6):1036-1046
在心理与教育测量中, 项目反应理论(Item Response Theory, IRT)模型的参数估计方法是理论研究与实践应用的基本工具。最近, 由于IRT模型的不断扩展与EM (expectation-maximization)算法自身的固有问题, 参数估计方法的改进与发展显得尤为重要。这里介绍了IRT模型中边际极大似然估计的发展, 提出了它的阶段性特征, 即联合极大似然估计阶段、确定性潜在心理特质“填补”阶段、随机潜在心理特质“填补”阶段, 重点阐述了它的潜在心理特质“填补” (data augmentation)思想。EM算法与Metropolis-Hastings Robbins-Monro (MH-RM)算法作为不同的潜在心理特质“填补”方法, 都是边际极大似然估计的思想跨越。目前, 潜在心理特质“填补”的参数估计方法仍在不断发展与完善。  相似文献   

6.
CTT与IRT方法对人格测验结果处理的比较研究   总被引:2,自引:1,他引:2  
为了说明使用经典测量理论(CTT)方法和项目反应理论(IRT)方法计算出的人格测验结果的差异,本研究使用IRT和CTT这两种方法分别计算出模拟人格测验和实际人格测验的测验结果,并对此进行比较。研究表明,两种不同的方法得到的测验结果之间平均有0.11个标准差以上的差异。进一步研究发现,在对测验结果进行分析时,IRT方法比CTT方法更为有效。  相似文献   

7.
四参数Logistic模型潜在特质参数的Warm加权极大似然估计   总被引:1,自引:0,他引:1  
孟祥斌  陶剑  陈莎莉 《心理学报》2016,(8):1047-1056
本文以四参数Logistic(4-parameter Logistic,4PL)模型为研究对象,根据Warm的加权极大似然估计技巧,提出了4PL模型潜在特质参数的加权极大似然估计方法,并借助模拟研究对加权极大似然估计的性质进行验证。研究结果表明,与通常的极大似然估计和后验期望估计相比,加权极大似然估计的偏差(bias)明显减小,并且具有良好的返真性能。此外,在测试的长度较短和项目的区分度较小的情况下,加权极大似然估计依然保持了良好的统计性质,表现出更加显著的优势。  相似文献   

8.
α系数与测验的同质性   总被引:1,自引:0,他引:1  
刘红云 《心理科学》2008,31(1):185-188,176
本文从α系数与同质性测验、平行测验和基本τ-等价测验间的关系及三种测验间的关系入手,分析了α系数作为测验同质性信度估计的局限性;根据Jreskog给出的信度定义(α系数),讨论了λ系数与α一致性信度、Guttman 下限之间的关系,说明了在测验同质的前提下,λ系数在估计测验内部一致性时与α系数相比的优点.同时用模拟数据的方法就不同情景下测验的结构维度与α系数、Guttman λ2下限和λ系数之间的关系进行了探讨.  相似文献   

9.
适应性测验作为一种测验形式,与传统的纸笔测验形式相比,具有省时、高效等很多优越性。测验应该适合于被试的理念最初可见于比内的智力测验。上世纪七十年代以来,适应性测验的研究从经典测量理论阶段发展到项目反应理论阶段,经历了从二阶段、三阶段、多阶段测验、固定分支测验和分层适应性测验的发展,到现在的计算机化适应性测验研究。随着项目反应理论和计算机技术的发展,计算机化适应性测验已经在教育和心理测验领域中得到广泛应用。目前对它的研究日益深入,主要有项目克隆、项目曝光、多维适应性测验、被试诊断、人格适应性测验等问题。  相似文献   

10.
特质激活理论旨在阐明适宜的外部情境如何激活个体的内在特质, 以及这种激活如何促使潜藏的隐性特质表达出显性的行为。文章综述了特质激活理论, 剖析了其从思想诞生到基准模型, 再到拓展模型的两次飞跃, 重点阐释了情境分层、情境特征、激活后果的反馈等系统, 辨析了特质激活的内涵及其与“人-环境”匹配理论、与情境强度理论的异同, 从深化验证、拓展现有理论模型等视角提出未来研究走向。  相似文献   

11.
We examined the effects of several variations in response rate on the calculation of total, interval, exact‐agreement, and proportional reliability indices. Trained observers recorded computer‐generated data that appeared on a computer screen. In Study 1, target responses occurred at low, moderate, and high rates during separate sessions so that reliability results based on the four calculations could be compared across a range of values. Total reliability was uniformly high, interval reliability was spuriously high for high‐rate responding, proportional reliability was somewhat lower for high‐rate responding, and exact‐agreement reliability was the lowest of the measures, especially for high‐rate responding. In Study 2, we examined the separate effects of response rate per se, bursting, and end‐of‐interval responding. Response rate and bursting had little effect on reliability scores; however, the distribution of some responses at the end of intervals decreased interval reliability somewhat, proportional reliability noticeably, and exact‐agreement reliability markedly.  相似文献   

12.
希望特质量表在中学生群体中的信、效度检验   总被引:2,自引:0,他引:2  
通过对770名中学生施测,检验Snyder的希望特质量表(TTHS)的信度和效度。结果表明,总量表的重测信度、量表的结构效度和效标效度符合心理测量学要求。ITHS可以作为测量中国中学生希望特质的工具。在中国文化背景下。Snyder提出的希望特质仍然是一种积极的心理品质,希望特质也从某方面代表着中国中学生的心理健康水平。  相似文献   

13.
Recent work on reliability coefficients has largely focused on continuous items, including critiques of Cronbach’s alpha. Although two new model-based reliability coefficients have been proposed for dichotomous items (Dimitrov, 2003a,b; Green & Yang, 2009a), these approaches have yet to be compared to each other or other popular estimates of reliability such as omega, alpha, and the greatest lower bound. We seek computational improvements to one of these model-based reliability coefficients and, in addition, conduct initial Monte Carlo simulations to compare coefficients using dichotomous data. Our results suggest that such improvements to the model-based approach are warranted, while model-based approaches were generally superior.  相似文献   

14.
Assuming a nonparametric family of item response theory models, a theory-based procedure for testing the hypothesis of unidimensionality of the latent space is proposed. The asymptotic distribution of the test statistic is derived assuming unidimensionality, thereby establishing an asymptotically valid statistical test of the unidimensionality of the latent trait. Based upon a new notion of dimensionality, the test is shown to have asymptotic power 1. A 6300 trial Monte Carlo study using published item parameter estimates of widely used standardized tests indicates conservative adherence to the nominal level of significance and statistical power averaging 81 out of 100 rejections for examinee sample sizes and psychological test lengths often incurred in practice.The referees' comments were remarkably detailed and greatly enhanced the writeup and sensitized the author to certain pertinent issues. Discussions with Fritz Drasgow, Lloyd Humphreys, Dennis Jennings, Brian Junker, Robert Linn, Ratna Nandakumar, and Robin Shealy were also very useful.This research was supported by the Office of Naval Research under grant N00014-84-K-0186; NR 150-533, and by the National Science Foundation under grant DMS 85-03321.  相似文献   

15.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号