首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
题组作为众多测验中的一种常见题型,由于项目间存在一定程度的依赖性而违背了局部独立性假设,若用项目反应模型进行参数估计将会出现较大的偏差.题组反应理论将被试与题组的交互作用纳入到模型中,解决了项目间相依性的问题.笔者对题组反应理论的发展、基本原理及其相关研究进行了综述,并将其应用在中学英语考试中.与项目反应理论相对比,结果发现:(1)题组反应模型与项目反应模型在各参数估计值的相关系数较强,尤其是能力参数和难度参数;(2)在置信区间宽度的比较上,题组反应模型在各个参数上均窄于项目反应模型,即题组反应模型的估计精度优于项目反应模型.  相似文献   

2.
心理账户:理论与应用启示   总被引:3,自引:0,他引:3  
“心理账户”是人们在心理上对结果(尤其是经济结果)的编码、分类和估价的过程,它揭示了人们在进行(资金)财富决策时的心理认知过程。心理账户的理论成果主要集中在“非替代性”的本质特征以及特殊的心理运算规则,心理账户在各个应用领域的研究成果主要包括:价格感知;行为资产组合理论;行为生命周期理论以及消费预算的研究。未来将在多元化研究方法的基础上,开展跨文化研究,对心理账户的内在心理机制和认知规律深入探讨  相似文献   

3.
涂冬波  蔡艳  戴海琦  丁树良 《心理学报》2011,43(11):1329-1340
本研究介绍并引进了现代测量理论中的前沿技术—— 多维项目反应理论, 采用MCMC算法实现了其参数估计; 并将MIRT应用于瑞文高级推理测验, 以探讨MIRT在心理测验中的具体应用。研究结果表明:(1)本研究自主编制的MIRT参数估计程序基本可行, 其估计的精度与国外研究结论相当甚至更好。(2)在测验维度和样本容量两因素完全随机实验设计下(2×3), 随着被试和题目样本容量的增加, MIRT参数估计的精度越高且估计的稳定性越强; 但随着测验维度的增加, MIRT参数估计精度和稳定性均随之降低。(3)MIRT对心理测验的分析比UIRT能提供更为精确和细致的信息。它对心理测验的编制、开发及评价具有重要的指导和参考价值, 值得引进及借鉴。  相似文献   

4.
项目反应理论框架下多级评分项目的信息函数   总被引:1,自引:0,他引:1  
杜文久 《心理学报》2006,38(1):135-144
目的是给出多级评分项目的信息函数计算公式,同时通过几个实例讨论了多级评分项目信息函数在实践中的应用。主要取得了如下成果:(1)首先通过一个例子给出了测验项目的样本空间;(2)以二参数逻辑斯蒂模型为基础,讨论了几种多级评分项目的概率函数,并在此基础上给出了多级评分项目的信息函数计算公式;(3)通过几个实例讨论了多级评分项目信息函数在实践中的应用  相似文献   

5.
阶层线性模型是处理阶层结构数据的高级统计方法, 项目反应理论是精确测量被试能力的现代测量理论。多水平项目反应理论将阶层线性模型和项目反应理论相结合, 将项目反应模型嵌套在阶层线性模型内, 实现了项目参数和不同水平能力参数的估计, 对回归系数和误差项变异的估计也更加精确。作者概述了多水平项目反应理论的发展历程, 并从项目功能差异、测验等值、学校效能研究等方面评述了多水平项目反应理论在心理与教育测量中的应用, 总结了多水平项目反应理论的价值, 同时展望了今后的研究趋势。  相似文献   

6.
项目反应理论是测量被试潜在特质的现代测量理论, 潜在类别分析是基于模型的潜在特质分类技术。混合项目反应理论将项目反应理论与潜在类别分析相结合, 能够同时对被试分类并量化其潜在特质。在阐述混合项目反应理论概念、原理的基础上, 介绍了MRM、mNRM和mPCM等几种常见混合模型及其参数估计方法, 并从心理与行为特征分类、项目功能差异检测、测验效度评价等方面评述了其在心理测验中的应用发展轨迹。  相似文献   

7.
杨向东 《心理科学进展》2010,18(8):1349-1358
从测验项目解决的认知过程的视角分析了在不同测验理论框架下的测量模型中的基本假设, 指出测量模型是测验开发者有关测验项目反应机制的理论假设的具体表征, 是系统检验测量假设和过程的统计框架。然而, 不管是经典测验理论、概化理论, 还是早期的项目反应理论模型, 相关假设都过于简化, 缺少相应实质理论的支持。与之相比, 认知测量模型强调与个体在测验项目反应过程中的认知过程、认知策略和知识结构的对应性, 提供了在实质理论基础上界定测量建构、设计测验项目、进行建模分析和解释的可能性, 为日益边缘化的心理测量学和主流心理学研究的融合奠定了基础。  相似文献   

8.
项目反应理论等级反应模型项目信息量   总被引:7,自引:1,他引:6  
信息函数作为项目反应理论中的一个重要概念,在进行项目和测验分析的工作中,以及在指导测验编制的工作中,有着非常重要的应用价值。信息函数的应用在计算机化自适应测验中更是重中之重,也受到最大关注。然而,关于多级记分项目信息函数特性的研究还比较少。本研究模拟了被试特质水平参数数据和项目参数数据,其中被试特质水平参数生成了121个被试特质水平参数点,项目参数生成了4批不同区分度参数数据,每批数据有126个不同难度等级参数组合模式的项目,每个项目有5个难度等级。通过数据分析后发现,等级反应模型项目提供最大信息量所对应的被试特质水平,是与该项目几个相互临近的难度等级组相适应,既不是只与其中一个难度等级对应,也不一定是与所有难度等级对应。本研究称这种规律为“临近难度等级占优”。这个发现无疑对测验质量分析和测验编制工作,包括计算机化自适应测验编制,具有重要的指导意义  相似文献   

9.
本文将多维题组反应模型(MTRM)应用到多维题组测验的项目功能差异(DIF)检验中,通过模拟研究和应用研究探究MTRM在DIF检验中的准确性、有效性和影响因素,并与忽略题组效应的多维随机系数多项Logistic模型(MRCMLM)进行对比。结果表明:(1)随着样本量的增大,MTRM对有效DIF值检出率增高,错误率降低,在不同条件下结果的稳定性更高;(2)与MRCMLM相比,基于MTRM的DIF检验模型检验率更高,受到其他因素的影响更小;(3)当测验中题组效应较小时,MTRM与MRCMLM结果差异较小,但是MTRM模型拟合度更高。  相似文献   

10.
社会评价:社会学在项目中的应用   总被引:9,自引:0,他引:9  
陈阿江 《学海》2002,(6):81-85
社会评价不是公众评价 ,不是经济评价的剩余 ,也不同于纯粹的社会学学术研究。它是社会学理论与方法在项目实践中的具体应用。其功能为 :(1)给出项目能否成立的基本判断 ;(2 )实现项目的社会发展目标 ;(3 )提高项目的经济效益。社会评价没有超出社会学方法论范畴。它的方法 ,除了常用的文献研究、观察、访谈、问卷、座谈会等方法外 ,也发展出一些有自身特色的如协商、公众参与等方法。社会评价的内容 ,通常包括项目社会影响分析 ,利益相关者分析 ,土地与居民生计调查 ,项目机构设置 ,少数民族发展等。  相似文献   

11.
结构方程建模中的题目打包策略   总被引:2,自引:0,他引:2  
吴艳  温忠麟 《心理科学进展》2011,19(12):1859-1867
结构方程建模中题目打包法的优缺点包括:指标数据质量变好、模型拟合程度提高; 估计偏差不大, 可校正; 估计稳定, 但降低了敏感性与可证伪性。打包法的前提条件是单维、同质, 适合结构模型分析, 不适合测量模型分析。对于单维测验, 给出了一个打包流程。对于通常的多个子量表(多维结构)测验, 推荐在子量表内打包, 每个子量表打包成1个指标或者3个指标, 用于结构方程建模。  相似文献   

12.
Arguments have been presented claiming that personality structure in the questionnaire medium can only be found by factor analyzing item data. To test this assumption, Cattell's 16PF, which was developed through factoring of parcels, was administered to 264 undergraduate students at the University of Illinois. Item data was factor analyzed, yielding essentially the same factor structure as produced by the original parceling.  相似文献   

13.
Several authors have suggested that prior to conducting a confirmatory factor analysis it may be useful to group items into a smaller number of item ‘parcels’ or ‘testlets’. The present paper mathematically shows that coefficient alpha based on these parcel scores will only exceed alpha based on the entire set of items if W, the ratio of the average covariance of items between parcels to the average covariance of items within parcels, is greater than unity. If W is less than unity, however, and errors of measurement are uncorrelated, then stratified alpha will be a better lower bound to the reliability of a measure than the other two coefficients. Stratified alpha are also equal to the true reliability of a test when items within parcels are essentially tau‐equivalent if one assumes that errors of measurement are not correlated.  相似文献   

14.
Different random or purposive allocations of items to parcels within a single sample are thought not to alter structural parameter estimates as long as items are unidimensional and congeneric. If, additionally, numbers of items per parcel and parcels per factor are held fixed across allocations, different allocations of items to parcels within a single sample are thought not to meaningfully alter model fit—at least when items are normally distributed. We show analytically that, although these statements hold in the population, they do not necessarily hold in the sample. We show via a simulation that, even under these conservative conditions, the magnitude of within-sample item-to-parcel-allocation variability in structural parameter estimates and model fit can alter substantive conclusions when sampling error is high (e.g., low N, low item communalities, few items per few parcels). We supply a software tool that facilitates reporting and ameliorating the consequences of item-to-parcel-allocation variability. The tool's utility is demonstrated on an empirical example involving the Neuroticism-Extroversion-Openness (NEO) Personality Inventory and the Computer Assisted Panel Study data set.  相似文献   

15.

Parceling—using composites of observed variables as indicators for a common factor—strengthens loadings, but reduces the number of indicators. Factor indeterminacy is reduced when there are many observed variables per factor, and when loadings and factor correlations are strong. It is proven that parceling cannot reduce factor indeterminacy. In special cases where the ratio of loading to residual variance is the same for all items included in each parcel, factor indeterminacy is unaffected by parceling. Otherwise, parceling worsens factor indeterminacy. While factor indeterminacy does not affect the parameter estimates, standard errors, or fit indices associated with a factor model, it does create uncertainty, which endangers valid inference.

  相似文献   

16.
多级评分计算机化自适应测验动态综合选题策略   总被引:1,自引:0,他引:1  
罗芬  丁树良  王晓庆 《心理学报》2012,44(3):400-412
多级评分可以提供更多关于被试的信息, 是计算机化自适应测验的一个发展方向, 选题策略是计算机化自适应测验的研究重点。对于多级评分的等级反应模型, 本文拟用区间估计的思想改进近期提出的几种选题策略, 并且将两级评分b-STR和a-STR推广到多级评分以改进最大信息量选题策略。Monte Carlo模拟实验表明在达到或接近原有选题策略测验精度的基础上, 本文提出的几种新选题策略有的能够有效降低测验长度, 有的可以极大降低项目曝光率。  相似文献   

17.
The present investigations examined the factor structure and psychometric properties of two new self-report measures of social phobia, the Social Interaction Anxiety Scale (SIAS) and the Social Phobia Scale (SPS). A confirmatory factor analysis in Study I provided support for the fit of a two-factor model of the SIAS and SPS. Internal consistency estimates were high for the original two scales with a sample of 200 undergraduates. Also, using an item parceling procedure, the obtained internal consistency reliability indices for each parcel were acceptable. Results of the CFA in Study II provided support for the factorial stability of the model identified in Study I. Furthermore, multisample analyses showed invariant patterns for factor loadings and factor correlations across 138 men and 272 women. Gender differences were not observed in the mean SIAS and SPS scale and item scores. Both scales correlated negatively and significantly with measures of social desirability. Concurrent validity was established for the scales. The SPS was less specific than the SIAS to symptoms of social phobia.  相似文献   

18.
19.
问卷法是一种常见的实证研究方法。问卷数据建模的前期工作,就像是一栋大楼的奠基工程,基础是否扎实,影响后续的工程质量。本文专门讨论统计模型建立之前要做的事情(重点是量表评价),内容包括:处理缺失值、评价量表的结构效度和题目删除的适当性、多维量表需要合成总分时检验同质性并计算合成信度、检验共同方法偏差和评价(变量)区分效度、题目打包、检验自变量的多重共线性,最后也涉及建模理据和无关变量控制等。  相似文献   

20.
While most validity indices are based on total test scores, this paper describes a method for quantifying the construct validity of items. The approach is based on the item selection technique originally described by Piazza in 1980. Unfortunately, Piazza's P2 index suffers from some substantial limitations. The Dm coefficient provides an alternative which can be used for item selection and provides a validity index for a set of items. The index is similar to that of traditional criterion-related validity indices. Criterion-related validity is used to demonstrate the accuracy of hypothesized relations of the measure with outcome variables of interest in research and practice. This method may be useful when the sample of items or persons is small, rendering more traditional approaches such as factor analysis or item response theory inappropriate. An example of how to use the technique is provided.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号