首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 31 毫秒
1.
严芳  李伟明 《心理学报》2002,34(5):534-539
评分者的信度分析,已从经典测量理论的方法(Kendall和谐系数)发展为基于现代测量理论(如GT)的方法,但由于GT中方差分量估计的工具和途径有限,使该方法的推广受到限制。本文介绍了结构方程建模(SEM)估计GT中方差分量的必要性及原理,并通过对某省直国家机关公务员录用考试结构化面试的评分者信度分析,阐述用SEM估计概化理论中不同设计下的评分者信度研究。  相似文献   

2.
孙晓敏  张厚粲 《心理科学》2005,28(3):646-649
随着素质教育的推进.表现性评价受到越来越多的重视。影响表现性评价结果信度的一个重要因素是评分者之间的不一致。文章使用模拟数据,在对比评分者一致性的相关法、一致性百分比法和概化系数等各种估计方法的基础上,提出概化理论在表现性评价中评分者信度问题上的应用是理论和实践发展的有益方向。  相似文献   

3.
赵群  曹亦薇 《应用心理学》2006,12(3):258-263
档案袋评价因能充分发挥促进学生发展和教学改进的功能而受到青睐,但不佳的测评信度和效度限制了其在教学评价中的应用。本文对档案袋评分者信度的特点进行实证研究,4位评分者对152份档案袋进行了2次等级评分,运用多种统计方法计算评分者信度。结果表明,档案袋的评分有较高的关联性、中等偏弱的一致性和一定的稳定性,对档案袋整体水平的评分信度最高。本研究中,评分者个数为3时,对档案袋整体水平评分的概化系数和可靠性系数都在0.80以上。  相似文献   

4.
李伟明  严芳 《心理学报》2001,34(5):84-87
对刘远我等在1998年《心理学报》和1999年《心理科学》上发表的两篇慨化理论(GT)的应用研究论文.提出了对GT的一些主要问题的不同理解。这些问题包括模型选择、方差分量解释、一致性指标比较等。  相似文献   

5.
探索性结构方程建模(ESEM)是在测量模型部分使用了类似于EFA模型的SEM.作为一种高级统计方法,ESEM整合了EFA和CFA两种因子分析方法的功能和优点.通过ESEM,研究者既可以灵活地探索因子结构,又可以系统地验证因子模型,为潜变量的关系分析提供更适宜的测量模型.ESEM已经在某些社科领域的研究中得到应用,是一种值得推介的因子分析方法.ESEM的具体应用问题,例如因子旋转方法的选用、测验信度评价等,仍有待探讨.  相似文献   

6.
多重情绪智力量表(MEIS)的信度、结构效度及应用评价研究   总被引:3,自引:0,他引:3  
曹蓉  王晓钧 《心理科学》2007,30(2):419-421
对多重情绪智力量表(MEIS)的信度和结构效度进行了实证检验,结果发现,MEIS的内部一致性信度(a)系数偏低,各分量表的分半信度系数很低;MEIS总量表的结构效度明显不足,对七个分量表的因素分析结果显示,每个维度对总量表的贡献率很低;无法满足Mayer和Salovey情绪智力4维度理论框架。对4个维度逐一进行二阶因素分析结果均揭示,MEIS明显缺乏每个维度所设定的4因素的结构效度,项目效率明显不足,因此,MEIS尚不具备有效测量情绪智力的功能。  相似文献   

7.
结构方程模式的发展与应用   总被引:7,自引:0,他引:7       下载免费PDF全文
结构方程模式(Structural Equation Modeling, SEM)在教育、心理研究中得到非常广泛的应用,但目前还有一些理论和技术上的问题有待于澄清。尤其在国内,许多研究者对这种统计方法不十分了解,因此导致了对该程序的误用以及对结果的错误解释。为此,文章首先对SEM的设计和估计方面的一些问题加以讨论;其次指出SEM在近期的一些发展以及在某些方面的最新应用;最后文章还对SEM的局限性进行了简要评述。  相似文献   

8.
bootstrap法在合成分数信度区间估计中的应用   总被引:1,自引:0,他引:1  
屠金路  金瑜  王庭照 《心理科学》2005,28(5):1199-1200
在介绍bootstrap法原理的基础上,本文以一个同质测量模式的模拟数据为例,对结构方程模型下使用bootstrap法对合成分数信度的区间估计的应用中进行了演示。  相似文献   

9.
孟鸿伟 《心理学报》1994,27(4):437-440
本文就心理所张建平同志的“一种新的统计方法和研究思路一结构方程建模述评”一文讨论了结构方程建模一般概念与LISREL模型的差异。并简要介绍了另一种结构方程建模方法一偏最小平方模型(PartialLeastSquareModel,简称PLS)。  相似文献   

10.
结构方程建模中的题目打包策略   总被引:2,自引:0,他引:2       下载免费PDF全文
吴艳  温忠麟 《心理科学进展》2011,19(12):1859-1867
结构方程建模中题目打包法的优缺点包括:指标数据质量变好、模型拟合程度提高; 估计偏差不大, 可校正; 估计稳定, 但降低了敏感性与可证伪性。打包法的前提条件是单维、同质, 适合结构模型分析, 不适合测量模型分析。对于单维测验, 给出了一个打包流程。对于通常的多个子量表(多维结构)测验, 推荐在子量表内打包, 每个子量表打包成1个指标或者3个指标, 用于结构方程建模。  相似文献   

11.
杨志明  张雷 《心理科学》2003,26(2):305-307
本文针对WISC-CR的二因子和三因子模型,以201位6至7岁小学生为对象,运用多元概化理论的方法研究了其总信度和各亚因子的测量信度。研究发现:(1)二因子模型下各亚因子与总测验的测量信度都比较高。但当它被作为测量言语理解、知觉组织和抗干扰三个因子的量表时,第3个因子的信度过低,且不易得到改善。这表明不宜用它来测量抗干扰的能力;(2)该量表不宜作为标准参照性测验来使用,因为其测量信度无法得到保障,此外,文章还展示了评价一个成套测验总信度及其亚能力因子信度的MGT方法,这于心理测量学的发展是有价值的。  相似文献   

12.
使用多元概化理论对由7名评委和34名考生组成的结构化面试数据进行了分析.结果表明:1.面试设置的5个维度中,仪表举止维度与其它4个维度之间的协方差相对较小;2.各个维度的概化系数都在0.69以上,其中,概化系数最小的是仪表举止维度,最大的是口语表达维度;3.通过增加评委人数可以提高面试信度,但增幅递减.  相似文献   

13.
朱宇  冯瑞龙  辛涛 《心理科学》2013,36(2):479-483
本研究以概化理论为视角,搜集了新HSK五级模拟书写题的作答和评分数据,估算了题型、题量、评卷员人数、评阅速度等潜在影响效应的方差分量,考察了新HSK书写成绩的可靠性,并探索了改善该分数可靠性的途径。基于概化理论和规划求解的数据分析发现了题量的调整方案以及题型、题量、评卷员人数的最优组合方案。本研究对评阅速度进行的分析属于前沿性的理论探索,而其他数据分析结果,则可能有益于旨在改进该测试质量的决策实践。  相似文献   

14.
从多元概化理论看高考综合能力测试的改进   总被引:10,自引:0,他引:10       下载免费PDF全文
杨志明  张雷  马世晔 《心理学报》2004,36(2):195-200
通过多元概化理论的研究发现,高考综合能力测试(2001,广东)的总体信度达到了可以接受的水平(0.784)。但测验中各部分对总方差的贡献程度与预定的赋分比例有较大差距。其中,地理和政治的贡献度偏低,化学和历史的贡献度偏高。这表明有(历史和化学)偏科特点的考生得到了较高的综合分数。又经决策(D)研究发现,增加地理部分的题量会反常地降低测验的总体信度,这说明有不少高分考生答错或主动放弃了地理科题目。因此,如何有效控制各部分的实际贡献程度、避免负面导向是当前高考综合能力测试亟待解决的问题。  相似文献   

15.
关丹丹 《心理学探新》2014,34(5):437-440
为了评价和改进硕士研究生入学考试一般能力测试的写作评分,研究者采用概化理论和多面Rasch分析对113位考生的写作样本的评分误差来源、评分信度等进行了探讨.概化理论研究显示,评分者和题目对评分准确性影响不大,以两道写作题的考试设计而言,评分者为2人即可保证评分信度在0.75以上.多面Rasch分析显示,评分者宽严度的估计值及其误差均在可接受的范围内,评分者之间在宽严度上不存在显著差异,且评分者自身在评分时总体上比较稳定.但个别评分者在特定考生特定题目上表现出特殊偏向.概化理论和多面Rasch分析丰富了写作评分研究的量化指标,证实了硕士研究生入学考试一般能力测试的写作评分具有较高的信度.  相似文献   

16.
"青少年学生生活满意度量表"的概化理论研究   总被引:2,自引:0,他引:2  
何立国  周爱保 《心理科学》2006,29(5):1199-1202,1218
概化理论是用统计调整技术分析测量误差的一种测量理论,它侧重于从宏观方面讨论实测时的测量条件与结论推广应用范围之间的关系来探讨测量的外部效度问题。本文用概化理论对青少年学生生活满意度量表(CASLSS)进行了研究,得到以下研究结果:(1)对于生活满意度的维度数目,就我国青少年学生而言取6到8个维度较为合适,当对CASLSS取2个维度时,CASLSS只适合作常模参照性解释,而不适合作标准参照性解释;(2)CASLSS的各分量表和总量表的信度较高,且它不仅可以作常模参照性解释,还适合作标准参照性解释;(3)CASLSS的环境满意度因子相对其它五个因子而言,量表特性稍差,是今后改进该量表的主要方向。CASLSS无论是各个因子还是总量表均具有非常优良的量表特性,值得在实际的工作和研究中加以推广应用。  相似文献   

17.
用多元概化理论对普通话的测试   总被引:5,自引:0,他引:5       下载免费PDF全文
杨志明  张雷 《心理学报》2002,34(1):51-56
用多元概化理论 (MGT)研究了国家语委编制的普通话测验。在G研究中 ,利用香港人普通话测试的数据 ,估计了引起分数变异的各种来源的方差与协方差分量。在D研究中 ,首先估计了该测验 3个部分的全域分数和各自的概化系数等技术指标 ,然后估计了全域合成分数及其概化系数、信噪比等指标。结果表明 ,该测验的信度从总体上讲是较高的 ,把三个部分的全域分数进行合成也是合理的 ,但从细节上看其第 3部分的信度较低。另外 ,当评分者个数为 3、试题数量为 2 8时 ,测验的第 1、2部分的信度已经较高 ,因此 ,在实测时减少这两部分的题量并不会有太大问题  相似文献   

18.
评价中心测评的评分误差分析研究   总被引:4,自引:0,他引:4  
彭平根  艾平 《心理科学》2004,27(4):955-957
本研究应用概化理论对评价中心中的评分误差控制问题进行了系统的分析探讨,得出了以下研究结论:(1)总体上,在评价中心(以LGD为例)测评中,评价员对研究设计的测评维度的评分基本反映了被试的真实能力水平,测量误差较小;(2)评价员对合作能力、应变能力和总体印象等维度的评价标准的理解具有较高的一致性,但对决策能力等维度的评价标准的理解存在一定的偏差;(3)在评价中心(以LGD为例)测评中,采用4名评价员能达到预期的测量目标,符合测评应用的经济性、有效性原则。  相似文献   

19.
The development is reported of an SR-inventory of achievement-related behaviour for the purpose of managerial selection. SR-inventories stem from interactional personality psychology. As the design of an SR-inventory is two-facetted, Cronbach et al.'s generalizability theory forms a suitable framework to investigate it. Using data of 404 Dutch respondents — mostly applicants — several generalizability analyses have been performed to conclude under which circumstances the inventory can be a useful tool. Furthermore, confirmatory factor analysis has been used to substantiate the suggested SR-structure of the instrument. The relationship with other personality factors has been investigated to classify the instrument in the domain of personality assessment.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号