共查询到19条相似文献,搜索用时 31 毫秒
1.
评分者的信度分析,已从经典测量理论的方法(Kendall和谐系数)发展为基于现代测量理论(如GT)的方法,但由于GT中方差分量估计的工具和途径有限,使该方法的推广受到限制。本文介绍了结构方程建模(SEM)估计GT中方差分量的必要性及原理,并通过对某省直国家机关公务员录用考试结构化面试的评分者信度分析,阐述用SEM估计概化理论中不同设计下的评分者信度研究。 相似文献
2.
表现性评价中评分者信度估计方法的比较研究--从相关法、百分比法到概化理论 总被引:12,自引:0,他引:12
随着素质教育的推进.表现性评价受到越来越多的重视。影响表现性评价结果信度的一个重要因素是评分者之间的不一致。文章使用模拟数据,在对比评分者一致性的相关法、一致性百分比法和概化系数等各种估计方法的基础上,提出概化理论在表现性评价中评分者信度问题上的应用是理论和实践发展的有益方向。 相似文献
3.
档案袋评价因能充分发挥促进学生发展和教学改进的功能而受到青睐,但不佳的测评信度和效度限制了其在教学评价中的应用。本文对档案袋评分者信度的特点进行实证研究,4位评分者对152份档案袋进行了2次等级评分,运用多种统计方法计算评分者信度。结果表明,档案袋的评分有较高的关联性、中等偏弱的一致性和一定的稳定性,对档案袋整体水平的评分信度最高。本研究中,评分者个数为3时,对档案袋整体水平评分的概化系数和可靠性系数都在0.80以上。 相似文献
4.
5.
探索性结构方程建模(ESEM)是在测量模型部分使用了类似于EFA模型的SEM.作为一种高级统计方法,ESEM整合了EFA和CFA两种因子分析方法的功能和优点.通过ESEM,研究者既可以灵活地探索因子结构,又可以系统地验证因子模型,为潜变量的关系分析提供更适宜的测量模型.ESEM已经在某些社科领域的研究中得到应用,是一种值得推介的因子分析方法.ESEM的具体应用问题,例如因子旋转方法的选用、测验信度评价等,仍有待探讨. 相似文献
6.
多重情绪智力量表(MEIS)的信度、结构效度及应用评价研究 总被引:3,自引:0,他引:3
对多重情绪智力量表(MEIS)的信度和结构效度进行了实证检验,结果发现,MEIS的内部一致性信度(a)系数偏低,各分量表的分半信度系数很低;MEIS总量表的结构效度明显不足,对七个分量表的因素分析结果显示,每个维度对总量表的贡献率很低;无法满足Mayer和Salovey情绪智力4维度理论框架。对4个维度逐一进行二阶因素分析结果均揭示,MEIS明显缺乏每个维度所设定的4因素的结构效度,项目效率明显不足,因此,MEIS尚不具备有效测量情绪智力的功能。 相似文献
7.
8.
9.
本文就心理所张建平同志的“一种新的统计方法和研究思路一结构方程建模述评”一文讨论了结构方程建模一般概念与LISREL模型的差异。并简要介绍了另一种结构方程建模方法一偏最小平方模型(PartialLeastSquareModel,简称PLS)。 相似文献
10.
11.
韦氏儿童智力量表能否测量第3因子--WISC-CR的多元概化理论研究 总被引:6,自引:2,他引:4
本文针对WISC-CR的二因子和三因子模型,以201位6至7岁小学生为对象,运用多元概化理论的方法研究了其总信度和各亚因子的测量信度。研究发现:(1)二因子模型下各亚因子与总测验的测量信度都比较高。但当它被作为测量言语理解、知觉组织和抗干扰三个因子的量表时,第3个因子的信度过低,且不易得到改善。这表明不宜用它来测量抗干扰的能力;(2)该量表不宜作为标准参照性测验来使用,因为其测量信度无法得到保障,此外,文章还展示了评价一个成套测验总信度及其亚能力因子信度的MGT方法,这于心理测量学的发展是有价值的。 相似文献
12.
13.
14.
通过多元概化理论的研究发现,高考综合能力测试(2001,广东)的总体信度达到了可以接受的水平(0.784)。但测验中各部分对总方差的贡献程度与预定的赋分比例有较大差距。其中,地理和政治的贡献度偏低,化学和历史的贡献度偏高。这表明有(历史和化学)偏科特点的考生得到了较高的综合分数。又经决策(D)研究发现,增加地理部分的题量会反常地降低测验的总体信度,这说明有不少高分考生答错或主动放弃了地理科题目。因此,如何有效控制各部分的实际贡献程度、避免负面导向是当前高考综合能力测试亟待解决的问题。 相似文献
15.
为了评价和改进硕士研究生入学考试一般能力测试的写作评分,研究者采用概化理论和多面Rasch分析对113位考生的写作样本的评分误差来源、评分信度等进行了探讨.概化理论研究显示,评分者和题目对评分准确性影响不大,以两道写作题的考试设计而言,评分者为2人即可保证评分信度在0.75以上.多面Rasch分析显示,评分者宽严度的估计值及其误差均在可接受的范围内,评分者之间在宽严度上不存在显著差异,且评分者自身在评分时总体上比较稳定.但个别评分者在特定考生特定题目上表现出特殊偏向.概化理论和多面Rasch分析丰富了写作评分研究的量化指标,证实了硕士研究生入学考试一般能力测试的写作评分具有较高的信度. 相似文献
16.
"青少年学生生活满意度量表"的概化理论研究 总被引:2,自引:0,他引:2
概化理论是用统计调整技术分析测量误差的一种测量理论,它侧重于从宏观方面讨论实测时的测量条件与结论推广应用范围之间的关系来探讨测量的外部效度问题。本文用概化理论对青少年学生生活满意度量表(CASLSS)进行了研究,得到以下研究结果:(1)对于生活满意度的维度数目,就我国青少年学生而言取6到8个维度较为合适,当对CASLSS取2个维度时,CASLSS只适合作常模参照性解释,而不适合作标准参照性解释;(2)CASLSS的各分量表和总量表的信度较高,且它不仅可以作常模参照性解释,还适合作标准参照性解释;(3)CASLSS的环境满意度因子相对其它五个因子而言,量表特性稍差,是今后改进该量表的主要方向。CASLSS无论是各个因子还是总量表均具有非常优良的量表特性,值得在实际的工作和研究中加以推广应用。 相似文献
17.
用多元概化理论 (MGT)研究了国家语委编制的普通话测验。在G研究中 ,利用香港人普通话测试的数据 ,估计了引起分数变异的各种来源的方差与协方差分量。在D研究中 ,首先估计了该测验 3个部分的全域分数和各自的概化系数等技术指标 ,然后估计了全域合成分数及其概化系数、信噪比等指标。结果表明 ,该测验的信度从总体上讲是较高的 ,把三个部分的全域分数进行合成也是合理的 ,但从细节上看其第 3部分的信度较低。另外 ,当评分者个数为 3、试题数量为 2 8时 ,测验的第 1、2部分的信度已经较高 ,因此 ,在实测时减少这两部分的题量并不会有太大问题 相似文献
18.
评价中心测评的评分误差分析研究 总被引:4,自引:0,他引:4
本研究应用概化理论对评价中心中的评分误差控制问题进行了系统的分析探讨,得出了以下研究结论:(1)总体上,在评价中心(以LGD为例)测评中,评价员对研究设计的测评维度的评分基本反映了被试的真实能力水平,测量误差较小;(2)评价员对合作能力、应变能力和总体印象等维度的评价标准的理解具有较高的一致性,但对决策能力等维度的评价标准的理解存在一定的偏差;(3)在评价中心(以LGD为例)测评中,采用4名评价员能达到预期的测量目标,符合测评应用的经济性、有效性原则。 相似文献
19.
Marise Ph. Born 《International Journal of Selection & Assessment》1994,2(1):45-52
The development is reported of an SR-inventory of achievement-related behaviour for the purpose of managerial selection. SR-inventories stem from interactional personality psychology. As the design of an SR-inventory is two-facetted, Cronbach et al.'s generalizability theory forms a suitable framework to investigate it. Using data of 404 Dutch respondents — mostly applicants — several generalizability analyses have been performed to conclude under which circumstances the inventory can be a useful tool. Furthermore, confirmatory factor analysis has been used to substantiate the suggested SR-structure of the instrument. The relationship with other personality factors has been investigated to classify the instrument in the domain of personality assessment. 相似文献