首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
概化理论在绩效评估中的应用   总被引:1,自引:0,他引:1  
秦磊  袁登华 《心理科学》2005,28(3):650-651
概化理论借助其理论上的优势在很大程度上克服了基于经典测量理论绩效评估存在的缺陷。它可以对绩效评估中的信度进行更全面的估计,更好地预测和控制误差,并且概化理论的独特视角和方法还为360度绩效评估的效度求取提供了理论支持。  相似文献   

2.
运用多元概化理论对两届临床医学硕士研究生内科临床实践能力考核进行评价比较。结果表明,两届研究生内科临床实践能力考核的信度均较高,可靠性指数分别为0.78878、0.67985,考核内容较全面。比较发现,01级学生考核的信度要高于02级,考核专家以3-5位为宜。  相似文献   

3.
孙晓敏  张厚粲 《心理科学》2005,28(3):646-649
随着素质教育的推进.表现性评价受到越来越多的重视。影响表现性评价结果信度的一个重要因素是评分者之间的不一致。文章使用模拟数据,在对比评分者一致性的相关法、一致性百分比法和概化系数等各种估计方法的基础上,提出概化理论在表现性评价中评分者信度问题上的应用是理论和实践发展的有益方向。  相似文献   

4.
概化理论是现代心理与教育测量理论之一,可应用在各种人事测评中,如表现性评价、多源评估、心理测验、结构化面试、水平测试、工作分析、评价中心等.与经典测量理论相比,概化理论应用于人事测评,表现出较强的优势,能够同时考察多种因素、确定多个维度权重等,其应用对象主要包括两大类,即企业和机构.概化理论应用于人事测评,存在应用领域、样本数据、测评效度和微观分析等问题.  相似文献   

5.
用多元概化理论考察大学生网络成瘾量表在大学生群体中应用的测量学性能。以随机测量模式的概化设计,针对1200名在校大学生进行问卷调查。结果显示双因子结构的相关程度在0.92以上,五因子结构的相关程度均在0.76~0.97间;整体量表的概化系数和可靠性指数均达到了0.94以上,而双因子结构各因子在0.90左右,五因子结构各因子均在0.74~0.85间。所以,整体量表及各因子在大学生群体中应用的信效度较高,可用作常模和标准参照测验;无论双因子还是五因子结构,CIAS-R各因子在分值比和项目数上,设计非常合理和完善。  相似文献   

6.
罗照盛  郭小军 《心理学报》2014,46(6):876-884
心理学实验首先必须保证结果的有效性和可靠性。实验素材容量是影响实验结果的关键因素之一。本文的目的是通过运用多元概化理论分析几个典型认知行为实验的素材容量对实验结果精度的影响, 从而探讨最佳的实验素材容量的确定问题。研究结果发现, 在IAT测验上, 相容与不相容任务的素材容量为50时最佳, 可靠性指数为0.92; 在图-词干扰范式中, 素材容量以48时为最佳, 可靠性指数为0.95; 对线索提示范式, 50%有效提示中, 有效与无效提示最佳素材容量为35, 可靠性指数是0.97。研究表明, 多元概化理论可以很好地用于确定认知行为实验中素材的最佳容量。  相似文献   

7.
探讨高校教师教学水平评价多元概化理论合成信度的权重效应。使用"高校教师教学水平评价问卷",要求534名学生对16名教师进行评价,对收集到的数据作嵌套设计的多元概化理论分析。结果表明:(1)在高校教师教学水平评价中,多元概化理论合成信度估计权重、先验权重和效果权重产生不同效应;(2)结合高校教师教学水平评价,在充分分析三种权重对合成信度影响的基础上,提出了多元概化理论"合成信度三种权重效应分析模式图",能为正确使用多元概化理论权重提供科学参考。  相似文献   

8.
运用多元概化理论考察青少年学习倦怠量表(ASBI)的测量学属性。结果发现,ASBI各因子以及全量表的概化系数和可靠性指数均达到较好水平,既可用于常模参照测验,也可用于标准参照测验;各因子的分量比例还不尽完善,低成就感对全域总分的贡献略低于在全量表中的分值比重,对相对误差方差贡献最大的是低成就感,学业疏离对绝对误差方差的贡献最大;今后ASBI的修订工作,可考虑对学业疏离和低成就感因子条目质量的改进,同时适当增加身心耗竭因子的条目数以提高其测量信度。  相似文献   

9.
概化理论(GT)与经典测验理论(CTT)是随机测量模型下信度评量的重要理论来源。本文将重复测量作为理解概化理论产生与建构的切入点,剖析了GT在测验假设、全域分思想与误差观三方面的特点,提出了目前GT在理论与应用方面存在的若干问题与不足。  相似文献   

10.
关丹丹  王博  车宏生 《心理科学》2011,34(4):950-956
摘 要 本研究使用多元概化理论分析2007-2010年心理学专业基础综合考试。结果表明:1.从考查的学科内容看,心理统计与测量、普通心理学的测量精度较高,而发展与教育心理学、实验心理学的测量精度偏低;2.从设置的题型看,多选题的测量精度偏低,其他题型的测量精度较高;减少单选题数量、增加多选题数量可在保障全卷测量精度的基础上大幅提高多选题的测量精度;3.全卷测量精度很高,不同年度的试卷在学科内容和题型结构上可看成是“平行”试卷。  相似文献   

11.
使用“高校教师教学水平评价问卷”,要求566名学生对19名教师进行评价,对收集到的数据作不同的概化设计,包括t×i、(st)×i、(st)×(iv)和(st)×(iv)×o四种设计。基于概化理论,结合预算限制,统一LaGrange乘法公式,自行推导不同设计的最佳样本量公式,联合估计的方差分量,计算出不同设计的最佳样本量。结果表明:(1)LaGrange乘法统一公式表现出较强的通用性,能够适用于预算限制下各种概化设计;(2)评价场合是影响高校教师教学水平评价一个相当重要的因素;(3)(st)×(iv)×o是高校教师教学水平评价概化理论预算限制下最优概化设计;(4)高校教师教学水平评价概化理论预算限制下,每位教师最佳评价学生人数为20人,每个维度最佳评价题目数为3题。  相似文献   

12.
A two-facet measurement model with broad application in the behavioral sciences is identified, and its coefficient of generalizability (CG) is examined. A normalizing transformation is proposed, and an asymptotic variance expression is derived. Three other multifaceted measurement models and CGs are identified, and variance expressions are presented. Next, an empirical investigation of the procedures follows, and it is shown that, in most cases, Type I error control in inferential applications is precise, and that the estimates are relatively efficient compared with the correlation coefficient. Implications for further research and for practice are noted. In an Appendix, four additional models, CGs, and variance expressions are presented.The research reported herein formed part of a doctoral dissertation conducted by Marsha Schroeder (Schroeder, 1986), under the direction of Ralph Hakstian, at the University of British Columbia. We acknowledge with thanks the contributions to this research of Todd Rogers and James Steiger. We are also very indebted to an mous reviewer who provided some important clarifications in connection with two of the models considered. Some support for this research was provided by a grant to Ralph Hakstian from the Natural Sciences and Engineering Research Council of Canada.  相似文献   

13.
使用多元概化理论对由7名评委和34名考生组成的结构化面试数据进行了分析.结果表明:1.面试设置的5个维度中,仪表举止维度与其它4个维度之间的协方差相对较小;2.各个维度的概化系数都在0.69以上,其中,概化系数最小的是仪表举止维度,最大的是口语表达维度;3.通过增加评委人数可以提高面试信度,但增幅递减.  相似文献   

14.
该研究应用GT和多面Rasch模型对结构化面试数据进行分析,并提出一些建议针对某辅导员招聘面试数据,运用GT从宏观上分析应聘者、考官和项目所带来的总体误差大小,在此基础上,运用多面Rasch模型从微观上进一步探查考官严厉度、应聘者能力差异、项目难易度及侧面偏差.结果表明:1)GT分析表明应聘者产生的变异较大(90.65%),说明面试可靠性较高,且当考官数为2时可靠性已较好.2)多面Rasch模型分析出了各侧面效应中的非拟合因素及交互效应中的偏差因素,表明面试误差主要来自考官间严厉度的差异及其自身一致性的不稳定。将GT与多面Rasch模型相结合分析面试数据不仅能测查出评价过程各方面的问题因素,并能更好地作整体把握。  相似文献   

15.
The attack of the psychometricians   总被引:2,自引:0,他引:2  
  相似文献   

16.
黎光明  张敏强 《心理学报》2013,45(1):114-124
Bootstrap方法是一种有放回的再抽样方法, 可用于概化理论的方差分量及其变异量估计。用Monte Carlo技术模拟四种分布数据, 分别是正态分布、二项分布、多项分布和偏态分布数据。基于p×i设计, 探讨校正的Bootstrap方法相对于未校正的Bootstrap方法, 是否改善了概化理论估计四种模拟分布数据的方差分量及其变异量。结果表明:跨越四种分布数据, 从整体到局部, 不论是“点估计”还是“变异量”估计, 校正的Bootstrap方法都要优于未校正的Bootstrap方法, 校正的Bootstrap方法改善了概化理论方差分量及其变异量估计。  相似文献   

17.
对文件筐测验(I-B)在选拔高层经理人员中的实证研究   总被引:5,自引:0,他引:5  
徐晓锋  车宏生 《心理科学》2004,27(5):1230-1232
以中国联通辽宁省分公司地市级副总经理选拔中收集到的数据,通过尝试采用文件筐测验的新型计分技术,分析研究了文件筐测验的信度和敛度。结果表明,新型计分技术可以有效改进传统计分技术的一些缺点,体现了文件筐测验未来的计分发展方向;新型计分技术基础上的评分一致性信度较高;在与由笔试、结构化面试和无领导小组讨论综合确定的选拔结果的比较中,文件筐测验获得了较高的同时效度。同时.研究也对文件筐测验结构效度方面存在的问题进行了分析,并对文件筐测验的进一步研究提出了建议。  相似文献   

18.
19.
In The Myth of Morality Richard Joyce presents a simple and very influential argument for the truth of moral error theory. In this paper I point out that (i) the argument does not have the form Joyce attributes to it, (ii) the argument is not valid in an extensional propositional logic and (iii) on the most natural way of explicating the meanings of the involved terms, it remains invalid. I conclude that more explanation is needed if we are to accept this particular argument for moral error theory.  相似文献   

20.
The purpose of this study was to validate the 20‐item Mini‐K scale, which is the short form of the Arizona Life History Battery, as translated into Japanese. Two samples of Japanese adults (N = 2000; 50.0% men; Mage = 40.9 for the first survey; N = 400; 50.0% men; Mage = 42.2 for the second survey) completed a web‐based questionnaire, including the Japanese translation of the Mini‐K. The results showed that the psychometric properties of the Japanese Mini‐K scale were comparable to those of the original English version. The scale had good reliability based on Cronbach's α and McDonald's ω. Convergent validity was demonstrated by the correlation between the Mini‐K scores and life history indicators. In addition, the Mini‐K score was related to both personality and psychosomatic health. The translated scale provides a valid and reliable instrument in Japanese that measures human life‐history strategy.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号