共查询到20条相似文献,搜索用时 0 毫秒
1.
概化理论在绩效评估中的应用 总被引:1,自引:0,他引:1
概化理论借助其理论上的优势在很大程度上克服了基于经典测量理论绩效评估存在的缺陷。它可以对绩效评估中的信度进行更全面的估计,更好地预测和控制误差,并且概化理论的独特视角和方法还为360度绩效评估的效度求取提供了理论支持。 相似文献
2.
3.
表现性评价中评分者信度估计方法的比较研究--从相关法、百分比法到概化理论 总被引:12,自引:0,他引:12
随着素质教育的推进.表现性评价受到越来越多的重视。影响表现性评价结果信度的一个重要因素是评分者之间的不一致。文章使用模拟数据,在对比评分者一致性的相关法、一致性百分比法和概化系数等各种估计方法的基础上,提出概化理论在表现性评价中评分者信度问题上的应用是理论和实践发展的有益方向。 相似文献
4.
5.
用多元概化理论考察大学生网络成瘾量表在大学生群体中应用的测量学性能。以随机测量模式的概化设计,针对1200名在校大学生进行问卷调查。结果显示双因子结构的相关程度在0.92以上,五因子结构的相关程度均在0.76~0.97间;整体量表的概化系数和可靠性指数均达到了0.94以上,而双因子结构各因子在0.90左右,五因子结构各因子均在0.74~0.85间。所以,整体量表及各因子在大学生群体中应用的信效度较高,可用作常模和标准参照测验;无论双因子还是五因子结构,CIAS-R各因子在分值比和项目数上,设计非常合理和完善。 相似文献
6.
心理学实验首先必须保证结果的有效性和可靠性。实验素材容量是影响实验结果的关键因素之一。本文的目的是通过运用多元概化理论分析几个典型认知行为实验的素材容量对实验结果精度的影响, 从而探讨最佳的实验素材容量的确定问题。研究结果发现, 在IAT测验上, 相容与不相容任务的素材容量为50时最佳, 可靠性指数为0.92; 在图-词干扰范式中, 素材容量以48时为最佳, 可靠性指数为0.95; 对线索提示范式, 50%有效提示中, 有效与无效提示最佳素材容量为35, 可靠性指数是0.97。研究表明, 多元概化理论可以很好地用于确定认知行为实验中素材的最佳容量。 相似文献
7.
8.
9.
10.
摘 要 本研究使用多元概化理论分析2007-2010年心理学专业基础综合考试。结果表明:1.从考查的学科内容看,心理统计与测量、普通心理学的测量精度较高,而发展与教育心理学、实验心理学的测量精度偏低;2.从设置的题型看,多选题的测量精度偏低,其他题型的测量精度较高;减少单选题数量、增加多选题数量可在保障全卷测量精度的基础上大幅提高多选题的测量精度;3.全卷测量精度很高,不同年度的试卷在学科内容和题型结构上可看成是“平行”试卷。 相似文献
11.
使用“高校教师教学水平评价问卷”,要求566名学生对19名教师进行评价,对收集到的数据作不同的概化设计,包括t×i、(s:t)×i、(s:t)×(i:v)和(s:t)×(i:v)×o四种设计。基于概化理论,结合预算限制,统一LaGrange乘法公式,自行推导不同设计的最佳样本量公式,联合估计的方差分量,计算出不同设计的最佳样本量。结果表明:(1)LaGrange乘法统一公式表现出较强的通用性,能够适用于预算限制下各种概化设计;(2)评价场合是影响高校教师教学水平评价一个相当重要的因素;(3)(s:t)×(i:v)×o是高校教师教学水平评价概化理论预算限制下最优概化设计;(4)高校教师教学水平评价概化理论预算限制下,每位教师最佳评价学生人数为20人,每个维度最佳评价题目数为3题。 相似文献
12.
A two-facet measurement model with broad application in the behavioral sciences is identified, and its coefficient of generalizability (CG) is examined. A normalizing transformation is proposed, and an asymptotic variance expression is derived. Three other multifaceted measurement models and CGs are identified, and variance expressions are presented. Next, an empirical investigation of the procedures follows, and it is shown that, in most cases, Type I error control in inferential applications is precise, and that the estimates are relatively efficient compared with the correlation coefficient. Implications for further research and for practice are noted. In an Appendix, four additional models, CGs, and variance expressions are presented.The research reported herein formed part of a doctoral dissertation conducted by Marsha Schroeder (Schroeder, 1986), under the direction of Ralph Hakstian, at the University of British Columbia. We acknowledge with thanks the contributions to this research of Todd Rogers and James Steiger. We are also very indebted to an mous reviewer who provided some important clarifications in connection with two of the models considered. Some support for this research was provided by a grant to Ralph Hakstian from the Natural Sciences and Engineering Research Council of Canada. 相似文献
13.
14.
该研究应用GT和多面Rasch模型对结构化面试数据进行分析,并提出一些建议针对某辅导员招聘面试数据,运用GT从宏观上分析应聘者、考官和项目所带来的总体误差大小,在此基础上,运用多面Rasch模型从微观上进一步探查考官严厉度、应聘者能力差异、项目难易度及侧面偏差.结果表明:1)GT分析表明应聘者产生的变异较大(90.65%),说明面试可靠性较高,且当考官数为2时可靠性已较好.2)多面Rasch模型分析出了各侧面效应中的非拟合因素及交互效应中的偏差因素,表明面试误差主要来自考官间严厉度的差异及其自身一致性的不稳定。将GT与多面Rasch模型相结合分析面试数据不仅能测查出评价过程各方面的问题因素,并能更好地作整体把握。 相似文献
15.
16.
Bootstrap方法是一种有放回的再抽样方法, 可用于概化理论的方差分量及其变异量估计。用Monte Carlo技术模拟四种分布数据, 分别是正态分布、二项分布、多项分布和偏态分布数据。基于p×i设计, 探讨校正的Bootstrap方法相对于未校正的Bootstrap方法, 是否改善了概化理论估计四种模拟分布数据的方差分量及其变异量。结果表明:跨越四种分布数据, 从整体到局部, 不论是“点估计”还是“变异量”估计, 校正的Bootstrap方法都要优于未校正的Bootstrap方法, 校正的Bootstrap方法改善了概化理论方差分量及其变异量估计。 相似文献
17.
对文件筐测验(I-B)在选拔高层经理人员中的实证研究 总被引:5,自引:0,他引:5
以中国联通辽宁省分公司地市级副总经理选拔中收集到的数据,通过尝试采用文件筐测验的新型计分技术,分析研究了文件筐测验的信度和敛度。结果表明,新型计分技术可以有效改进传统计分技术的一些缺点,体现了文件筐测验未来的计分发展方向;新型计分技术基础上的评分一致性信度较高;在与由笔试、结构化面试和无领导小组讨论综合确定的选拔结果的比较中,文件筐测验获得了较高的同时效度。同时.研究也对文件筐测验结构效度方面存在的问题进行了分析,并对文件筐测验的进一步研究提出了建议。 相似文献
18.
19.
Kasper Højbjerg Christensen 《International Journal of Philosophical Studies》2016,24(4):508-517
In The Myth of Morality Richard Joyce presents a simple and very influential argument for the truth of moral error theory. In this paper I point out that (i) the argument does not have the form Joyce attributes to it, (ii) the argument is not valid in an extensional propositional logic and (iii) on the most natural way of explicating the meanings of the involved terms, it remains invalid. I conclude that more explanation is needed if we are to accept this particular argument for moral error theory. 相似文献
20.
Tetsuya Kawamoto 《The Japanese psychological research》2015,57(3):254-267
The purpose of this study was to validate the 20‐item Mini‐K scale, which is the short form of the Arizona Life History Battery, as translated into Japanese. Two samples of Japanese adults (N = 2000; 50.0% men; Mage = 40.9 for the first survey; N = 400; 50.0% men; Mage = 42.2 for the second survey) completed a web‐based questionnaire, including the Japanese translation of the Mini‐K. The results showed that the psychometric properties of the Japanese Mini‐K scale were comparable to those of the original English version. The scale had good reliability based on Cronbach's α and McDonald's ω. Convergent validity was demonstrated by the correlation between the Mini‐K scores and life history indicators. In addition, the Mini‐K score was related to both personality and psychosomatic health. The translated scale provides a valid and reliable instrument in Japanese that measures human life‐history strategy. 相似文献