排序方式: 共有81条查询结果,搜索用时 15 毫秒
31.
采用2(组内变量:量尺大小(25分和9分))×2(组间变量:评分方法(相对和绝对))的混合实验设计探讨评分量表对115名大学生新手评委评分准确性的影响。对于评分准确性,采用Cronbach1955年提出的四个指标,Elevation(EL)、Differential elevation(DE)、Stereotype accuracy(SA)、Differential Accuracy(DA)。结果发现,评分方法只在SA上主效应显著,量尺大小在只在DA上主效应边缘显著,评分方法和量尺大小在DE、SA和DA三个指标上均有交互作用。总体上看,在结构化面试评分中,对于评分准确性,相对评分量表优于绝对评分量表,小量尺量表优于大量尺量表。 相似文献
32.
包含评分者侧面的测验通常不符合任意一种概化理论设计,因此从概化理论的角度来看这类测验下的数据应属于缺失数据,而决定缺失结构的就是测验的评分方案。用R软件模拟出三种评分方案下的数据,并比较传统法、评价法和拆分法在各评分方案下的估计效果,结果表明:(1)传统法估计准确性较差;(2)评分者一致性较高时,适宜用评价法进行估计;(3)拆分法的估计结果最准确,仅在固定评分者评分方案下需注意评分者与考生数量之比,该比值小于等于0.0047 时估计结果较为准确。 相似文献
33.
从测验和被试两个层面探讨了属性数目、属性层级关系、被试知识状态分布、属性层级误设和Q矩阵误设等因素对GRCDM的影响, 以进一步考察GRCDM的特性。研究发现:(1)GRCDM对属性数目无依赖, 随属性数目的增多判准率反而增高; (2)被试知识状态分布对GRCDM判准率高低无影响; (3)属性层级误设对GRCDM的影响与属性层级类型有关, 当属性层级为无结构型和发散型时, “属性层级关系错乱”的判准率降幅最大; (4)Q矩阵误设对GRCDM的影响因层级关系而异, 收敛型和发散型受影响较小, 无结构型和线型的判准率在属性既冗余又缺失时降幅最大。 相似文献
34.
变革型领导风格的实证研究 总被引:18,自引:0,他引:18
以72家企业的193名管理者为被试,通过多来源评估法收集数据,采用因素分析、信度分析和回归分析等方法对变革型领导的理论结构及其与领导有效性的关系进行了深入研究。结果表明,变革型领导具有二阶单因素结构。即四个独立子因素为领导魅力、感召力、智力激发和个性化关怀,这些子因素归属于一个单一二阶因素;研究所使用的《变革型领导问卷》具有良好的构想效度和信度,适用于中国文化;变革型领导及其子维度对领导有效性有一定的预测力。 相似文献
35.
分部评分模型与其它几种多级模型的比较 总被引:1,自引:0,他引:1
项目反应理论(IRT)是当前教育与心理测量领域的一个重大进展,也日益成为当今测验领域的一个热点。本文对IRT理论中的二个重要评分模型PCM与GPCM作了简要的介绍。并较详细地对PCM与GPCM模型的逻辑结构及其适用范围进行了论述,指出了它们与其它几种重要模型之间的关系及不同之处。 相似文献
36.
评分者的信度分析,已从经典测量理论的方法(Kendall和谐系数)发展为基于现代测量理论(如GT)的方法,但由于GT中方差分量估计的工具和途径有限,使该方法的推广受到限制。本文介绍了结构方程建模(SEM)估计GT中方差分量的必要性及原理,并通过对某省直国家机关公务员录用考试结构化面试的评分者信度分析,阐述用SEM估计概化理论中不同设计下的评分者信度研究。 相似文献
37.
多分属性认知诊断模型(CDMs)比传统的二分属性CDMs提供更详细的诊断反馈信息,但现有大部分多分属性CDMs并不具备直接分析多级(或混合)评分数据的功能。本文基于等级反应模型对重参数化多分属性DINA模型进行多级评分拓广,开发一个可处理多级评分数据的等级反应多分属性DINA模型。首先通过实证数据分析呈现新模型的现实可应用性;然后通过模拟研究探究新模型的参数估计返真性。结果表明,新模型满足同时处理多分属性和多级评分数据的现实需求;且具备良好的心理计量学性能,但对测验质量有一定要求(如题目质量较高且测验Qp矩阵具有完备性等)。 相似文献
38.
结构化面试中的评分一致性问题初探 总被引:7,自引:1,他引:6
面试由于其直观、灵活的方式及良好的效度而被广泛应用于各类组织机构的人员招聘与录用中。但在多个评分员对一个应试者的面试中 ,评分员间的评分一致性问题是一个关键问题。本文以中央国家机关某部二组评分员对应试者的评分为研究对象 ,对国家公务员录用考试结构化面试中的评分员评分一致性问题进行了初步的探讨与分析。得到的结论如下 :1 .从总体上看 ,两组评分员的成员间在对应聘同一职位的不同应试者的评分在评分标准上是基本一致的 ;2 .不同的评分维度 (测评要素 )对评分员的评分一致性有不同的影响 ;3 .应试者在面试时的表现也会影响评分员的评分一致性 ;4.评分员有关面试的知识和经验水平对评分一致性也有重要的影响。 相似文献
39.
评分者的信度分析 ,已从经典测量理论的方法 (Kendall和谐系数 )发展为基于现代测量理论 (如GT)的方法 ,但由于GT中方差分量估计的工具和途径有限 ,使该方法的推广受到限制。本文介绍了结构方程建模 (SEM )估计GT中方差分量的必要性及原理 ,并通过对某省直国家机关公务员录用考试结构化面试的评分者信度分析 ,阐述用SEM估计概化理论中不同设计下的评分者信度研究 相似文献
40.
孙士杰 《医学与哲学(人文社会医学版)》2010,31(10):53-55
Grave's病(GD)是导致儿童甲亢最常见的病因,其易感性80%决定于基因因素.ATD治疗是最常推荐的初始治疗手段,但长期缓解率仅为30%.ATD诱导儿童GD缓解的合适用药时间尚不明确.最佳治疗方式(ATD、RAI或手术)的选择还存在重大争议.药物治疗复发的预测非常重要,最近建立了一种复发风险评分,通过种族、年龄、诊断时FT4、TRAb水平、ATD预期治疗持续时间将GD儿童分成低中高三类风险人群,对其复发风险作出评估,对于确定GD儿童在初始治疗时选择何种方案更为适合意义重大. 相似文献