期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

燕良轼《心理科学》1999,22(2):132-135

文章对中国古代心理测验历史进行反思,认为中国古代心理测验是以知人观为其理论依据,渊远流长,内容丰富,既有类似于现代西方的小时空心理测验,也有西方至今尚未充分关注的大时空心理测验。文章还阐释了中国古代心理测验的几个具体特色;置测验于生活实际中;文化与超文化测验井存;测验与选拨、训练、教学、娱乐相结合;精于定性,疏于定量。相似文献

2.

音乐能力测验:结构拓展与分析方式的转换

刘源刘红云《心理科学进展》2012,20(8):1322-1328

从测验结构上,一般音乐能力测验包含基本认知能力、审美能力和创造能力测验.而现代音乐能力测验延伸到奏唱能力、表演交流能力和个体特质测验,从结构上对其进行拓展和完善.另一方面,从分析方式上,教育测验从总结性评价朝形成性评价方向发展.以美国国家评价与教育计划(NAEP)为例对测验项目进行属性层面的分析,证明了音乐能力认知诊断测验(CDA)的可能性.未来的研究应注意音乐能力测验结构的完整性和系统性,并将音乐能力认知诊断测验应用到实际当中. 相似文献

3.

当代客观化人格测验的技术—— 基于实验的行为评估:维也纳研究小组开发的多种计算机化测验介绍 总被引：1，自引：0，他引：1

Klaus D. Kubinger 《心理学报》2009,41(10):1024-1036

目前多数人格测验(特别是在中国使用的人格测验)基本上都是人格问卷, 基于实验的行为评估类客观化人格测验应用很少; 而后者近来在德语圈国家中则有复苏的迹象。因此, 本文综述了此类客观测验相对于人格问卷来说所具有的特点和优势, 如, 被试很难在这类客观化人格测验中作伪。本文介绍了维也纳研究小组所做的几个测验, 并讨论了这些测验的心理测量学性质和缺点。最后, 还列举了这些测验的实际应用。相似文献

4.

适应性测验的发展:历史与现状

张青华袁一萍张厚粲《心理学探新》2006,26(2):84-87

适应性测验作为一种测验形式,与传统的纸笔测验形式相比,具有省时、高效等很多优越性。测验应该适合于被试的理念最初可见于比内的智力测验。上世纪七十年代以来,适应性测验的研究从经典测量理论阶段发展到项目反应理论阶段,经历了从二阶段、三阶段、多阶段测验、固定分支测验和分层适应性测验的发展,到现在的计算机化适应性测验研究。随着项目反应理论和计算机技术的发展,计算机化适应性测验已经在教育和心理测验领域中得到广泛应用。目前对它的研究日益深入,主要有项目克隆、项目曝光、多维适应性测验、被试诊断、人格适应性测验等问题。相似文献

5.

中国的心理测量发展史

下载免费PDF全文

张厚粲余嘉元《心理科学》2012,35(3):514-521

有关心理测量的思想起源于中国古代。但西方科学的心理测验理论与方法是20世纪初自西方传人中国的。30年的发展取得很大成绩,但道路艰辛曲折,文章分三个阶段对之作了回顾。一、最早是1915年外国学者为比较中美儿童的智力差异对广州500名小学生进行测试。同一时期,我国学者也开始自己编制测验,"小学生毛笔书法量表"是最早的标准化教育测验。廖世承和陈鹤琴1920年在南京高等师范开设测验课程,出版《心理测验法》一书,正式介绍科学的心理测验。与美国专家合作编制多种测验,1923年与美国专家合作对全国小学生进行测试,得出了三至八年级学童的年龄与班级常模,引起了教育界的注意。艾伟从1925年起致力编制中小学不同年级和学科的测验以及能力测验,还与张耀翔编制了识字测验与阅读测验等,对我国教育测验的发展做出了很大贡献。"中国测验学会"1931成立。并创办会刊《测验》有效地推动了当时测验研究的开展.1937年"七七"事变后,工作继续进行和扩展,但受战争的影响,发展上减慢了速度。二、1949年新中国成立后,由于政治上的变迁,心理测验被视为禁区,认为它违心,反动,没有人敢于问津。文化大革命中,心理学被打成伪科学,心理测验更是全盘否定了。三.文革以后,心理学恢复。而心理测验面对着既缺人力又少资料的困难。林传鼎等三位教授于1980年春举办了第一个全国性心理测验培训班,是心理测验再生的标志。此后各高等院校逐步开设心理测量学课程。通过引进各种心理测量理论,修订外国测验和逐步向自编我国测验发展,几年中取得了良好效果。1984年中国心理学会下属的‘心理测量分会’成立,1990年加入国际测验委员会(ITC)成为它的一个国家会员。1991年在南京举办了国内第一个心理测验国际性学术会议,又与台湾学者交流,建立起隔年一次海峡两岸心理与教育测量学术研讨会的协议。这些都对中国心理测验的发展都起了积极作用。80年代后期国家实行改革开放,经济转型,心理测验逐渐渗入医学、教育、企业、和组织人事部门等多种应用领域,扩大了对社会的影响。教育是其最早也是最重要的应用领域。从高考开始向各种考试、应用领域广泛扩展,取得良好效果。尤其是在人力资源、心理咨询领域,心理测验发展迅速日益兴旺。社会各界从多方面加深了对心理测量的认同,使它变成为一个相当热门的应用科学了。最后,文章从测验的数量、质量,数据处理的方法技术,测验者素质提高和法律完备等几个方面分析了存在问题并提出对今后的展望。相似文献

6.

测验模式效应：来源、检测与应用

陈平代艺黄颖诗《心理科学进展》2023,(10):1966-1980

测验模式效应(Test Mode Effect, TME)是指同一测验采用不同测验形式施测而产生的测验功能差异。TME的存在会对测验公平、选拔标准和测验等值等产生影响,因此对TME进行准确检测和合理解释具有重要意义。通过对TME的来源、检测(包括实验设计和检测方法)以及研究结果进行系统梳理,全面展示TME研究的方法论。对TME模型进行进一步解释、对TME研究中的测验形式进行拓展以及将TME的研究成果应用于我国的大规模教育测评项目,都是TME领域的未来重要发展方向。相似文献

7.

标准参照测验分数体系的探讨研究

甘良梅余嘉元《心理学探新》2006,26(3):79-83

随着考试事业的发展,标准参照测验（Criterion Referenced Test,CRT）也越来越多地受到人们的关注,但是它却陷入了用常模参照测验的方法来解释和报告分数的误区。该文从国内外重大标准参照测验CET-4＆CET-6、HSK、GRE、CLEP等分数体系入手,通过对其分数体系的共同点分析,探讨出适合于标准参照测验的分数体系,最后指出目前一些测验的分数体系仍然存在的问题。相似文献

8.

军用能力倾向测验的产生、发展和贡献

王进礼龚耀先《心理与行为研究》2005,3(2):156-159

军用能力倾向测验是为军事需要服务的能力倾向测验,它有独立的产生和发展过程并在整个能力倾向测验领域起关键作用。在特殊能力倾向的效度研究,能力理论的验证,发现新的能力和测验手段上的创新等方面均有重要贡献。相似文献

9.

资格认证测验的信度估计及其特征分析

赵世明《心理学探新》2006,26(3):84-87

资格认证测验属于典型的标准参照测验,在国内已得到普遍应用,但在报告心理测量学指标时很少提到标准参照模式的信度估计指标。该文归纳了标准参照测验信度估计的指标体系,分析讨论了适用于资格认证测验的信度估计及其与测验长度、分界标准分布、样本同质性的关系与特征。相似文献

10.

计算机化多阶段自适应测验研究述评

王钰彤罗照盛王睿《心理科学》2015,(2):452-456

摘要计算机化多阶段自适应测验是基于计算机技术的测验形式,它将题目集合作为测试单元,通过多阶段自适应的形式对被试进行测试和评分。近年来通过研究各种测验形式,发现其比计算机化自适应测验和传统纸笔测验突显出更大优势。与传统纸笔测验相比,其具有参数不变性、能力估计更精确等优势。与计算机化自适应测验相比,其具有可控制题目特性、被试可检查题目等优势。如何减小测量误差,使其应用更加便捷、有效,是未来研究的发展方向。相似文献

11.

投射测验体系中的树木意象

蔡頠汤永隆吴嵩陈真真《心理科学进展》2012,20(5):782-790

树木是绘画测验中常用的意象之一, 其主要的分析体系为房树人测试与树木测试, 二者对树木的操作过程和分析方法存在差异。树木意象的测试具有一定的信效度, 可以有效地反应个体的心理状态, 敏锐地体现出个体与当前环境的交互作用, 检测病理性创伤反应, 鉴别特殊群体。未来研究可考虑测试的文化特异性, 进一步检验树木–伤疤–创伤理论并完善其在灾难心理领域的应用, 也期待研究者改进测试程序并继续对其进行标准化。相似文献

12.

考试自我效能感是考试焦虑影响考试成绩的中介变量 总被引：23，自引：2，他引：21

田宝郭德俊《心理科学》2004,27(2):340-343

本文采用结构方程的统计分析技术．依据Baron(1986)提出的确定中介变量的规则和标准．对265名中学生的特质考试焦虑、考试自我效能感、数学期末考试成绩的关系进行了探讨。考试焦虑,考试自我效能感和数学考试成绩是三个潜变量。结果表明,考试焦虑通过考试自我效能感这一中介变量对考试成绩产生影响,考试自我效能感对考试成绩有直接的影响作用,是考试焦虑影响考试成绩的中介变量。相似文献

13.

Carol Eckerly 《应用心理检测》2021,45(5):299

Answer similarity indices were developed to detect pairs of test takers who may have worked together on an exam or instances in which one test taker copied from another. For any pair of test takers, an answer similarity index can be used to estimate the probability that the pair would exhibit the observed response similarity or a greater degree of similarity under the assumption that the test takers worked independently. To identify groups of test takers with unusually similar response patterns, Wollack and Maynes suggested conducting cluster analysis using probabilities obtained from an answer similarity index as measures of distance. However, interpretation of results at the cluster level can be challenging because the method is sensitive to the choice of clustering procedure and only enables probabilistic statements about pairwise relationships. This article addresses these challenges by presenting a statistical test that can be applied to clusters of examinees rather than pairs. The method is illustrated with both simulated and real data. 相似文献

14.

樟柳碱所致学习和记忆障碍动物模型的探讨 总被引：2，自引：0，他引：2

管林初崔秋耕《心理学报》1992,25(1):75-81

本实验采用水迷津法、步下法和步入法,用樟柳碱制备学习和记忆障碍的动物模型。结果表明,樟柳碱(10毫克/公斤)可使小鼠引起学习障碍,其表现为通过水迷津全程的时间延长,而且小鼠进入盲路的错误次数明显增多。樟柳碱(10毫克/公斤)可使小鼠引起记忆障碍,在樟柳碱的影响下,小鼠步下平台或步入暗箱的潜伏期明显缩短,并使它们的错误次数增多。本实验结果进一步表明,测定小鼠的记忆障碍,步入法似乎比步下法更为敏感。相似文献

15.

斯-欧非言语智力测验评介

徐建平张厚粲杜艳婷 P.J.Tellegen 《心理科学》2012,35(4):984-987

斯-欧非言语智力测验1943年由荷兰女学者Snijders-Oomen编制,经多次修订后出现多个版本,目前应用最广、最新和最具代表性的是SON-R 5.5-17和SON-R 6-40两个版本。前者包含归类、拼板、隐蔽图形、连线、情境、类比和故事七个分测验,考查5.5岁到17岁人群的抽象推理、具体推理、空间、知觉四种能力。后者选取了类比、拼板、归类和连线四个分测验组成,测查6岁到40岁人群的智力。研究表明,该测验内部一致性信度、概化系数和效度均达到了心理测量学质量要求。该测验有言语指导和非言语指导两套指导语,施测使用了适应性程序,并给被试提供反馈,具有认知诊断功能,适用于测量正常和特殊群体的智力,也可用于研究文化因素对智力的影响和智力测验的公平性等问题。相似文献

16.

小学四年级数学诊断性测验的编制与研究 总被引：1，自引：0，他引：1

刘经兰戴海琦《心理学探新》2003,23(3):57-59,62

诊断性测验是诊断性评价的工具。本研究以教育测量与评价的基本原理为指导,按照诊断性测验编制的方法和步骤,在详细制定了小学四年级数学教学目标体系的基础上编制出《小学四年级数学诊断性测验》并获取了该测验的信度和效度证据。本研究对中小学各科诊断性测验的编制具有普遍的指导意义,所编测验对于诊断学生学习困难、弥补教学不足有实际应用价值。相似文献

17.

Rohling's Interpretive Method and Inherent Limitations on the Flexibility of “Flexible Batteries”

Palmer BW Appelbaum MI Heaton RK 《Neuropsychology review》2004,14(3):171-176

Miller and Rohling (2001) proposed a 24-step algorithm, the Rohling Interpretive Method (RIM), for quantitative interpretation of results from flexible neuropsychological test batteries. We believe that the RIM as presented in that paper has several conceptual problems, including (a) a failure to distinguish "statistically significant" from pathological differences, (b) an assumption that declines in specific abilities can be inferred when a particular test score deviates from an estimate of general premorbid ability, and (c) confusion between the standard deviation associated with individual test scores versus that of a composite of those scores. As an alternative, we suggest the value of developing and using co-normed comprehensive neuropsychological test batteries from which test users might select subsets of tests. 相似文献

18.

不同定义平行测验等值的群体不变性 总被引：1，自引：0，他引：1

刘铁川戴海琦赵玉《心理学探新》2012,(1):67-71

群体不变性是等值的一个重要假设,即对不同的考生子群体等值函数一致。本研究对不同平行测验定义下线性等值的群体不变性进行了理论分析和模拟研究,模拟研究REMSD指标通过六种不同加权方式计算。结果显示,严格平行测验在信度较低时REMSD指标更大;子群体均值差异和信度差异对REMSD的影响存在明显的交互作用;REMSD指标在期望权重等权下的最大,在分数权重采用子群体比例加权最小。最后对结果进行了讨论,对REMSD权重使用及进一步研究给出了建议。相似文献

19.

The greatest lower bound to the reliability of a test and the hypothesis of unidimensionality

Jos?M.?F.?Ten?Berge Email author Gregor?So?an 《Psychometrika》2004,69(4):613-625

To assess the reliability of congeneric tests, specifically designed reliability measures have been proposed. This paper emphasizes that such measures rely on a unidimensionality hypothesis, which can neither be confirmed nor rejected when there are only three test parts, and will invariably be rejected when there are more than three test parts. Jackson and Agunwamba's (1977) greatest lower bound to reliability is proposed instead. Although this bound has a reputation for overestimating the population value when the sample size is small, this is no reason to prefer the unidimensionality-based reliability. Firstly, the sampling bias problem of the glb does not play a role when the number of test parts is small, as is often the case with congeneric measures. Secondly, glb and unidimensionality based reliability are often equal when there are three test parts, and when there are more test parts, their numerical values are still very similar. To the extent that the bias problem of the greatest lower bound does play a role, unidimensionality-based reliability is equally affected. Although unidimensionality and reliability are often thought of as unrelated, this paper shows that, from at least two perspectives, they act as antagonistic concepts. A measure, based on the same framework that led to the greatest lower bound, is discussed for assessing how close is a set of variables to unidimensionality. It is the percentage of common variance that can be explained by a single factor. An empirical example is given to demonstrate the main points of the paper. The authors are obliged to Henk Kiers for commenting on a previous version. Gregor Sočan is now at the University of Ljubljana. 相似文献

20.

Checking the Assumptions of Rasch's Model for Speed Tests

M.?G.?H.?Jansen Email author C.?A.?W.?Glas 《Psychometrika》2005,70(4):671-684

Two new tests for a model for the response times on pure speed tests by Rasch (1960) are proposed. The model is based on the assumption that the test response times are approximately gamma distributed, with known index parameters and unknown rate parameters. The rate parameters are decomposed in a subject ability parameter and a test difficulty parameter. By treating the ability as a gamma distributed random variable, maximum marginal likelihood (MML) estimators for the test difficulty parameters and the parameters of the ability distribution are easily derived. Also the model tests proposed here pertain to the framework of MML. Two tests or modification indices are proposed. The first one is focused on the assumption of local stochastic independence, the second one on the assumption of the test characteristic functions. The tests are based on Lagrange multiplier statistics, and can therefore be computed using the parameter estimates under the null model. Therefore, model violations for all items and pairs of items can be assessed as a by-product of one single estimation run. Power studies and applications to real data are included as numerical examples. 相似文献