新课件-心理测量学.ppt

上传人:本田雅阁 文档编号:2196668 上传时间:2019-03-02 格式:PPT 页数:261 大小:3.47MB
返回 下载 相关 举报
新课件-心理测量学.ppt_第1页
第1页 / 共261页
新课件-心理测量学.ppt_第2页
第2页 / 共261页
新课件-心理测量学.ppt_第3页
第3页 / 共261页
亲,该文档总共261页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《新课件-心理测量学.ppt》由会员分享,可在线阅读,更多相关《新课件-心理测量学.ppt(261页珍藏版)》请在三一文库上搜索。

1、心理咨询师考试 心理测量学知识,张春雨() 西南大学心理学院,主要内容,第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用,第一节 概述,第一单元 测量与测量量表 第二单元 心理测验的基本概念 第三单元 心理测验的分类 第四单元 纠正错误的测验观 第五单元 心理测验在心理咨询中的应用 第六单元 心理测验的发展史,一、什么是测量 测量就是依据一定的法则用数字对事物加以确定。 三个主要的元素:(1)事物;(2)数字;(3)法则。,第一单元 测量与测量量表,所谓“事物”,指的是我们要测量的对象,更准确地说,就

2、是引起我们兴趣的事物的属性或特征。 所谓“数字”,是代表某一事物或事物某一属性的量。 区分性1与2 序列性(等级性)3 2 1 等距性 321、 211 可加性 所谓“法则”,代表的是测量所依据的规则和方法,二、测量要素,(一)参照点 参照点有两种: 绝对零点 人定的参照点,即相对零点 (二)单位 好的单位必须具备两个条件: 确定的意义 相同的价值,三、测量量表,测量的本质是根据某一法则将事物数量化,即在一个定有单位和参照点的连续体上把事物的属性表现出来,这个连续体称为量表。 由于制定量表的单位和参照点不同,量表的种类也不同。,(1)命名量表 只是用数字来代表事物或对事物进行分类。 量表中的数

3、字没有任何数值意义,不能作量化分析。无大小意义,只表明类别。 无参照点和单位。无法比较大小或进行任何数学方法运算。 测量水平最低的一种形式,如代号、类别,四类量表,(2)顺序量表 表明类别的大小或某种属性的多少。 主要用于分等论级和分类。 数字仅表示等级并不表示某种属性的真正量或绝对值。 无参照点(没有绝对零度)和单位。 无法进行数学方法运算。,(3)等距量表 存在大小关系。 无绝对零度,但存在相对零点。 有相等单位,可以进行加减数学运算,但不能做乘除运算。,(4)等比量表 是最精确的测量。具有相等单位又有绝对零点。 大多是物理量表,可以进行各种数学运算。可以知道事物之间的某种特点上相差多少及

4、它们之间的倍数关系。 心理测验本质属于顺序量表!,第二单元 心理测量的基本概念,一、心理测量的定义 二、心理测量的性质,一、心理测量的定义,所谓心理测量,就是依据心理学理论,使用一定的操作程序,通过观察人的少数有代表性的行为,对于贯穿在人的全部行为活动中的心理特点做出推论和数量化分析的一种科学手段。,二、心理测量的性质,(一)间接性 (二)相对性 (三)客观性,心理测量的间接性,研究者无法直接测量人的心理,只能测量人的外显行为,也就是说,只能通过一个人对测验题目的反应来推论他的心理特质。 特质是构成人格的最小单位,是激发与指导个体的各种反应的恒常的心理结构。,心理测量的相对性,在对人的行为做比

5、较时,没有绝对的标准,也就是没有绝对的零点,有的只是一个连续的行为序列。所谓测验就是看每个人处在这个序列的什么位置上。,心理测量的客观性,测验的客观性实际上就是测验的标准化问题。对一切测量的共同要求是测验工具的标准化。 测验用的项目或作业、施测说明、施测者的言语态度及施测时的环境等,要求标准化。 测验评分记分的原则和手续也要经过标准化,使反应的量化是客观的。 最后,分数转换和解释标准化,对结果的推论应该是客观的。,第三单元 心理测验的分类,按测验的功能分类 按测验材料的性质分类 按测验材料的严谨程度分类 按测验的方式分类 按测验的要求分类,一、按测验的功能分类,(一)智力测验 (二)特殊能力测

6、验 (三)人格测验 EPQ 16PF MMPI,二、按测验的性质分类,(一)文字测验 (二)操作测验 也称非文字测验。,三、按测验材科的严谨程度分类,(一)客观测验 (二)投射测验,四、按测验的方式分类,(一)个别测验 (二)团体测验,五、按测验的要求分类,(一)最高行为测验(智力测验、成就测验) (二)典型行为测验(人格测验),第四单元 纠正错误的测验观,错误的测验观 正确的测验观,一、错误的测验观,(一)测验万能论 (二)测验无用论 (三)心理测验即智力测验,二、正确的测验观,(一)心理测验是重要的心理学研究方法之一,是决策的辅助工具 (二)心理测验作为研究方法和测量工具尚不完善,第五单元

7、 心理测验在心理咨询中的应用,智力测验 人格测验 心理评定量表,这几个方面是我国目前心理门诊中运用较多的,第六单元 心理测验的发展史,科学心理测验的产生和发展 现代心理测验在我国的发展,一、科学心理测验的产生与发展,高尔顿(FGalton) 提出人的不同气质特点和智能是按身体特点的不同而遗传的。 为了研究差异的遗传性,便设计了测量差异的方法。 为心理测验奠定了统计学基础。他第一个提出了相关的概念,卡特尔,卡特尔是对心理测验发展做出巨大贡献美国心理学家。1890年,卡特尔在心理杂志上发表心理测验与测量一文,这是心理测验第一次出现于心理学文献中。在此文中,卡特尔写到:“心理学若不立足于实验与测量上

8、,决不能够有自然科学之准确性。”又说:“心理测验如果有一个普遍的标准,则其科学的与实用的价值都可以增加。”他当时就极力主张测验手续和考试方法应有统一规定,并要有常模以便比较。所有这些都是测量学上的重要概念。,比内(ABinet) 世界上第一个正式的心理测验。,20世纪以后,心理测验主要有以下几个方面的发展: 1操作测验的发展 2团体智力测验的发展 3能力倾向测验的发展 4人格测验的发展,二、现代心理测验在我国的发展,近些年来我国的心理学家正在致力于测验本土化.,近代中国的心理测验,1914年,Creighton比较中美儿童智力差异(广州,500人) 1916年,樊炳清首先介绍了比 西智力量表

9、1918年,Walcott用S-B施测(清华) 1918年,俞子夷编制“小学生毛笔书法量表” 1920 南京高等师范学校,廖世承、陈鹤琴开设心理测量课,1921年,廖世承、陈鹤琴出版书心理测量法 1921年,费培杰将比内智力测验翻成中文 1922年,张耀翔在北京将心理测验列为入学考试科目 1922年夏,中华教育改进社聘请美国麦柯尔 1924年,陆志韦发表订正比内西蒙智力测验说明书;36年代与吴天敏做修订(80年代吴天敏3修),1931年6月由艾伟、陆志韦、陈鹤琴、萧孝嵘等倡议,组织并成立了中国测验学会。南京 1932年,测验创刊 1935年,沈有乾用“朋洛德人格问卷”测量中国学生 1937年,

10、周先庚使用“塞斯顿情绪稳定性测验” 此时智力测验和人格测验约20种,教育测验50种,1943年,林传鼎试用“普莱西X-O测验” 丁瓒等于46,4752年分别将TAT(主题统觉测验)与韦克斯勒 布勒维测验用于临床。 194851年间,刘范使用过RIT(罗夏克墨迹图测验)。 至1949年,出版的测验方面的书籍共计20余种,1979年,林传鼎,吴天敏,张厚粲在武汉举办全国测验培训班 1979年,龚耀先主持修订“韦克斯勒成人智力量表” 1979年,林传鼎、张厚粲编制“少年儿童学习能力测验” 1980年,林传鼎、张厚粲主持修订“韦克斯勒儿童智力量表” 1980年,北师大开设心理测验课,1980年,张厚粲

11、开始对高考试卷做系统分析 1981年,刘绍衣修订“卡特尔16种人格因素问卷” 1982年,吴天敏第三次修订中国比内测验 1982年,宋维真修订“明尼苏达多相人格调查表”,1983年,龚耀先、陈仲庚修订“艾森克问卷” 1984年,中国心理学会成立心理测量专业委员会 1984年,我国正式加入“国际教育成就评价协会” 1985年,张厚粲主持修订“瑞文标准推理测验” 1986年,龚耀先主持修订“韦克斯勒幼儿智力量表”,1987年,张明园修订“生活事件量表” 1989年,李丹修订“瑞文测验(联合型)” 1990年,中国加入国际测验委员会(ITC);吴文源修订“症状自评量表(SCL-90)” 1992年,

12、戴忠恒修订“一般能力倾向测验”,1992年,宋维真编制“心理健康调查表” 1992年,沙毓(yu)英等编制“学生性格量表” 1993年,宋维真等编制“中国人个性测量表”(CPAI) 1980年代,编制超常、弱智儿童筛查量表、03(6)岁儿童发育、发展量表、CPM领导行为评价量表,真题练习,200705- 103、正确的测验观包括( )。 (A)心理测验是重要的心理学研究方法之一,是决策的辅助工具 (B)做心理测验时态度要正确 (C)心理测验作为研究方法和测量工具不完善 (D)“一考定终身”说明心理测验非常重要 200705- 104、人格测验包括( )。 (A)EPQ (B)MMPI (C)1

13、6PF (D)CRT 200711-50、关于测量,正确的说法是( )。 (A)测量就是心理测量 (B)就是依据一定的法则用数字对事物加以确定 (C)就是用数字描述事物的法则 (D)就是用一些题目或数字来描述事物的属性,AC,ABC,B,真题练习,200806-105、心理测验具有( )。 (A)外显性 (B)间接性(C)相对性 (D)客观性 200806-106按测验的功能,可将测验分为( )。 (A)智力测验 (B)特殊能力测验 (C)人格测验 (D)投射测验 200806-109错误的测验观包括( )。 (A)心理测验即人格测验(B)心理测验尚不完善 (C)心理测验即智力测验(D)测验万

14、能论 200811-106、按测验的方式分类,可将测验分为( )。 (A)操作测验 (B)文字测 (C)个别测验 (D)团体测验,BCD,ABC,ACD,CD,真题练习,200811-107、心理测验具有( )。 (A)外显性 (B)间接性 (C)相对性 (D)客观性 200811-108、测量的主要元素包括( )。 (A)事物 (B)数字 (C)法则 (D)描述 200905-91、测量所用数字具有自然数的特点,即具有 (A)区分性 (B)等级性 (C)等距性 (D)可加性 200905-118、等距量表中的数值可以进行( )运算。 (A)加 (B)减 (C)乘 (D)除,BCD,ABC,A

15、BCD,AB,真题练习,200911- 34、人格测验不包括( )。 (A)EPQ (B)16PF (C)CRT (D)MMPI2 200911- 55、在顺序量表中,变量具有( )。 (A)相等单位(B)绝对零点(C)等级(D)可以做四则运算 200911- 75、编制世界上第一个正式的心理测验的学者是( )。 (A)高尔登 (B)比内 (C)卡特尔 (D)奥蒂斯 200911- 91、按测验的功能,可将测验分为( )。 (A)智力测验(B)特殊能力测验(C)人格测验(D)投射测验 200911- 118、按测验材料的性质,可将测验分为( ) (A)文字测验(B)主题统觉测验(C)智力测验(

16、D)操作测验,C,C,B,ABC,AD,真题练习,201011- 107、按测验材料的性质,可将测验分为( )。 (A)文字测验 (B)智力测验(C)主题统觉测验 (D)操作测验 201105-53、在顺序量表中,变量具有()。 (A)相等单位(B)等级(C)绝对零点(D)可以做四则运算,AD,小结: 第一节 概述,第一单元 测量与测量量表 第二单元 心理测验的基本概念 第三单元 心理测验的分类 第四单元 纠正错误的测验观 第五单元 心理测验在心理咨询中的应用 第六单元 心理测验的发展史,心理测量学,第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第

17、六节 测验编制的一般程序 第七节 心理测验的使用,第二节测验的常模,第一单元 常模团体 第二单元 常模的类型 第三单元 常模分数的表示方法,第一单元 常模团体,一、常模团体的性质 常模团体是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。 用一个标准的、规范的分数表示出来,以提供比较的基础。 任何一个测验都有许多可能的常模团体。,第一单元 常模团体,一、常模团体的性质 常模的选择主要是基于对测验将要施测的总体的认识,常模团体必须能够代表该总体。 常模的选择包括:确定一般总体、确定目标总体、确定样本。 使用测验需要特别注意常模团体。,二、常模团体的条件,(一)群体的构成必须明确界

18、定 (二)常模团体必须是所测群体的代表性样本 (三)样本的大小要适当 在实际工作中,应从经济的或实用的可能性和减少误差这两个方面来综合考虑样本的大小。 一般最低不小于30或100个。全国性常模,一般应有20003000人为宜。 样本大小适当的关键是样本要有代表性。 (四)标准化样组是一定时空的产物 在选择合适常模时,要注意选择较为新近的常模。,三、取样的方法,取样即从目标人群中选择有代表性的样本。 抽样方法有下列几种:,(一)简单随机抽样 按照随机表顺序选择被试构成样本,(二)系统抽样 系统抽样要求目标总体无序可排,也无等级结构存在。,(三)分组抽样 先将群体进行分组,再在组内进行随机取样。,

19、(四)分层抽样 先将目标总体按某种变量分成若干层次,再从各层次中随即抽取若干被试,最后把各层的被试组合成常模样本。,四、常模分数与常模,(一)常模分数 常模分数就是施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。 由原始分数构成的分布转换而来的分数,叫导出分数 导出分数具有一定的参照点和单位,它实际是一个有意义的测验量表,它与原始分数等值。(有意义、等单位、带参照点),(二)常模,常模分数构成的分布,就是通常所说的常模(norm),它是解释心理测验分数的基础。 常模有一般常模与特殊常模之分。,第二单元 常模的类型,发展常模 百分位常模 标准分常模 智商及其意义,一、发展常模

20、,个人的分数指出他的行为在按正常途径发展方面处于什么样的发展水平。 (一)发展顺序量表 (二)智力年龄 (三)年级当量,(一)发展顺序量表,最早的一个范例是格塞尔发展程序表 皮亚杰最著名的工作就是对守恒概念的研究。,格塞尔婴幼儿发展量表Gesell Developmental Schedules 由美国耶鲁大学的A.格塞尔及其同事制定的婴幼儿发展测量工具。最初发表于1925年,后对它作了几次修订,先后发表于1937、1940、1947和1974年。1974年修订版的测试对象为从出生至5岁、重点是3岁以下的幼儿,测试时间约30分钟。 格塞尔早期用电影记录并分析了幼儿的日常行为反应,发现了幼儿发展

21、程序的规律。他认为,幼儿的生长发展是有次序地逐步成熟和由简易分化到精细分化。幼儿的行为在抵达某一阶段时会显示出特殊的飞跃式进展,幼儿的新行为在成熟程序上具有代表性,并反映其在生长发育上已抵达新的阶段。格塞尔称这些年龄阶段为枢纽年龄,并把测定枢纽年龄列为量表的重点检查项目和诊断标准。格塞尔量表确定,1岁内以每4周为一个阶段,而以4周、16周、28周、40周、52周作为枢纽年龄,13岁间则以36月为一个阶段,以18月、24月、36月为枢纽年龄。,格塞尔婴幼儿发展量表Gesell Developmental Schedules 其检查内容分应人能:测试幼儿对周围人的应答能力和料理自己生活的能力;应物

22、能:测试幼儿看物、摘物和绘画等能力;言语能:测试幼儿听、理解和言语能力;动作能:测试幼儿坐、步行和跳跃的能力。结果以发展商数评价幼儿的发展水平。格塞尔认为,所观察到的发展现象反映了中枢神经系统的成熟程序。这一理论受到各方面的肯定。 格塞尔量表具有临床诊断的价值,它不仅适用于测量幼儿的发展水平,而且比其他量表更适用于伤残儿,被认为是婴幼儿智能测试的经典方法。20世纪60年代初,中国开始在临床上试用格塞尔量表。,(一)发展顺序量表,皮亚杰对守恒概念的研究。,儿童不是时期出现不同的守恒概念 5岁能理解质量守恒概念 6岁掌握重量守恒概念 7岁掌握容量守恒概念,(二)智力年龄 比内-西蒙量表中首先使用智

23、力年龄的概念。 一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄。这种分数叫做智力年龄,简称智龄。 直接的计算 年龄常模转换,(三)年级当量 年级当量实际上就是年级量表,测验结果说明属哪一年级的水平,在教育成就测验中最常用。,二、百分位常模,百分位常模包括百分等级和百分点、四分位数和十分位数,(一)百分等级,一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。,(二)百分点(百分位数),在分数量表上,相对于某一百分等级的分数点就叫百分点或百分位数。,(三)四分位数和十分位数,四分位数是将量表分成四等份,相当于百分等级的25%、50%和75%对应的三个点分成的四段。 十

24、分位数是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为10等份,与9个分割点上相对应的数据称为十分位数。,三、标准分常模,常见的标准分数有:z分数、Z分数、T分数、标准九分数、离差智商(IQ)等。 标准分数可以通过线性转换,也可以通过非线性转换得到,(一)线性转换的标准分数,(公式5-2) 其中X为任一原始分数, 为样本平均数,SD为样本标准差。 Z=A+Bz(公式5-3) 加上一个常数(A)是为了去掉负值,乘以一个常数(B)是为了使单位变小从而去掉小数点。,(一)线性转换的标准分数,当以50为平均数(即加上一个常数50),以10为标准差(乘以一个常数10)来表示时,通常叫做T

25、分数,即: T50+10 (公式5-4) 最早使用T分数者是麦柯尔。,标准九分、十分、二十分,标准九分:量表是个9级的分数量表。它是以5为平均数,以2为标准差的一个分数量表。 标准十分:平均数为5,标准差为1.5; 标准二十分:平均数为10,标准差为3。 使用最广、影响最大的一种常态化标准分数则是离差智商。,(二)非线性转换的标准分数,当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的。 常态化过程主要是将原始分数转化为百分等级,再将百分等级转化为常态分布上相应的离均值,并可以表示为任何平均数和标准差。计算步骤如下: 1对每个原始分数值计算累积百分比; 2在常态曲线面积表中,

26、求出对应于该百分比的z分数。 所得的z分数可将分布分成几部分,称z/分数,以区别由线性转换所求得的z分数。,四、智商及其意义,若心理年龄高于其生理年龄,则智力较一般儿童高,若心理年龄低于其生理年龄,则智力较一般儿童低。但在使用中发现,单纯用心理年龄来表示智力高低的方法缺乏不同年龄儿童间的可比性,(一)比率智商,比率智商(IQ)被定义为心理年龄(MA)与实足年龄(CA)之比。 (公式5-5) 由于个体心理年龄与实足年龄并不同步增长,所以比率智商并不适合于年龄较大的被试。,(二)离差智商,是一种以年龄组为样本计算而得的标准分数,它表示的是个体智力在年龄组中所处的位置,因而是表示智力高低的一种理想的

27、指标。 韦克斯勒将离差智商的平均数定为100,标准差定为15。 (公式5-6),16%,50%,第三单元 常模分数的表示方法,一、转换表法 二、剖析图 将测验分数的转换关系用图形表示出来。,真题练习,200705-50、常模样本量一般不小于( )。 A)100或500 (B)800或1000 (C)20或25 (D)30或100 200705-51、维克斯勒将离差智商的平均数定位100,标准差定为 (A) 17 (B)15 (C)11 (D)13 200711- 51、系统抽样的关键是计算( )。 (A) 样本量(B)总体(C)随机数(D)组距 200711- 52、百分等级的55的分数表示在

28、常模样本中有55%的人比这个分数( )。 (A)低(B)相等(C)高(D)以上都不正确 200711-53、( )可以将测验分数的转换关系用图形表示出来,便于直观的看出被试者在各个分测验上的表现及相对位置。 (A)条形图(B)直方图(C)剖面图(D)饼状图,D,B,D,A,C,200806-53、( )是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。 (A)团体 (B)常模团体 (C)样本 (D)受测人群 200806-54、常模分数构成的分布,就是通常所说的( ),它是解释心理测验分数的基础。 (A)常模分数 (B)常模 (C)导出分数 (D)分数 200806-55、 ,

29、式中SD为( )。 (A)样本平均数B)任一原始分数 C)样本标准差D)标准分数 200806-56韦克斯勒将离差智商的平均数定为100,标准差定为( )。 (A)16 (B)15 (C)14 (D)13 200806-57最简单而且最基本的表示常模的方法就是 (A)转换表 (B)分布表 (C)对照表 (D)指数表,B,B,C,C,B,A,200811-55、取样是指从( )中选择有代表性的样本。 (A)总体 (B)群体 (C)目标人群 (D)样本 , 200811-56、常模分数又叫( )。 (A)导出分数 (B)粗分数 (C)原始分数 (D)总体分数 200811-57、标准二十分的标准差

30、为( ) (A)5 (B)4 (C)3 (D)2 200811-58、韦克斯勒将离差智商的平均数定为100,标准差定为 (A)16 (B)15 (C)14 (D)13 200811-105、发展顺序量表可以告诉人们某儿童的发育与其年龄相比 (A)超前 (B)滞后 (C)正常 (D)以上都不是 200905-34、以50为平均数、以10为标准差表示的标准分数叫 (A)标准九分数 (B)T分数(C)离差智商 (D)Z分数 200905-56、随机号码表法是( )。 A)简单随机抽样(B)系统抽样(C)分组抽样 (D)分层抽样 200905-76、比率智商(IQ)是( )与实足年龄之比。 A)生理年

31、龄 (B)真实年龄 (C)心理年龄 (D)智力年龄 200905-105、标准分数可以通过( )得到。 (A)线性转换 (B)非线性转换(C)分析 (D)变化,C,A,C,B,ABC,B,A,C,AB,200911-56、首先使用智力年龄概念的是( )量表 (A)比内西蒙 (B)韦克斯勒 (C)斯坦福比内 (D)瑞文 200911-105、属于标准分数常模的是( )。 (A)百分等级 (B)T分数 (C)比率智商 (D)离差智商 20105- 34发展常模就是( )。 A团体的分数 B百分位数 C个人的分数 D年龄量表 20105- 35在心理测验中,对于非典型群体需要制定( ) A普通常模

32、B特殊常模 C一般常模 D发展常模 20105- 56具有某种共同特征的人所组成的一个群体或者是该群体的一个样本,叫做( )。 A团体 B常模团体 C样本 D受测人人群 20105- 57以50为平均数,以10为标准差来表示的分数,通常叫 AZ分数 B标准九分数 CT分数 D离差智商 20105- 76解释心理测验分数的比较基础是( )。 A常模分数 B常模 C导出分数 D分数,A,BD,B,B,C,B,20105- 92抽样的方法一般包括( )。 A分层抽样 B系统抽样 C分组抽样 D简单随机抽样 20105- 121常模的构成要素包括( )。 A抽样分数 B原始分数 C导出分数 D对常模团

33、体的具体描述 201011- 56、常模样本量的大小,一般最低不小于( )。P337 (A)100或500 (B)800或1000(C)20或25 (D)30或100 201011- 57、“某分数的百分等级为55”表示在常模样本中有55%的人的分数比该分数(A)。P340 (A)低 (B)相等(C)高 (D)全不是 201011- 58、以50为平均数、以10为标准差来表示的分数通常叫( )。P342 (A)Z分数 (B)T分数(C)标准九分数 (D)离差分数 201011- 59、( )表示的是个体智力分数在同年龄组分数分布中所处的位置。P343 (A)离差智商B)比率智商C)百分等级 D

34、)标准九分数,ABCD,BCD,D,A,B,A,201011- 60、()是将测验分数的转换关系用图形表示出来,从而可以很直观地看出披试者在各个分测验分数分布中的相对位置。P346 (A)条形图 (B)直方图(C)剖面图 (D)散点图 201011- 106、标准分数可以通过( )得到。P341 (A)线性转换 (B)非线性转换(C)求积 (D)求和 201105-54、由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本,称为( )。 (A)团体(B)常模团体(C)样本(D)受测人群,C,AB,B,小结:第二节 测验的常模,第一单元 常模团体 第二单元 常模的类型 第三单元 常模分

35、数的表示方法,心理测量学,第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用,第三节 测验的信度,第一单元 信度的概念 第二单元 信度评估的方法 第三单元 信度与测验分数的解释 第四单元 影响信度的因素,补充内容:,经典测验理论的基本假设,一、误差的含义和种类,(一)含义 测量误差指的是在测量过程中与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。 (二)种类 系统误差 随机误差,二、误差的来源,(一)测验本身引起的误差 取样缺乏代表性,词语模棱两可 (二)施测过程引起的误差 1.主试者方面

36、:年龄、性别、外表、动作等 2.环境因素 3.时间安排 4.意外干扰 5.记分,二、误差的来源,(三)受测者本身引起的误差 应试动机 测验焦虑 学习和训练 测验经验 生理状态 反应定势,三、真分数,(一)含义 测量没有误差时所得到的真值 操作性:无数次测量结果得到的平均值 (二)实得分数、真分数与测量误差 (三)性质 一组测验分数的变异性是由测量目的有关的变异数、稳定的但出自无关来源的变异数和随机误差变异数所决定的,三、真分数,(四)真分数的数学模型 (五)三个假设公理 若某种心理特质可以用平行测验反复测量足够多次,观察分数就会接近真分数 E(X)T;E(E)0 真分数与误差分数之间的相关为零

37、 (T,E)0 各平行测验上的误差分数之间的相关为零 (E1,E2)0,三、真分数,(六)平行测验 如果两个题目不同的测验测的是同一种特质,并且题目的形式、数量、难度、区分度以及测查等值团体后所得分数的分布都是一致的,则这两个测验被称为平行测验。,第一单元 信度的概念,一、信度的定义 信度是指同一被试者在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。,信度只受随机误差的影响。,如果我们讨论一组测验分数的特性时,可用方差代表具体分数,得到与公式5-7类似的公式: 式中, 是测验实得分数的方差, 是测验真分数的方差, 是测验误差的方差。,在测量理论中,信度被定义为:一组

38、测量分数的真分数方差与总方差(实得分数的方差)的比率。即: (公式59) 由于真实分数的方差是无法统计的,因此公式59还可以转化为: 因此,信度也可以看作在总的方差中非测量误差的方差所占的比例。,二、信度的指标,(一)信度系数与信度指数 (公式5-11) 信度指数的平方就是信度系数。 (二)测量标准误(误差的标准差) 信度越高,标准误越小;信度越低,标准误越大。,第二单元 信度评估的方法,重测信度 复本信度 内部一致性信度 评分者信度,一、重测信度,又称稳定性系数。 使用同一测验,在同样条件下对同一组被试者前后施测两次测验,求两次得分间的相关系数。 一般是两周到四周较宜,间隔时间最好不超过六个

39、月。,二、复本信度,以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数 复本信度反映的是测验在内容上的等值性,故又称等值性系数。,复本测验要求题目内容、数量、形式、难度、区分度、指导语、时限、例题等相同或相似,三、内部一致性信度,(一)分半信度(splithalf reliability) 这个相关系数就代表了两半测验内容取样的一致程度 (公式5-14) 式中为 一半分数的相关系数, 为测验在原长度时的信度估计值。,How to divide the test?,Random(随机法) odd-even(奇偶法) 1st half of items &

40、last half of items(顺序法),(二)同质性信度(homogeneity reliability) 代表测验内部所有题目间的一致性。 (1)指所有题目都测的是同一种心理特质。 (2)指所有题目得分之间都具有较高的正相关。 同质性信度就是一个测验所测内容或特质的相同程度。,克伦巴赫系数,四、评分者信度,随机抽取若干份测验卷,由两位评分者按评分标准分别给分,然后再根据每份测验卷的两个分数计算相关,即得评分者信度。 一般要求在成对的受过训练的评分者之间平均一致性达0.90以上,才认为评分是客观的。,斯皮尔曼等级相关,评分者信度:肯德尔和谐系数,被评者,评定者,公式中 K=3(评定者数

41、) N=6(被评者数),W0.86,第三单元 信度与测验分数的解释,解释真实分数与实得分数的相关 确定信度可以接受的水平 解释个人分数的意义 比较不同测验分数的差异,一、解释真分数与实得分数的相关,信度系数可以解释为测验的总变异中,真分数造成的变异占百分之几。 在极端的情况下,如有rxx1.00,则表示完全没有测量误差,所有的变异均来自真实分数;若有rxx0,则所有的变异和差别都反映的是测量误差。,二、确定信度可以接受的水平,一般原则是: 当rxx0.70时,测验不能用于对个人做出评价或预测,而且不能作团体比较; 当0.70rxx 0.85时,可用于团体比较; 当rxx0.85时,才能用来鉴别

42、或预测个人成绩或作为。,三、解释个人分数的意义,两个作用 其一是估计真实分数的范围; 其二是了解实得分数再测时可能的变化情形。 人们一般采用95%的或然率(概率)水平,其置信区间为: (公式5-16),四、比较不同测验分数的差异,测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。 差异分数的标准误公式为: (公式517),第四单元 影响信度的因素,一、样本特征 二、测验长度 三、测验难度 四、时间间隔,一、样本特征,信度常用信度系数来表示,信度系数就是相关系数,相关系数受样本是否异质及样本团体平均能力水平的影响

43、。 (一)样本团体异质性的影响 (二)样本团体平均能力水平的影响,样本团体异质性的影响,任何相关系数都要受到团体中分数分布的范围所影响,而分数范围与样本团体的异质程度有关。若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。,样本团体平均能力水平的影响,测验的信度还受取样不同团体间平均能力水平的不同而不同。这是因为,对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。 显而易见,每个信度系数都要求有对建立信度系数的团体的描述。在编制测验时,应把常模团体按年龄、性别、文化程度、职业等分为更同质的亚团体,并分别报告每个亚团体的信度系数

44、,这样测验才能适用于各种团体。,二、测验长度,测验长度,亦即测验的数量,也是影响信度系数的一个因素。一般来说,在一个测验中增加同质的题目,可以使信度提高。 第一,测验越长,测验的测题取样或内容取样就越有代表性。 第二,测验越长,被试的猜测因素影响就越小。长有时反而会引起被试的疲劳和反感而降低可靠性。,K=rkk(1-rxx)/rxx(1-rkk) K为改变后的长度与原长度之比 rxx为原测验的信度 rkk为测验长度是原来的k倍时的信度估计,三、测验难度,难度对信度的影响,只存在于某些测验中,如智力测验、成就测验、能力倾向测验等,对于人格测验、兴趣测验、态度量表等不存在难度问题,因为这些测验的题

45、目没有正确或错误答案之分。,三、测验难度,在实际情况下,如果某个测验适用范围很广,其难度水平通常适合于中等能力水平的被试,而对较高水平和较低水平的被试可能较易或较难,使得分数分布范围缩小,信度水平降低。因此一个标准化的测验,应根据不同能力水平报告测验的难度,以作为选择测验的参考。,四、时间间隔,时间间隔只对重测信度和不同时测量时的复本信度(重测复本信度)有影响,对其余的信度来说不存在时间间隔问题。,真题练习,200705-52、一般要求在成对的受过训练的评分者之间平均一致性达到( )以上,才认为评分是客观的。 (A)0.70 (B)0.80 (C)0.90 (D)1.00 200705-53、

46、以再测法或复本法求信度,两次测验相隔时间越短,其信度系数( )。 (A)越大 (B)越低 (C)越小 (D)不变 200705-55、信度只受( )的影响。 A)系统误差B)随机误差C)恒定效应D)概化作用 200711- 54、同质性信度主要代表测验内部( )间的一致性。 A)两半测验B)题目与分测验(C)所有题目(D)分测验 200811-59、信度只受( )的影响 (A)系统误差 (B)随机误差 (C)恒定效应 (D)概化理论,C,A,B,C,B,200905-35、以再测法或复本法秋信度,两次测验相隔时间越短,其信度系数越( )。 (A)大 (B)低 (C)小 (D)不确定 20090

47、5-77、重测信度即( )。 (A)等位性系数B)稳定性系数(C)相关系数 D)X系数 200905- 92、关于心理测验,下列说法正确的是( )。 (A)测验越长,测验的测题取样或内容取样越有代表性 (B)测验越长,被试者受猜测因素的影响就越小 (C)测验越长,月遵循报酬递增率原则 (D)测验太长,有时会引起被试者的疲劳和反感而降低可靠性 200911-76、在不同时间内用同一测验重复测量同一被试者,所得结果的一致程度称为( )。 (A)信度 (B)效度 (C)难度 (D)区分度,A,B,ABD,A,20105 -77同质性信度主要反映测验内部( )间的一致性。 A两半测验 B题目与分测验

48、C所有题目 D分测验与分测验 201011-61、信度只受()的影响。P348 A系统误差B随机误差C恒定效应D实验误差,C,B,小结:第三节 测验的信度,第一单元 信度的概念 第二单元 信度评估的方法 第三单元 信度与测验分数的解释 第四单元 影响信度的因素,心理测量学,第一节 概述 第二节 测验的常模 第三节 测验的信度 第四节 测验的效度 第五节 项目分析 第六节 测验编制的一般程序 第七节 心理测验的使用,第四节 测验的效度,第一单元 效度的概念 第二单元 效度评估的方法 第三单元 效度的功能 第四单元 影响效度的因素,一、效度的定义,效度是指所测量的与所要测量的心理特点之间符合的程度,或者简单地说是指一个心理测验的准确性。 在测验理论中,效度被定义为在一组测量中,与测量目标有关的方差(或称有效方差)与总方差的比率,即: (公式5-21),二、效度的性质,(一)效度具有相对性 在评鉴测验的效度时,必须考虑其目的与功能。,二、效度的性质,(二)效度具有连续性 测验效度通常用相关系数表示,它只有程度上的不同,而没有“全有”或“全无”的区别。因此,我们评价一个测验时,不应该说“有效”或“无效”,而应该用效度较高或较低来评价。 另外,效度是针

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1