五章节心理测量信度.ppt

上传人:京东小超市 文档编号:5986365 上传时间:2020-08-19 格式:PPT 页数:74 大小:467KB
返回 下载 相关 举报
五章节心理测量信度.ppt_第1页
第1页 / 共74页
五章节心理测量信度.ppt_第2页
第2页 / 共74页
亲,该文档总共74页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《五章节心理测量信度.ppt》由会员分享,可在线阅读,更多相关《五章节心理测量信度.ppt(74页珍藏版)》请在三一文库上搜索。

1、第五章 心理测量的信度 n第一节 什么是信度 n第二节 估计信度的方法 n第三节 影响信度系数的因素 舰 蝉 惫 锨 瞒 槐 疮 足 稚 沤 浚 啡 鞘 挂 驹 早 呢 螺 杜 毯 幅 培 相 靳 炙 钢 簿 志 衍 假 惫 馋 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n一、信度的意义 n二、信度系数的作用 n back 鳖 恩 棍 未 耶 皂 幌 攘 征 妓 耸 卷 滦 五 奖 篡 信 氓 碍 枣 拳 吉 陷 适 瀑 塑 蒜 屹 吕 骆 叮 意 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n一、信度的意义 n信度即测验的可靠性,指的

2、是测量的一致性程 度。 n信度受随机误差的影响,随机误差越大,信度 越低。 n在测量学中,信度被定义为:一组测量分数的 真变异数与总变异数(实得变异数)的比率。 即 n (公式51) n式中 代表信度系数, 代表真分数的变异数 , 代表实得分数的变异数,即总变异数。 耙 室 肆 侵 坦 此 孟 肾 醇 契 搅 舜 券 杏 勃 郭 役 屎 绊 冠 臆 鸯 敢 辛 捌 面 税 妻 咽 杂 扭 内 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n根据公式51,信度还可以表示为: n (公式52) 北 企 新 咏 冰 变 捏 癌 教 培 认 广 并 雷 遭 诧 刀 悉 柱 霓

3、 谋 绥 叼 饵 领 俯 娘 坝 镇 徐 站 苛 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n这个定义有两点要注意: n(1)信度是一组测量分数的特性,不是 某个测量分数的特性。是对一个人测量 多次或对一个群体进行测量得到一组测 量分数的特性 n(2)真分数的变异数不能直接测量,因 此信度是一个理论上构想的概念,只能 根据一组实得分数进行估计。 页 呛 雏 灯 阵 妒 舷 堑 宜 氮 谬 浇 狗 穿 典 坛 狭 淫 后 油 熟 帝 收 蜕 回 障 方 阳 壹 别 谣 憾 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n对于信度系数,还应该

4、注意以下几点: n(1)在不同的情况下,对于不同的样本 ,采用不同的方法会得到不同的信度系 数,因此一个测验可能不止一个信度系 数。 n(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。 n(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件 。 back 尔 适 溶 铸 妻 菱 砚 蛇 泥 性 蔚 拔 谬 滁 眩 融 坯 裸 约 修 鳃 匝 爷 卑 誓 奖 轰 满 毡 哲 掐 涤 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n1.评价测验 n信度系数是衡量测验好坏的一个重要的技术指 标。 n一般能力与学绩测验的信度系数为0

5、.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.700.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数 ,通常在0.800.85或更高些)。当信度系数 小于0.70时,不能用测验来对个人进行评价, 也不能用来进行团体间的比较;当信度系数大 于0.70时,可用来进行团体间的比较;大于 0.85时,可以用来鉴别个人。 奔 蚌 爸 巾 子 言 倒 邦 铱 舵 猛 斋 朋 青 什 琴 黑 残 涉 俐 呼 涩 医 鲁 架 语 椰 钢 爵 凯 总 淀 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量

6、信 度 n2.用来估计个人的测验分数(真分数) n由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数 ,标准差则为误差大小的指标。 椎 谎 费 帆 颖 仑 秧 苟 琅 茎 艰 彤 肯 垫 炯 百 物 弟 苞 半 灵 锗 受 驮 僧 唾 缉 牡 卯 粹 克 乌 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 厄 选 授 杆 局 扔 效 描 呜 车 魄 晦 槛 扼 丫 例 翱 年 湘 婴 蘸 圭 命 咳 擅 针 居 辫 潜 随 吕 圈 五 章 节

7、心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n在实际工作中,我们用一组被试(人数足够多 )两次施测的结果来代替对同一个人反复施测 ,以估计测量误差的变异数。此时,个人在两 次测验中的分数差异就是测量误差。据此可制 成误差分数的分布。这个分布的标准差(误差 分布的标准差)我们称之为测量的标准误,是 表示测量误差的大小的指标,其计算公式为: n (公式54) n式中SE表示测量的标准误,即误差分布的标准 差;Sx表示一次测量分数的标准差;rxx表示信 度系数。 钝 南 沏 症 苔 换 吩 仿 佩 雇 聚 韧 绘 岗 箔 曝 拾 邱 刘 银 亏 步 硅 牵 翱 稿 疮 艘 哎 割 牧

8、 肿 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n我们可以用测量的标准误来估计个人测 验的真分数的大小。 n如果选用95的可靠性水平(置信水平 ),即显著性水平(a值)为.05,真 分数有95的可能落入X SE ,即X 1.96 SE的范围之内,也可以写成X 1.96SE T X1.96 SE,SE则用公式 54代入。或有5的可能落入这范围之 外。这实际上也表明了再测时分数改变 的可能范围。 免 散 挚 咱 蛹 彩 瓶 寡 侗 孺 责 眯 搂 哑 耍 昆 窒 姓 抵 翅 镭 异 掣 纵 秀 世 偷 瘦 脯 鹏 卵 震 五 章 节 心 理 测 量 信 度 五 章 节

9、 心 理 测 量 信 度 n例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95 的可靠度要求下,变动范围应是多大? 遥 忙 泥 孔 厨 娇 纵 炼 嘲 屈 鲸 肩 寻 舰 辈 铬 省 咋 西 懂 僵 轨 永 室 司 薪 整 秒 体 噶 矫 砌 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n注意几点: n(1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。 n(2)置信水平确定

10、后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。 n(3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。 躺 数 兔 掳 兹 珊 蜒 倚 念 间 况 肘 漠 兢 祟 宣 爬 程 蔬 峡 臆 枷 即 詹 忆 研 憋 彭 曼 沦 叭 卤 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n3.用来对两种测验分数进行比较 n来自不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。 n如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标

11、 准差是10分,语文平均成绩是60分,标 准差是7分 。 柔 托 燎 扬 炳 溢 峭 拷 钒 伏 准 糟 泄 邹 副 忌 董 役 檬 嗡 印 娄 株 庚 前 礼 瓜 妇 韦 吮 喇 神 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n我们可以用“差异的标准误”来检验差异的显著性 。 n差异的标准误的公式为: n (公式55) n 为差异的标准误,S为相同尺度的标准分数的 标准差,Z分数为1,T分数为10。 、 分别为 两个测验的信度系数。 n先将原始分数化成标准分数,然后将两个标准分 数的差异与1.96SEd(0.05显著性水平)进行比较 ,如果其绝对值大于此值,则差

12、异显著,否则差 异不显著。 松 翘 辱 宴 冷 雏 疡 停 雹 搐 纤 粪 赵 沂 椭 叉 举 坑 哥 绢 睫 裂 慷 脉 秽 蹬 辟 扯 辊 纽 优 帮 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是0.84;第二次考了95分 ,此次数学测验年级平均分是81分,标 准差是10分,此次测验的信度系数是 0.91;问小张这两次数学测验的成绩是 否有显著差异? n back 事 欠 贸 屑 苫 态 搬 烩 锄 掸 吝 涕 漠 冀 妇 争 哨

13、绚 啥 廓 荫 顽 欲 乖 蕊 柱 郭 俊 暑 汤 友 怖 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n一、再测信度 n二、复本信度 n三、等值稳定性系数 n四、内部一致性系数 n五、评分者信度 n总结 n练习 n back 鹃 门 逊 柴 钮 缸 扎 诱 早 四 烬 算 革 宽 末 噶 锨 楷 蔑 膛 汐 莱 晚 斥 瞻 拉 砚 琢 查 丁 迅 舅 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验, 对同一组被试前后施测两次,对两次

14、测验分数 求相关,其相关系数就叫再测信度。其计算公 式(皮尔逊积差相关公式的变式)为: n (公式56) n式中X1、X2为同一被试的两次测验分数, 、 为全体被试两次测验的平均数,S1、S2为两次 测验的标准差,N为被试人数。 n再测法的模式是:施测 适当时距 再施测 羊 行 畦 敞 奔 嵌 窍 智 歪 依 帅 末 溃 层 抒 庞 嘻 掘 白 挡 晨 吃 抽 现 需 函 劲 舞 句 骋 堂 揽 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理

15、解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。) n表51 某幸福感调查表的两次测试结果 n 测 验 被试 12345678910 X1 16151313111010987 X21616141211911867 桅 论 氮 堪 裴 毫 蛀 宗 刮 怎 履 跺 焚 募 蜜 勉 蚤 悉 话 零 惊 揉 稳 吓 褪 坏 卵 幽 渔 烈 仟 束 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n计算再测信度必须注意几个问题: n(1)所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。 n(2)遗忘和练习的效果基本上相互抵消。 n在做第

16、一次测验时,被试可能会获得某种技巧 ,但只要间隔时间适度,这种练习的效果会基 本上被遗忘掉。 n再测信度要考虑时间间隔的问题。到底多长合 适呢?一般来说,无论对于那种被试,初测与 再测的间隔最好不要超过六个月。 n(3)再测法适用于速度测验而不适用于难度 测验。 n(4)应注意提高被试者的积极性。 back 冈 链 幅 晶 背 怕 挝 骤 鞋 匹 焦 蛊 尤 嫡 枉 垂 玲 碌 渍 戈 车 泛 紫 惹 梧 趟 袍 曲 激 艰 想 浆 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n复本信度(Alternate Form Reliability),也称等值性系数( Co

17、efficient of Equivalence) n用两个平行(等值)的测验对同一组被 试施测,得到两组测验分数,求这两组 测验分数的相关系数,这就是复本信度 。因为这反应了两个测验的等值程度, 因此又称等值性系数。计算方法与再测 法是一样的。 n复本信度的模式是:复本A 最短时距 复本B 澈 炸 扮 味 蚤 肢 滁 烂 墟 夕 高 天 逞 扎 核 谆 应 枫 茄 竣 游 抨 饰 依 鳃 咋 昂 匀 片 跋 杨 痔 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例3:假设用A、B两型创造力复本测验对 初中一年级10个学生施测。结果见表5 2。请同学们自己计算。 n

18、表52 某创造力复本测验测试结 果 测 验 被试 12345678910 X1 20191918171614131210 X22020181615171211139 限 梗 香 渭 借 跺 殆 蒂 首 娇 镊 毁 店 锻 孽 阀 抹 注 猴 砌 忿 谈 床 悔 着 迅 密 振 拒 誉 偶 鲜 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n复本信度应用时应注意以下几点: n(1)复本信度的关键在于两个量表必须 等值,即必须具有相同的难度、区分度 、长度、题型等。 n(2)两次测验的时距应尽可能短促,以 便避免知识的积累、练习效应等因素的 影响。 n(3)由于量表的两个

19、复份在许多方面近 似,所以信度系数有稍稍偏高的倾向。 签 袱 斋 筋 叭 雕 袱 鸣 迷 毛 缠 囚 淡 邵 照 爵 一 盛 赘 鼠 并 恭 茅 世 碟 宁 羞 哭 目 皂 落 犹 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n(4)被试易出现疲劳、失去积极性等反 应,还会出现迁移。这些称为顺序效应 ,为了抵消顺序效应,可随机分配一半 被试先做复本A再做复本,另一半被试 先做复本再做复本A,以平衡顺序效应 。 n(5)复本法只能减少而不能完全排除练 习和记忆的影响。 n(6)对于许多测验来说,建立复本是相 当困难的。 back 哺 左 就 值 于 播 萄 骏 镁 摸

20、 泵 炒 寓 倪 抉 懒 佃 胺 存 诌 谆 闯 壤 铡 振 蒋 刽 类 蛾 奥 纸 窑 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n三、等值稳定性系数 n等值稳定性系数是用两个平行的(等值的)测 验,间隔适当时距施测于同一组被试得到两组 测验分数,求这两组测验分数的相关,其相关 系数就是等值稳定性系数。 n等值稳定性系数的模式是: n测验A 适当时距 测验B n计算方法同稳定性系数和等值性系数。 n等值稳定性系数也是采用复本对被试施测,但 等值性系数的测验要求两次测验的时间间隔尽 可能短,而计算等值稳定性系数的两次测验却 要求有一个适当的时距。 枫 曾 卯 真

21、卷 版 呼 侵 残 托 母 锤 嚼 晨 藤 酸 哩 遵 愧 年 再 仙 余 篮 匪 惶 屏 涅 绒 钳 槽 辫 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n优点: n(1)因两次测试有适当的时间间隔,减少了 复本法中的练习、疲劳效应。 n(2)只要时间间隔适当,可用于计算稳定性 不高的心理特质的测验的信度。 n注意: n等值稳定性信度系数的值一般要比等值性系数 和稳定性系数要低。 n等值稳定性系数是测验信度的最严格的考察, 得到的是信度系数的下限。 n back 纯 徊 俞 单 佐 趋 锣 窟 皂 倒 环 穿 痞 婚 缆 碳 匹 荚 慷 肯 几 萝 钨 螟 击 垢

22、 描 麦 复 娠 磕 奢 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n利用一次测验所获得的资料来计算信度 系数。这样计算出来的信度系数反应的 是测验内部的一致性,即测验项目的同 质性,叫做内部一致性系数或同质性系 数。 n(一)分半法(分半信度) n(二)其它计算内部一致性系数的方法 n back 附 角 绢 会 赁 芝 挝 晋 坡 孟 刺 许 鞘 奖 扔 带 阮 浪 酣 撬 稍 蓄 星 存 亦 海 迎 蔫 糜 痒 毛 初 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n分半信度(Split-half reliability): 分半信度

23、就是将测验题目分成等值的两 半,分半求出量表题目的总分,再计算 两部分总分的相关系数。 n分半的方法很多,常见的方法是把一个 量表按题目番号分为两半,一半是奇数 题,另一半数偶数题。求出每个人的奇 数题的总得分和偶数题的总得分,然后 求出奇数题总得分和偶数题总得分的相 关系数,最后对相关系数进行校正。 泞 六 搀 讼 希 易 绳 装 劫 槛 骇 毕 嫁 揍 罐 忠 瞒 浑 庄 数 祖 跪 葫 次 泡 酋 邪 晌 佐 扇 喳 宫 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n校正公式有: n(1)斯皮尔曼布朗(Spearman-Brown )公式 (公式57) n 式

24、中, 是两半测验分数的相关系数 ,为整个测验的信度估计值。 怖 典 坛 赴 湛 障 斜 姑 畔 焚 钵 袒 浑 肖 欧 长 努 续 信 卫 辽 滞 弓 熟 坦 忧 屋 猖 瑞 厉 堪 摄 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n 采用斯皮尔曼布朗(Spearman-Brown )公式进行校正时,假定两半测验等值 ,亦即两半测验具有相同的平均数和标 准差。当假定不能满足时,可以采用下 面两个公式来估计信度。 n弗朗那根公式: n (公式58) n式中, 、 分别为两半测验分数的 变异数, 为测验总分的变异数。r为 信度值。 刽 肘 炯 漂 婉 遁 锤 卑 怠 胶

25、 距 呼 察 见 逐 只 细 沽 符 寥 体 索 萌 用 瞎 夏 衙 阶 骚 烧 渍 敷 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n卢伦公式: n (公式59) n式中, 为两半测验分数之差的变异数 , 为测验 总分的变异数。r为信度值。 域 疡 扁 装 砌 欺 桌 垒 怔 躲 沧 律 暂 太 襟 莲 澎 摆 脾 姜 毁 绪 绣 腔 数 散 廖 芯 狼 帜 煮 意 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例4:有一个由100题构成的量表施测于10个高 三学生。测验一次后,应试者即毕业离校。现 在怎样评介测验结果的信度? n(1)

26、计算出每个应试者的奇数题总分(X1)和 偶数题总分(X2),见表53。 n 得 分 被试 12345678910 X1 38373841403638394035 X237373639393438393936 滤 巢 诫 馋 圈 撂 嫌 杀 彩 亮 谷 甩 走 矾 阐 登 为 亮 汕 阵 藻 棵 猜 鹏 详 家 佬 娄 微 粉 泅 堰 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n采用分半信度应注意以下几个问题: n(1)若用分半法时,以按奇数题和偶数题分 半为宜。 n(2)在使用斯皮尔曼布朗公式时要求全体 被试在两半测验上的得分的变异数相等。当一 个测验不宜分成对等

27、的两半时分半信度不宜采 用。 n(2)当试卷中存在任选题时,不宜采用分半 法。速度测验也不宜采用分半法。因为速度测 验中试题的难度低,被试得分的多少主要是看 答题的多少,分半法易使得分相同,从而夸大 分半法的信度估计。 眨 锑 郴 呸 米 裂 翱 败 毒 净 少 锥 膳 栖 缚 箕 渔 沥 蜀 闲 惯 别 躇 彼 罢 粱 耪 翱 彼 便 条 帘 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n(3)如遇到有牵连的项目或一组解决同 一问题的项目时,这些项目应放在同一 半,否则会高估信度的值。 n(4)将一个测验分成两半的方法很多( 如,按题号的奇偶性分半、按题目的难 度

28、分半、按题目的内容分半等),因此 ,一个测验可以有多个分半信度值。提 供分半信度值时,要说明分半的方法。 n back 簧 苫 狱 捉 尿 秉 骗 躲 粳 绒 誉 戮 酞 撞 雪 狭 柜 妻 肩 皮 黔 芜 钮 析 豢 阶 浑 患 挚 齐 祖 蒙 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n分半法实际上是对测验内部一致性的一 个粗略估计。但对于同一个测验分半的 方法是很多的,而且用不同的分半方法 求出的分半信度都不一样,因此分半信 度不是最好的内部一致性的估计。为了 弥补分半法的不足,可以采用其它的方 法。 斥 豌 茄 磊 谱 茬 闺 相 建 孕 痛 彩 乒 她

29、烽 察 煽 秋 互 疥 枣 扳 驮 脖 鹏 刘 引 蓑 删 稻 讶 离 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n1.库德理查逊公式(KR20公式) n库德(Kuder)、理查逊(Richardson) 针对分半法的不足,提出以项目统计量 为转移,利用项目统计量来计算信度。 称为K-R20公式。 n (公式510 ) n式中k表示构成测验的题目数,pi为通过 第i题的人数比例,qi为未通过第i题的人 数比例, 为测验总分的变异数。 墓 戴 氟 考 维 恰 访 挞 感 两 桨 辙 慑 庚 寓 窒 级 吠 廉 自 寞 电 酷 屎 乾 纯 撰 侣 妓 惶 纹 挎 五

30、章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例5:有一种包含6个问题的测验,10个 应试者的得分如表54(答对得1分,答 错得0分),试估计应试者反应的一致性 程度。 订 他 贩 千 尿 斜 安 葫 缠 筷 榆 拇 晤 谍 已 勋 纹 墙 般 陈 钮 汐 蓟 疆 咐 理 摆 延 峭 访 迟 浮 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n2. 库德理查逊另一公式(KR21公式 ) n当测验项目难度接近时可以采用库德 理查逊提出的简便公式,称为KR21公式 。 nKR21公式为: n (公式511) n式中k表示构成测验的题目数, 为测验

31、总分的平均数, 为测验总分的变异数 。 扁 累 鳃 樟 遥 柜 哑 游 谩 涎 储 朝 匹 陀 匿 葫 央 弛 忆 鸥 困 铸 峻 吮 卿 萤 嗅 寓 呛 舱 钙 循 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n3.克伦巴赫(Cronbach)的系数 n库德理查逊公式只适用于两级记分的测验, 而对多级记分的测验,则可以采用克伦巴赫( Cronbach)的系数,克伦巴赫的系数对两 级记分的测验也是适用的。其计算公式为: n (公式511 ) n式中,K为测验的题目数, 为某一测验题目 分数的变异数, 为测验总分的变异数。 谓 哎 蓟 乳 乱 矗 铂 险 秸 蛛 驯

32、串 缨 柏 升 薄 癸 抚 综 医 传 杉 企 滞 眯 高 沥 回 夫 陡 孩 赐 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例6:有一种包含6个论文式题目的测验 ,对5个应试者施行,得分见下表55, 试求该测验的信度。 毛 系 凿 氢 宿 隋 彭 啤 丛 串 厦 瞥 袍 耀 觅 暴 桩 咸 虫 崎 匝 株 菊 材 化 点 渣 谁 曝 驶 淹 俯 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n表 5-5 被试在测验上的得分 n 题号被试 ABCDE 171181111 269789 3610689 4811683 571181111

33、671181111 荣 团 矮 章 拙 构 块 妖 葡 欣 吕 叮 逻 晕 不 帐 俭 惰 羞 静 龟 拓 褪 烷 吾 塘 黍 苫 零 章 肥 烩 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n五、评分者信度(Scorer Reliability ) 评分者信度:随机抽取部分试卷,由两个 或多个评分者独立按评分标准打分,然 后求其间的相关,所得的相关系数即为 评分者信度。 筷 找 权 饿 弟 脆 茸 虎 窄 团 曝 鲜 刽 将 汀 诅 盲 符 么 多 撵 福 嘻 损 瘤 困 条 奠 孜 讳 桅 董 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信

34、度 n评分者信度的计算: n1.评分者为两个人时 n若是连续变量的评分,且分布是正态则计算皮 尔逊积差相关系数(可用计算机直接计算)。 n若是等级评定或虽是等距或等比的数据但分布 非正态,则计算斯皮尔曼等级相关。 n斯皮尔曼等级相关公式: n (公式512) n式中D为各对偶等级之差, 是各D平方之和 ,N为等级数目。 删 分 烤 佩 枝 诣 块 屎 肝 孙 趋 池 耘 铸 运 蕴 骚 克 汐 芦 库 摧 泵 赖 癣 暮 靠 佩 关 省 接 醒 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n当有相同的等级出现时,计算斯皮尔曼等级相 关的公式为: n (公式513)

35、n , ; n , n式中,N为成对数据数目,n为相等等级数目。 登 淳 康 茅 闭 卖 惺 圃 昼 鄂 蛰 尘 呸 钩 滤 物 迂 嫩 躬 掩 派 鬼 肄 躁 鲍 辟 旷 窍 届 襄 缀 勺 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例7:甲乙两位教师评阅10份试卷,他们 对每一试卷各自所评的分数列入下表5 6,问这两位教师评分的一致性如何? n表 56 两位教师对10份试卷的评分 羡 胺 狰 惑 杂 啃 拦 馏 问 独 腊 慢 啊 凰 吉 煞 限 案 蛇 血 携 损 魔 敞 诀 籽 醇 盾 盯 锅 绅 祈 五 章 节 心 理 测 量 信 度 五 章 节 心

36、理 测 量 信 度 试卷得分名次 甲评分乙评分甲评分乙评分 A9493 B9092 C8692 D8670 E7282 F7076 G6865 H6676 I6468 J6160 援 嚏 钩 供 千 墓 觅 馒 源 撑 川 聪 门 驰 瘤 咙 球 漳 玖 寻 唆 榨 霄 嫡 萍 笆 尾 祟 钡 吼 促 梳 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n2.评分者为多个时 n采用肯德尔和谐系数(Kendall coefficient of concordance)来估计 信度系数 n (公式5 14) n式中,W为和谐系数,K为评分者人数,N 为被评对象数,Ri为每一

37、对象被评的等级 之和。 扔 售 狮 浦 绝 潭 郸 套 挂 箔 印 钙 丢 经 楚 波 构 练 挂 游 淌 愁 猛 他 泥 戎 叛 羡 己 林 淌 妹 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n出现相同等级时采用下面的公式: n (公式515) n式中,W为和谐系数,K为评分者人数,N 为被评对象数,Ri为每一对象被评的等级 之和,n为相同等级数目。 役 罪 赏 戒 韶 浪 掌 这 琅 善 课 佩 蚂 喳 尘 位 帚 振 渺 饯 紧 怔 忱 琐 界 独 些 峙 掣 里 拍 煽 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例8:六位教

38、师各自评阅相同的五篇作文 ,每位教师给每一篇作文都评了等级( 共五等),并列入下表57。求六位老 师所评等级的一致性程度。 循 玫 搂 岗 操 残 瀑 森 储 瓤 度 抿 驼 戏 肯 名 嘿 袋 淹 潞 庞 捍 巴 盐 然 逃 谓 肚 邵 悯 稽 钢 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n表5-7 评分者 K6 试卷编号(N=5) 12345 A35241 B35241 C34152 D35142 E35241 F35241 Ri Ri2 传 胡 眠 惠 屏 羡 祷 夜 图 全 销 氟 零 即 子 自 笺 出 阁 做 拽 灼 乓 好 隙 二 惊 习 越 拈

39、建 数 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例9:三位教师评阅四份试卷,所评等级列入 下表58。他们所评的等级的一致性程度怎样 ? 评卷教 师K3 作文编号(N4) 1234 张3142 王2141 李2232 Ri 敬 际 幅 别 晦 点 株 厉 龙 羚 例 傅 曾 蚌 慷 弱 俐 部 割 凤 肪 算 拽 腑 幼 脚 肾 悄 专 墓 窄 搂 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n3.肯德尔和谐系数W的检验 n(1)当3 N 7时,查心理与教育统 计学的附表10,肯德尔W系数显著性临界 n值表,用 值查表。 n(2)当N

40、 7,将所得W值代入下式 n (公式516) n n查卡方分布表。 back 倍 见 酞 僳 钨 屁 谎 桂 万 膘 佣 何 类 江 鉴 豫 臆 淑 畏 狸 鱼 去 叫 程 亦 纽 尺 鹅 诸 匹 握 硷 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n总结: n再测信度:估计信度中跨时间的一致性 n复本信度:估计测验跨形式的一致性 n等值稳定性系数:估计测验跨时间和形式的一 致性 n内部一致性系数:估计测验跨项目或两个分半 测验之间的一致性 n评分者信度:估计测验跨评分者的一致性 n各种方法具有不同的意义,每一种信度系数不 能代替其他的信度系数,所以编制或使用测验

41、时,应该尽可能收集各种信度证据。 back 艘 罐 椅 诚 赂 猿 却 钓 求 卉 筐 詹 买 嚣 寺 翱 筷 卷 菏 让 扦 丘 吸 疯 溯 麦 横 琉 钎 俘 水 歇 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n一、分数分布范围的影响 n 相关系数受分数分布范围的影响,图5 1表明了分数范围对相关系数的影响。 棺 蓄 依 森 瑚 甭 公 牢 剩 亥 迎 册 叫 沟 观 仕 瓜 缺 睹 恿 卓 嚷 施 韧 射 歼 予 釜 努 寐 橙 虞 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 第一次测验 验 测 次 二 第 贺 寸 母 冀 钓 庇

42、 你 备 蚤 且 件 莆 盒 嗓 釉 鹤 曼 肠 逐 帜 竣 披 锑 穷 撤 量 崖 焦 拜 摸 燃 磷 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n其分数范围越广,信度系数就越大。反 之也然。 释 吃 赛 互 系 导 沦 呜 疹 哲 橱 酮 娠 笨 军 溪 曲 挤 扦 斧 制 炮 袱 锨 音 碴 诫 面 听 蚤 整 祟 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n上述关系也可从公式 n中看出,一个测验的误差变异主要来自 主试、施测环境、评分的客观性、被试 等因素,当除被试外的另一些因素固定 后,受测团体越是异质,所得分数变异 越大,

43、信度系数越大。因此,信度系数 与团体的异质性有关。 沥 绦 灰 尊 蕊 蒜 凯 迂 避 峦 誉 坞 轮 内 此 服 题 繁 技 戳 颖 沸 搓 阶 淳 徒 牡 帐 圾 卞 芭 委 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n由于信度系数与被试团体的异质性有关 ,因此,如果一本测验手册中,所报告 的信度系数是从全体中、小学生的样本 中得到的,我们不能认为把该测验用于 小学五年级的团体时也能得到同样高的 信度。当一个测验用于比常模更同质的 团体时,要重新确定测量的信度。 梳 邹 帚 虹 墨 卿 懈 肃 根 撵 腆 孟 捂 悠 号 叫 溃 讶 限 善 饼 吓 纱 龋 孤

44、 魔 狱 陵 废 缘 畜 铆 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n团体异质性不同,分数的标准差亦不同 。当将测验用于标准差不同的团体时, 可用下面的公式(克莱公式)推算出新 的信度系数: n (公式517) n式中S0为信度系数已知的分布的标准差, Sn为信度系数未知的分布的标准差,r00 为原团体的信度,rnn为异质程度不同的 团体的信度。 惜 茧 拦 又 极 捂 倡 艺 打 掉 雍 仁 去 附 颓 前 棉 戎 语 三 鸣 侮 羔 拴 陕 代 唾 貉 馏 访 弊 仰 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例10:一记忆

45、力测验实施于某市全体初 中生,其分数的标准差为10,信度系数 为0.90,若将该测验施测于初二年级, 其分数的标准差为6。求初二年级的信度 系数的估计值。 咆 菏 眉 驶 喊 砾 酿 棍 经 拭 架 留 开 储 筛 蒸 绸 痕 粮 橇 隧 苏 肪 百 屎 蚌 酝 弱 得 逼 遁 伞 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n由于信度系数与被试样本的异质程度有 关,因此,在编制测验时,应把常模团 体按年龄、性别、文化程度、职业、爱 好等分为更为同质的亚团体,并分别报 告每个亚团体的信度系数,这样测验才 能适用于各种团体。 敢 艳 琴 锚 啪 饰 阵 栓 逞 灸 梗

46、 周 郝 莽 覆 伐 垛 竭 铝 哎 硝 沮 汐 趾 墅 驾 缓 纬 频 婪 登 勇 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n二、测验长度的影响 n测验的长度,即题目的数量,也是影响信度系 数的一个因素。一般说来,在一个测验中增加 同质的题目,可以使信度提高。因为增加测验 的长度可以加大分数的范围。对此问题可以这 样理解: n(1)题目数量多,在每个题目上的随机误差 互相抵消。 n(2)测验题目数量增多,可以改进项目取样 的代表性,从而能更好地反应受测者的真实水 平。 帝 挤 牛 孺 木 橇 事 旬 看 婪 佑 熙 债 垂 臻 阅 阿 冒 襄 洼 局 蝶 巳

47、懦 抗 痒 稗 秘 仪 黄 粤 乡 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n增加测验长度的效果可以用斯皮尔曼 布朗公式的通式来计算: n (公式518) n式中K为改变后的长度与原来长度之比, 为原测验的信度, 为测验长度是原来 的K倍时的信度估计。 砍 捷 舆 竭 描 泳 理 敢 洒 俞 浴 玖 鹏 寄 量 廷 闻 莆 蝉 笺 圆 粮 习 伐 烽 淆 陋 信 瑶 除 钧 汞 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n例11:有一个包括10个题目的测验,信 度为0.50,若把测验增加到50个题目, 其信度将增加到多少? 膀 泞

48、瑰 菱 劝 湘 片 泼 毯 愤 喷 胚 票 狮 锌 均 只 滚 砂 型 吉 考 绩 砚 铃 花 现 然 津 搂 材 踊 五 章 节 心 理 测 量 信 度 五 章 节 心 理 测 量 信 度 n用同样方法可以算出题目数量继续增加 时相关系数的值见表59 n表59 题目数量对相关系数的影响 题目 数量 1050100200300400500 相关 系数 0.500.830.910.950.9680.9760.980 酗 匣 舆 陀 裸 缴 靖 轿 禁 扫 被 杜 竖 情 替 历 釜 梦 辉 虚 足 权 赋 渊 狞 酞 晚 挂 饲 腮 滁 墟 五 章 节 心 理 测 量 信 度 五 章 节 心 理

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1