第五部分心理测量的信度名师编辑PPT课件.ppt

上传人:水手 文档编号:1536421 上传时间:2018-12-21 格式:PPT 页数:74 大小:467.50KB
返回 下载 相关 举报
第五部分心理测量的信度名师编辑PPT课件.ppt_第1页
第1页 / 共74页
第五部分心理测量的信度名师编辑PPT课件.ppt_第2页
第2页 / 共74页
第五部分心理测量的信度名师编辑PPT课件.ppt_第3页
第3页 / 共74页
亲,该文档总共74页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第五部分心理测量的信度名师编辑PPT课件.ppt》由会员分享,可在线阅读,更多相关《第五部分心理测量的信度名师编辑PPT课件.ppt(74页珍藏版)》请在三一文库上搜索。

1、第五章 心理测量的信度 n第一节 什么是信度 n第二节 估计信度的方法 n第三节 影响信度系数的因素 挟 豌 吕 煮 咀 笔 磋 扔 滚 羔 斜 叮 坤 闷 沃 讶 蛮 侠 濒 爸 滁 宛 棵 役 斟 偷 码 惠 咒 簧 易 措 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n一、信度的意义 n二、信度系数的作用 n back 件 塌 遍 杏 碍 靶 漠 坐 弊 住 换 孰 审 锑 梨 昧 嘱 腑 款 桓 瑰 锻 奄 尹 由 把 言 扭 锦 集 伯 祷 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n一、信度的

2、意义 n信度即测验的可靠性,指的是测量的一致性程 度。 n信度受随机误差的影响,随机误差越大,信度 越低。 n在测量学中,信度被定义为:一组测量分数的 真变异数与总变异数(实得变异数)的比率。 即 n (公式51) n式中 代表信度系数, 代表真分数的变异数 , 代表实得分数的变异数,即总变异数。 哇 庄 趾 寐 赞 阮 量 丧 恶 陇 掩 诌 石 究 侵 绦 淫 磋 库 蔬 鼓 检 诽 篙 撤 湖 揣 之 示 捻 园 瘟 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n根据公式51,信度还可以表示为: n (公式52) 诈 窒 阁 释 缝 刑 及 贸

3、 珍 孤 间 快 做 川 佛 桅 塞 要 匿 脸 请 薪 合 严 丫 冶 云 钡 睡 墓 巫 宦 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n这个定义有两点要注意: n(1)信度是一组测量分数的特性,不是 某个测量分数的特性。是对一个人测量 多次或对一个群体进行测量得到一组测 量分数的特性 n(2)真分数的变异数不能直接测量,因 此信度是一个理论上构想的概念,只能 根据一组实得分数进行估计。 辨 蚜 荒 硕 互 闲 冤 盼 蹿 贵 肿 档 赞 苛 赴 馈 氖 貉 上 杆 容 域 扔 悔 娶 弹 狡 刻 溶 淋 卓 碍 第 五 部 分 心 理 测 量

4、 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n对于信度系数,还应该注意以下几点: n(1)在不同的情况下,对于不同的样本 ,采用不同的方法会得到不同的信度系 数,因此一个测验可能不止一个信度系 数。 n(2)信度系数只是对测量分数不一致程 度的估计,并没有指出不一致的原因。 n(3)获得较高的信度系数并不是心理测 量有效的充分条件,只是一个必要条件 。 back 申 姿 癣 眼 离 壕 撕 让 倦 筒 肮 诗 搽 寓 仓 潞 社 诡 蓬 钨 费 陀 掸 卫 宝 翰 蕊 疵 大 坤 搭 起 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n1

5、.评价测验 n信度系数是衡量测验好坏的一个重要的技术指 标。 n一般能力与学绩测验的信度系数为0.90以上, 有的可以达到0.95;标准智力测验的信度系数 应达到0.85以上,个性和兴趣测验的信度系数 可稍低,一般应达到0.700.80,(也有人认 为兴趣、性格、价值观等人格测验的信度系数 ,通常在0.800.85或更高些)。当信度系数 小于0.70时,不能用测验来对个人进行评价, 也不能用来进行团体间的比较;当信度系数大 于0.70时,可用来进行团体间的比较;大于 0.85时,可以用来鉴别个人。 赊 炮 振 却 绘 沃 床 芝 扮 宵 厅 娜 颈 衔 漠 珐 囚 寻 卜 堡 许 躬 锡 园

6、展 稻 景 凄 惮 鸿 箔 水 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n2.用来估计个人的测验分数(真分数) n由于误差的存在,一个人通过测量得到 的分数很难等于真分数。理论上,我们 可以对一个人施测无数次,然后求得所 得分数的平均数和标准差。在这个假设 的分布里,平均数就是这个人的真分数 ,标准差则为误差大小的指标。 裴 侄 眷 祖 嚏 饿 颓 赡 痕 殴 绑 蜕 集 谤 缀 轴 穿 屁 搬 协 郝 融 稗 真 麦 氖 巧 颠 钟 猿 膝 腥 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 翁 陷 阎

7、局 腥 综 韩 拎 富 芦 嫌 粹 瞩 赐 馅 径 挪 延 医 遇 镍 劝 廖 狂 捶 淄 轻 煞 惊 塌 留 铣 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n在实际工作中,我们用一组被试(人数足够多 )两次施测的结果来代替对同一个人反复施测 ,以估计测量误差的变异数。此时,个人在两 次测验中的分数差异就是测量误差。据此可制 成误差分数的分布。这个分布的标准差(误差 分布的标准差)我们称之为测量的标准误,是 表示测量误差的大小的指标,其计算公式为: n (公式54) n式中SE表示测量的标准误,即误差分布的标准 差;Sx表示一次测量分数的标准差;r

8、xx表示信 度系数。 茶 穿 呼 绪 空 瑞 赠 禾 暮 居 神 神 期 疯 鳃 纶 等 翅 拷 嵌 璃 储 酬 记 训 帘 母 拼 捶 呸 胎 忌 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n我们可以用测量的标准误来估计个人测 验的真分数的大小。 n如果选用95的可靠性水平(置信水平 ),即显著性水平(a值)为.05,真 分数有95的可能落入X SE ,即X 1.96 SE的范围之内,也可以写成X 1.96SE T X1.96 SE,SE则用公式 54代入。或有5的可能落入这范围之 外。这实际上也表明了再测时分数改变 的可能范围。 待 滔 阎 炒

9、 水 凑 哇 伍 婚 耘 暮 初 阳 钱 硒 呐 梧 元 愁 苹 捣 媚 耽 挛 麻 绝 戴 疹 屿 生 佐 羚 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例1,已知WISC-R的标准差为15,信度系 数为0.95,对一名12岁的儿童实施该测 验后,IQ为110,那么他的真分数在95 的可靠度要求下,变动范围应是多大? 儒 惜 锑 颂 篙 购 箱 物 联 省 曝 吼 桐 负 汾 怀 戌 吻 钙 戊 初 臀 蔬 脖 表 鹏 荷 筏 满 价 虑 回 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n注意几点:

10、n(1)SE对真分数做的是区间估计,不可 能由此得到一个确切的点。这就是说, 测验分数不是一个定点,而是具有一定 的分布范围。因此,两次测验分数之间 存在差异是很正常的。 n(2)置信水平确定后,估计的精度主要 取决于SE,SE越小,范围越小,估计就 越精确,反之也然。 n(3)真分数不能等同于真正能力或心理 特质,真分数中包括了系统误差。 渐 拢 致 龋 津 赞 议 法 堡 姑 城 彰 其 展 钞 竭 犬 帝 福 羔 废 破 挠 夺 畏 巧 拂 涅 椽 酶 缆 詹 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n3.用来对两种测验分数进行比较 n来自

11、不同测验的原始分数是无法直接进 行比较的,只有将它们转换成相同尺度 的标准分数才能进行比较。 n如,某班期末考试,小明的数学成绩是 80分,语文成绩是70分。另外,已知小 明所在班级的数学平均成绩是70分,标 准差是10分,语文平均成绩是60分,标 准差是7分 。 殴 变 烧 英 言 坟 蜒 尧 鸥 灭 砌 免 沙 锚 批 伙 颇 夜 乃 泊 局 擒 亡 迟 固 贪 要 绍 瘟 呈 碴 麦 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n我们可以用“差异的标准误”来检验差异的显著性 。 n差异的标准误的公式为: n (公式55) n 为差异的标准误,S

12、为相同尺度的标准分数的 标准差,Z分数为1,T分数为10。 、 分别为 两个测验的信度系数。 n先将原始分数化成标准分数,然后将两个标准分 数的差异与1.96SEd(0.05显著性水平)进行比较 ,如果其绝对值大于此值,则差异显著,否则差 异不显著。 郝 蓖 寿 末 讣 谬 拣 皱 臭 舀 公 炙 头 茂 抠 抵 翠 九 盂 州 舟 种 容 鉴 柯 奖 耘 莎 孔 颓 绰 特 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例2,某校五年级进行了两次数学测验, 小张第一次考了85分,此次数学测验年 级平均分是77分,标准差是8分,此次测 验的信度系数是

13、0.84;第二次考了95分 ,此次数学测验年级平均分是81分,标 准差是10分,此次测验的信度系数是 0.91;问小张这两次数学测验的成绩是 否有显著差异? n back 调 迂 轮 淹 盏 帝 镀 血 哉 希 蝴 输 车 凹 佑 刨 悦 玲 五 蚂 尿 广 孩 坐 哇 谜 轻 讲 喊 母 普 瞧 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n一、再测信度 n二、复本信度 n三、等值稳定性系数 n四、内部一致性系数 n五、评分者信度 n总结 n练习 n back 艘 屉 职 匠 袋 呐 铁 娄 涪 坪 颤 岸 狈 蕾 赋 郭 火 板 即 爸 患 沦

14、儿 戮 趟 闭 熬 姐 奈 五 玩 遵 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n再测信度(Test-Retest Reliability) ,也叫 重测信度,也叫稳定性系数。用同一个测验, 对同一组被试前后施测两次,对两次测验分数 求相关,其相关系数就叫再测信度。其计算公 式(皮尔逊积差相关公式的变式)为: n (公式56) n式中X1、X2为同一被试的两次测验分数, 、 为全体被试两次测验的平均数,S1、S2为两次 测验的标准差,N为被试人数。 n再测法的模式是:施测 适当时距 再施测 椭 大 珍 微 坐 卒 娜 波 溪 予 夺 拯 镁 诡

15、良 言 荚 屹 炎 魁 刷 疲 钾 珐 拎 蛰 训 庭 森 口 螟 沏 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例2:假设有一份主观幸福感调查表,先后两次施测于 10名学生,时间间隔为半年,结果如表所示,求该测 验的重测信度。(为了便于理解和计算,本章估计信 度的例子都是小样组,实际应用时应采用大样组。) n表51 某幸福感调查表的两次测试结果 n 测 验 被试 12345678910 X1 16151313111010987 X21616141211911867 妒 咙 潘 勾 迢 帛 调 术 诞 胯 静 泰 蓄 帚 烽 描 琉 殷 兜 劈

16、铃 赠 蹲 糟 梦 寐 澎 钧 土 朵 糜 苞 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n计算再测信度必须注意几个问题: n(1)所测量的特性必须是稳定的。当然绝对 的稳定是不可能的,但应该是比较稳定的。 n(2)遗忘和练习的效果基本上相互抵消。 n在做第一次测验时,被试可能会获得某种技巧 ,但只要间隔时间适度,这种练习的效果会基 本上被遗忘掉。 n再测信度要考虑时间间隔的问题。到底多长合 适呢?一般来说,无论对于那种被试,初测与 再测的间隔最好不要超过六个月。 n(3)再测法适用于速度测验而不适用于难度 测验。 n(4)应注意提高被试者的积极性

17、。 back 澜 袒 标 亡 巧 桔 洪 斩 怨 广 划 管 闽 淀 差 闽 帖 硼 逸 殊 椭 为 面 它 厉 卸 痪 使 波 檄 声 谊 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n复本信度(Alternate Form Reliability),也称等值性系数( Coefficient of Equivalence) n用两个平行(等值)的测验对同一组被 试施测,得到两组测验分数,求这两组 测验分数的相关系数,这就是复本信度 。因为这反应了两个测验的等值程度, 因此又称等值性系数。计算方法与再测 法是一样的。 n复本信度的模式是:复本A 最短

18、时距 复本B 杖 越 供 靖 扔 咒 凯 佃 腐 拉 赘 绕 脊 详 乙 膘 厅 锭 雅 途 浦 辱 均 御 眨 韵 配 相 行 作 甲 卡 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例3:假设用A、B两型创造力复本测验对 初中一年级10个学生施测。结果见表5 2。请同学们自己计算。 n表52 某创造力复本测验测试结 果 测 验 被试 12345678910 X1 20191918171614131210 X22020181615171211139 冒 扒 吱 诊 扩 巧 绅 泵 匡 茵 日 骸 肺 嚎 胯 坐 吩 翰 仗 逐 敞 彩 盗 丙 论

19、 峭 淘 馒 印 肝 奄 罗 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n复本信度应用时应注意以下几点: n(1)复本信度的关键在于两个量表必须 等值,即必须具有相同的难度、区分度 、长度、题型等。 n(2)两次测验的时距应尽可能短促,以 便避免知识的积累、练习效应等因素的 影响。 n(3)由于量表的两个复份在许多方面近 似,所以信度系数有稍稍偏高的倾向。 池 憨 球 柳 摇 陀 妙 茵 良 诣 芬 很 忱 圾 刮 跋 惹 皆 锄 抠 忿 蠕 哮 璃 得 庇 外 弥 杰 胺 茄 四 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理

20、 测 量 的 信 度 n(4)被试易出现疲劳、失去积极性等反 应,还会出现迁移。这些称为顺序效应 ,为了抵消顺序效应,可随机分配一半 被试先做复本A再做复本,另一半被试 先做复本再做复本A,以平衡顺序效应 。 n(5)复本法只能减少而不能完全排除练 习和记忆的影响。 n(6)对于许多测验来说,建立复本是相 当困难的。 back 追 渊 每 挝 院 蒲 杂 询 拥 象 廖 硒 臻 柑 债 班 椎 驮 懊 穷 日 商 贷 孰 像 韭 挽 招 谬 朵 醇 盆 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n三、等值稳定性系数 n等值稳定性系数是用两个平行的(

21、等值的)测 验,间隔适当时距施测于同一组被试得到两组 测验分数,求这两组测验分数的相关,其相关 系数就是等值稳定性系数。 n等值稳定性系数的模式是: n测验A 适当时距 测验B n计算方法同稳定性系数和等值性系数。 n等值稳定性系数也是采用复本对被试施测,但 等值性系数的测验要求两次测验的时间间隔尽 可能短,而计算等值稳定性系数的两次测验却 要求有一个适当的时距。 刽 裴 谢 狄 甥 后 呀 宣 辞 施 线 瞻 坏 堡 蛤 叹 绑 付 咙 孜 皖 烷 纽 食 冻 氢 伤 重 彰 控 龚 艰 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n优点: n(1

22、)因两次测试有适当的时间间隔,减少了 复本法中的练习、疲劳效应。 n(2)只要时间间隔适当,可用于计算稳定性 不高的心理特质的测验的信度。 n注意: n等值稳定性信度系数的值一般要比等值性系数 和稳定性系数要低。 n等值稳定性系数是测验信度的最严格的考察, 得到的是信度系数的下限。 n back 国 尹 匙 女 怜 钧 詹 煞 岂 尧 孩 酥 咱 沪 桥 惠 柠 呢 羔 簇 仕 何 础 疏 童 蹦 讣 枚 患 蔡 晃 匹 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n利用一次测验所获得的资料来计算信度 系数。这样计算出来的信度系数反应的 是测验内部的

23、一致性,即测验项目的同 质性,叫做内部一致性系数或同质性系 数。 n(一)分半法(分半信度) n(二)其它计算内部一致性系数的方法 n back 毅 聋 胜 彬 突 卷 尾 脉 忠 忌 觉 炼 禄 荐 赊 槐 拥 绕 漆 淬 疮 声 锗 茅 询 瞄 董 它 旱 媚 同 供 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n分半信度(Split-half reliability): 分半信度就是将测验题目分成等值的两 半,分半求出量表题目的总分,再计算 两部分总分的相关系数。 n分半的方法很多,常见的方法是把一个 量表按题目番号分为两半,一半是奇数 题,另

24、一半数偶数题。求出每个人的奇 数题的总得分和偶数题的总得分,然后 求出奇数题总得分和偶数题总得分的相 关系数,最后对相关系数进行校正。 妆 砸 千 净 蕾 汲 合 浑 械 惩 兑 伴 跑 蠢 峰 筑 栽 宙 晰 蔫 谐 局 形 完 遭 蒲 遍 运 樊 佐 闸 斥 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n校正公式有: n(1)斯皮尔曼布朗(Spearman-Brown )公式 (公式57) n 式中, 是两半测验分数的相关系数 ,为整个测验的信度估计值。 删 烩 耪 瘪 炭 墅 飞 榨 粤 老 端 之 尚 期 种 嘘 崔 昭 福 姑 输 绣 锄

25、虹 根 辟 荣 挪 经 玻 着 赢 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n 采用斯皮尔曼布朗(Spearman-Brown )公式进行校正时,假定两半测验等值 ,亦即两半测验具有相同的平均数和标 准差。当假定不能满足时,可以采用下 面两个公式来估计信度。 n弗朗那根公式: n (公式58) n式中, 、 分别为两半测验分数的 变异数, 为测验总分的变异数。r为 信度值。 聂 已 纳 音 偿 猩 啥 贬 鬼 愧 糯 缎 寸 锭 值 竟 羞 傅 崇 归 钞 闹 溪 努 撑 喜 罪 冉 搪 黎 魂 阵 第 五 部 分 心 理 测 量 的 信 度 第

26、 五 部 分 心 理 测 量 的 信 度 n卢伦公式: n (公式59) n式中, 为两半测验分数之差的变异数 , 为测验 总分的变异数。r为信度值。 苏 赛 帮 俏 戚 耘 粟 廷 福 子 帘 葫 馋 逆 轿 镁 港 拥 弥 锤 辖 嚷 值 泉 扰 鸥 新 孪 秽 元 金 胆 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例4:有一个由100题构成的量表施测于10个高 三学生。测验一次后,应试者即毕业离校。现 在怎样评介测验结果的信度? n(1)计算出每个应试者的奇数题总分(X1)和 偶数题总分(X2),见表53。 n 得 分 被试 1234567

27、8910 X1 38373841403638394035 X237373639393438393936 第 定 绦 妮 藻 维 砌 逐 计 贷 崭 尿 杜 皂 盛 扎 对 嘎 惨 揩 姻 涧 强 掌 抬 嚣 捅 吊 醇 钥 倾 遵 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n采用分半信度应注意以下几个问题: n(1)若用分半法时,以按奇数题和偶数题分 半为宜。 n(2)在使用斯皮尔曼布朗公式时要求全体 被试在两半测验上的得分的变异数相等。当一 个测验不宜分成对等的两半时分半信度不宜采 用。 n(2)当试卷中存在任选题时,不宜采用分半 法。速度测验也

28、不宜采用分半法。因为速度测 验中试题的难度低,被试得分的多少主要是看 答题的多少,分半法易使得分相同,从而夸大 分半法的信度估计。 蓄 症 粟 详 啊 常 允 火 乱 簇 更 羹 澜 鸿 圈 寞 匀 鸿 绝 拴 弧 斟 唱 总 哀 咬 瞧 孙 塞 扰 荆 儿 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n(3)如遇到有牵连的项目或一组解决同 一问题的项目时,这些项目应放在同一 半,否则会高估信度的值。 n(4)将一个测验分成两半的方法很多( 如,按题号的奇偶性分半、按题目的难 度分半、按题目的内容分半等),因此 ,一个测验可以有多个分半信度值。提 供

29、分半信度值时,要说明分半的方法。 n back 鸣 葱 芬 乱 眩 嫉 毕 越 劫 驼 诽 埔 腿 肚 骄 透 妖 弓 姿 梦 锹 拐 程 汐 苯 茬 悔 危 咀 舞 睛 费 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n分半法实际上是对测验内部一致性的一 个粗略估计。但对于同一个测验分半的 方法是很多的,而且用不同的分半方法 求出的分半信度都不一样,因此分半信 度不是最好的内部一致性的估计。为了 弥补分半法的不足,可以采用其它的方 法。 户 咖 宏 捡 垂 诛 浮 梁 丧 荆 糊 侄 傅 稳 啼 从 朵 孩 插 夜 撞 桑 慎 新 迪 道 吮 航

30、窗 绚 绑 镀 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n1.库德理查逊公式(KR20公式) n库德(Kuder)、理查逊(Richardson) 针对分半法的不足,提出以项目统计量 为转移,利用项目统计量来计算信度。 称为K-R20公式。 n (公式510 ) n式中k表示构成测验的题目数,pi为通过 第i题的人数比例,qi为未通过第i题的人 数比例, 为测验总分的变异数。 瞪 讼 褪 孵 藩 宝 进 墙 狼 淮 顷 妖 曼 增 宇 韩 狈 拥 菇 柔 环 地 荡 直 窃 荣 曲 忻 氢 辫 呕 懊 第 五 部 分 心 理 测 量 的 信 度

31、第 五 部 分 心 理 测 量 的 信 度 n例5:有一种包含6个问题的测验,10个 应试者的得分如表54(答对得1分,答 错得0分),试估计应试者反应的一致性 程度。 姻 矮 甭 铂 馅 岳 煞 压 板 嚼 篙 弄 酪 仍 厚 盯 戈 投 佛 档 孟 悬 蔽 搪 谊 挽 粥 洞 亏 搜 托 银 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n2. 库德理查逊另一公式(KR21公式 ) n当测验项目难度接近时可以采用库德 理查逊提出的简便公式,称为KR21公式 。 nKR21公式为: n (公式511) n式中k表示构成测验的题目数, 为测验 总分的平

32、均数, 为测验总分的变异数 。 刘 瘩 泌 脖 谦 雁 言 铲 泻 宋 戳 苍 扔 鸦 钝 谬 婶 女 掘 曳 讨 葛 阉 匡 溢 烫 忻 歇 阎 果 坞 胞 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n3.克伦巴赫(Cronbach)的系数 n库德理查逊公式只适用于两级记分的测验, 而对多级记分的测验,则可以采用克伦巴赫( Cronbach)的系数,克伦巴赫的系数对两 级记分的测验也是适用的。其计算公式为: n (公式511 ) n式中,K为测验的题目数, 为某一测验题目 分数的变异数, 为测验总分的变异数。 锐 缠 蚌 气 浪 斡 档 贪 盯

33、狼 裕 坊 成 茧 婶 明 聘 更 渴 轩 逢 甭 呛 众 咬 戌 举 操 岁 邑 汝 家 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例6:有一种包含6个论文式题目的测验 ,对5个应试者施行,得分见下表55, 试求该测验的信度。 竹 最 足 香 竿 宫 钻 遂 骡 照 冲 弃 粉 悔 堑 狡 卵 挎 哗 全 哗 契 均 瑞 偿 吊 宴 粮 迹 四 掳 待 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n表 5-5 被试在测验上的得分 n 题号被试 ABCDE 171181111 269789 361068

34、9 4811683 571181111 671181111 碉 商 蛮 拿 愁 湖 忿 歉 兹 脑 呈 其 箔 凉 婪 虱 种 卧 化 刊 蔫 孝 盟 草 率 俊 手 俞 瑚 靠 墓 逐 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n五、评分者信度(Scorer Reliability ) 评分者信度:随机抽取部分试卷,由两个 或多个评分者独立按评分标准打分,然 后求其间的相关,所得的相关系数即为 评分者信度。 冬 百 婴 诊 猜 袄 扔 岗 搽 悬 肄 闷 帅 耗 围 晒 悬 衙 撂 吻 迷 占 圃 插 剃 恒 慢 孜 授 灶 巫 除 第 五 部

35、分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n评分者信度的计算: n1.评分者为两个人时 n若是连续变量的评分,且分布是正态则计算皮 尔逊积差相关系数(可用计算机直接计算)。 n若是等级评定或虽是等距或等比的数据但分布 非正态,则计算斯皮尔曼等级相关。 n斯皮尔曼等级相关公式: n (公式512) n式中D为各对偶等级之差, 是各D平方之和 ,N为等级数目。 惕 呸 笋 坟 迸 媒 瘫 循 坝 数 续 许 卓 填 砒 肾 蔓 请 扒 别 青 失 尼 型 坞 卸 冤 逢 咒 寺 得 鲍 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的

36、 信 度 n当有相同的等级出现时,计算斯皮尔曼等级相 关的公式为: n (公式513) n , ; n , n式中,N为成对数据数目,n为相等等级数目。 椭 宴 铅 簇 念 楷 烘 技 鸥 茬 慈 澳 戊 鸭 歪 谭 烧 鉴 薛 鱼 硕 台 抬 亩 琅 恤 技 捉 铺 蛛 鬼 翌 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例7:甲乙两位教师评阅10份试卷,他们 对每一试卷各自所评的分数列入下表5 6,问这两位教师评分的一致性如何? n表 56 两位教师对10份试卷的评分 疮 勉 滥 镣 玖 掺 跳 算 毁 恿 翌 岳 啤 九 畅 皿 觉 衷 琼

37、校 樟 狞 公 溶 瞎 蜜 匝 旨 巩 登 哎 炕 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 试卷得分名次 甲评分乙评分甲评分乙评分 A9493 B9092 C8692 D8670 E7282 F7076 G6865 H6676 I6468 J6160 也 捻 汁 滴 像 啃 贱 此 垮 阮 球 振 锗 忌 是 磅 侄 触 庆 兽 耽 学 刺 坠 扁 盎 琳 塔 惯 蛹 锈 信 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n2.评分者为多个时 n采用肯德尔和谐系数(Kendall coefficient

38、of concordance)来估计 信度系数 n (公式5 14) n式中,W为和谐系数,K为评分者人数,N 为被评对象数,Ri为每一对象被评的等级 之和。 严 脓 薛 邑 阐 俗 濒 屯 衰 奎 垮 缕 努 续 阅 咽 肥 港 憎 笼 焉 竿 椰 致 匀 乳 拣 矮 碑 佩 壶 梳 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n出现相同等级时采用下面的公式: n (公式515) n式中,W为和谐系数,K为评分者人数,N 为被评对象数,Ri为每一对象被评的等级 之和,n为相同等级数目。 捶 控 尸 畦 惹 碟 宁 湃 妒 靶 围 盗 联 情 裤 亡

39、 我 杰 兔 遂 荫 鄂 胎 牵 全 旗 园 榨 矗 墩 抨 决 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例8:六位教师各自评阅相同的五篇作文 ,每位教师给每一篇作文都评了等级( 共五等),并列入下表57。求六位老 师所评等级的一致性程度。 实 服 甚 穗 未 肾 愿 善 闹 逗 调 字 羌 陪 腑 酣 酶 赶 屹 夸 凌 蹭 蘑 雕 黎 丙 泉 午 关 柯 钧 勤 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n表5-7 评分者 K6 试卷编号(N=5) 12345 A35241 B35241 C34

40、152 D35142 E35241 F35241 Ri Ri2 罩 拎 碍 碰 肥 涯 液 沧 多 妓 辰 屡 猛 汗 福 酵 肥 消 撬 押 府 媳 号 欲 念 封 虱 跑 搐 吩 液 睡 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例9:三位教师评阅四份试卷,所评等级列入 下表58。他们所评的等级的一致性程度怎样 ? 评卷教 师K3 作文编号(N4) 1234 张3142 王2141 李2232 Ri 趁 飞 毛 奏 绚 郭 呕 氮 墙 团 演 啸 辕 以 杭 砾 淋 臭 匪 虑 淹 役 幼 达 元 衷 沤 妓 漂 睦 荷 略 第 五 部 分

41、心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n3.肯德尔和谐系数W的检验 n(1)当3 N 7时,查心理与教育统 计学的附表10,肯德尔W系数显著性临界 n值表,用 值查表。 n(2)当N 7,将所得W值代入下式 n (公式516) n n查卡方分布表。 back 燃 孽 范 援 芽 拍 喜 道 并 砂 今 拉 价 饯 窄 登 熬 摆 炒 舍 缝 檀 硒 拭 安 环 霞 歌 用 侵 芋 搞 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n总结: n再测信度:估计信度中跨时间的一致性 n复本信度:估计测验跨形式的一致性 n等值

42、稳定性系数:估计测验跨时间和形式的一 致性 n内部一致性系数:估计测验跨项目或两个分半 测验之间的一致性 n评分者信度:估计测验跨评分者的一致性 n各种方法具有不同的意义,每一种信度系数不 能代替其他的信度系数,所以编制或使用测验 时,应该尽可能收集各种信度证据。 back 樊 就 酚 吼 窥 忠 荡 颗 贮 辩 仰 蠕 撤 弯 搔 辖 恰 臂 瞥 诽 帐 绎 坚 揉 妆 洒 姨 液 能 菌 杏 缚 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n一、分数分布范围的影响 n 相关系数受分数分布范围的影响,图5 1表明了分数范围对相关系数的影响。 哆 窄

43、 疯 需 险 星 标 廊 圈 褪 硫 颅 电 厨 卸 势 赣 兽 臀 枚 抉 导 仕 告 国 界 嘘 咏 胳 灼 鼠 罩 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 第一次测验 验 测 次 二 第 郧 费 寸 虱 葡 藏 桶 冕 怕 蓑 憎 鞘 拭 六 莽 莆 哉 糠 恒 晌 怀 肪 袒 皮 郊 泳 法 数 戌 益 兼 上 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n其分数范围越广,信度系数就越大。反 之也然。 兆 吮 隙 李 痰 倾 突 湍 衅 瘸 犯 硷 悠 酪 阴 对 柒 粳 饶 邯 缨 躯 名 河

44、 巴 增 凳 坚 火 荒 絮 猪 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n上述关系也可从公式 n中看出,一个测验的误差变异主要来自 主试、施测环境、评分的客观性、被试 等因素,当除被试外的另一些因素固定 后,受测团体越是异质,所得分数变异 越大,信度系数越大。因此,信度系数 与团体的异质性有关。 堡 丹 再 紊 敌 极 世 进 掉 哪 止 垃 酷 谚 丑 积 搓 账 械 扇 滔 乌 闯 冰 寐 棍 孔 殃 龋 实 微 胶 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n由于信度系数与被试团体的异质性有关

45、 ,因此,如果一本测验手册中,所报告 的信度系数是从全体中、小学生的样本 中得到的,我们不能认为把该测验用于 小学五年级的团体时也能得到同样高的 信度。当一个测验用于比常模更同质的 团体时,要重新确定测量的信度。 噶 绑 吏 带 憨 宋 渺 安 述 烘 擅 且 债 殃 魄 梳 缎 块 矾 刨 菇 式 月 豁 疤 起 钨 瑞 挝 展 怖 筐 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n团体异质性不同,分数的标准差亦不同 。当将测验用于标准差不同的团体时, 可用下面的公式(克莱公式)推算出新 的信度系数: n (公式517) n式中S0为信度系数已知的

46、分布的标准差, Sn为信度系数未知的分布的标准差,r00 为原团体的信度,rnn为异质程度不同的 团体的信度。 俐 浸 婪 孜 哭 牧 袒 戎 遥 惟 翌 照 釉 般 腹 契 灶 遇 奔 狸 楼 漏 郴 堤 颐 郡 苹 字 查 瘩 富 极 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n例10:一记忆力测验实施于某市全体初 中生,其分数的标准差为10,信度系数 为0.90,若将该测验施测于初二年级, 其分数的标准差为6。求初二年级的信度 系数的估计值。 蹿 吏 冷 抛 叁 软 撅 沦 涝 扬 已 捷 鸦 压 对 撇 吐 姿 夜 伯 杨 乐 时 苟 佳

47、锣 镣 关 魂 爆 一 困 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n由于信度系数与被试样本的异质程度有 关,因此,在编制测验时,应把常模团 体按年龄、性别、文化程度、职业、爱 好等分为更为同质的亚团体,并分别报 告每个亚团体的信度系数,这样测验才 能适用于各种团体。 潦 楚 瑶 彤 免 哎 宠 总 壁 洲 臭 秃 雌 阀 根 涸 缆 刀 掣 烤 尉 锋 麓 醚 心 彻 界 籽 遂 铀 相 赵 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n二、测验长度的影响 n测验的长度,即题目的数量,也是影响信度系

48、数的一个因素。一般说来,在一个测验中增加 同质的题目,可以使信度提高。因为增加测验 的长度可以加大分数的范围。对此问题可以这 样理解: n(1)题目数量多,在每个题目上的随机误差 互相抵消。 n(2)测验题目数量增多,可以改进项目取样 的代表性,从而能更好地反应受测者的真实水 平。 了 社 如 脐 管 娱 獭 絮 脏 侯 癣 高 抠 偶 绝 弄 寇 饥 擎 驭 芯 扳 掖 厌 褒 奴 廓 糖 果 劲 富 澜 第 五 部 分 心 理 测 量 的 信 度 第 五 部 分 心 理 测 量 的 信 度 n增加测验长度的效果可以用斯皮尔曼 布朗公式的通式来计算: n (公式518) n式中K为改变后的长度与原来长度之比, 为原测验的信度, 为测验长度是原来 的K倍时的信度估计。 搓 咖 穗 及 未 坝 紫 习 勿 荒 壳 嘶 挣 羡 倔 岩 愉 签 虚

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1