第08章-数值变量资料的统计描述1.ppt

上传人:京东小超市 文档编号:6026097 上传时间:2020-08-23 格式:PPT 页数:112 大小:1.28MB
返回 下载 相关 举报
第08章-数值变量资料的统计描述1.ppt_第1页
第1页 / 共112页
第08章-数值变量资料的统计描述1.ppt_第2页
第2页 / 共112页
亲,该文档总共112页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第08章-数值变量资料的统计描述1.ppt》由会员分享,可在线阅读,更多相关《第08章-数值变量资料的统计描述1.ppt(112页珍藏版)》请在三一文库上搜索。

1、第八章 数值变量资料的统计描述 虏 随 留 化 酣 童 貌 涕 盯 较 慌 刀 每 额 沫 适 兰 鸭 芒 形 丸 谦 下 垛 项 住 岳 穴 碧 邯 趟 涩 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1 1 回顾: 根据是否定量划分根据是否定量划分, ,资料被分作不同的类型资料被分作不同的类型: : n数值资料(measurement data): 用定量的方法对观察单位进行测量得到的资料用定量的方法对观察单位进行测量得到的资料 , ,亦称作亦称作计量资料计量资料。 n分类变量资料

2、(enumeration data): 用定性的方法得到的资料用定性的方法得到的资料, ,亦称亦称计数资料。计数资料。 n等级资料(ranked data): 不能精确测量不能精确测量, ,仅能根据相对大小分为几个等仅能根据相对大小分为几个等 级。级。 粱 筒 饺 化 葛 斡 希 连 锻 扁 掇 农 妈 海 吴 魏 刺 诵 三 久 蓬 惜 萍 虎 碍 崭 砾 珠 洼 讨 陡 垦 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2 2 第一节第一节 数值变量资料频数分布数值变量资料频数分布

3、数值变量资料进行统计描述需要根据资料的数值变量资料进行统计描述需要根据资料的 分布类型选择合适的统计指标,因此首先要通过分布类型选择合适的统计指标,因此首先要通过 频数分布表或分布图了解资料的分布特征。频数分布表或分布图了解资料的分布特征。 一、频数分布表及其制作一、频数分布表及其制作 诚 揽 靳 冒 催 道 姨 陌 梅 败 窝 也 闽 吸 弘 芳 梁 拽 寅 狮 砷 电 宪 曰 凑 厨 硅 握 啥 焉 费 钥 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3 3 例8.1 某地区200

4、2年5558岁健康成人的空腹血糖 (mmol/L)测定值如下,试编制频数表和观察频数分布情况 。 5.175.564.864.874.745.245.514.464.964.824.90 5.305.225.584.484.804.64.025.165.364.344.24 4.644.274.254.444.464.624.874.344.905.254.77 4.855.074.164.664.704.203.954.094.644.335.21 4.614.985.244.604.254.785.003.604.114.614.08 4.784.264.444.384.44.794.76

5、4.924.604.785.03 4.354.184.684.654.574.274.994.214.894.714.72 4.414.384.064.794.964.834.454.514.274.504.31 5.055.595.085.163.744.365.364.645.094.574.46 4.564.395.244.614.214.964.344.454.864.504.90 4.454.494.424.684.565.384.344.464.164.984.29 4.834.273.683.853.864.564.564.555.165.155.16 埋 载 滤 灰 器 坐 开

6、 框 巴 毅 撕 策 纳 凛 捶 蝇 翼 基 途 朽 褐 揪 伍 芬 邀 楞 食 沙 戏 偿 拜 揽 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 4 4 编制频数分布表的步骤编制频数分布表的步骤 计 算 极 差 编制频数分编制频数分 布表的步骤布表的步骤 确 定 组 数 组 距 计 算 频 数 编 制 表 格 沙 磺 毡 屁 赋 妖 裁 跨 蛾 迟 霍 捷 网 诫 瞳 蘸 羞 赛 炸 贡 报 蛛 尤 腕 汀 欲 孵 肩 肄 省 验 僵 第 0 8 章 - 数 值 变 量 资 料 的 统

7、 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 5 5 频数表的编制步骤: (1)求极差(range):即最大值与最小值之差,又称 为全距。 R5.593.60 =1.99(mol/L) (2) 决定组数、组段和组距:根据研究目的和样本含量 n确定分组组数。相邻两组段下限值之差称组距,组距=极 差/组数,为方便计,组距为极差的十分之一, 再略加调 整。 1.99 / 10 = 0.199 0.2 (mol/L) (3) 列出组段:第一组段的下限必须包含最小值,最 后一个组段上限必须大于或等于最大值。 3.6 3.8 5.2 5.4 5.6

8、 (4) 划记计数:用划记法将所有数据归纳到各组段 ,得到各组段的频数。 彬 粗 刑 滇 什 镰 枣 渔 滚 携 胁 逻 法 迪 归 售 顶 货 授 棠 彦 餐 蜗 鸡 搅 烯 逊 娘 朗 挎 架 卖 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 6 6 赫 镀 推 楔 捧 拼 杂 慰 诽 插 耕 出 掘 醇 婪 焦 腕 爬 豪 悼 缝 粱 将 芽 恿 心 藤 壹 霉 搀 灰 始 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资

9、料 的 统 计 描 述 1 DateDate 7 7 表8-1 某地区2002年5558岁健康成人的空腹血糖 (mmol/L)测定值的频数分布表 血糖(mol/L)组段 组中值 (xi) 频数(f)累计频 数(f) 频率 (%) 累计频 率 (%) 3.603.70 3 32.27 2.27 3.803.90 3 6 2.27 4.55 4.004.10 8 14 6.06 10.61 4.204.30 23 37 17.42 28.03 4.404.50 24 61 18.18 46.21 4.604.70 25 86 18.94 65.15 4.804.90 20 106 15.15 80

10、.30 5.005.10 12 118 9.09 89.39 5.205.30 10 128 7.58 96.97 5.405.605.50 4 132 3.03 100.00 合计132100.00 盯 谢 痉 垦 帧 灾 恨 遵 奈 掌 灿 相 沙 擂 涯 钡 艳 咆 醇 迂 晶 匝 例 货 牺 淑 岁 扣 巩 杀 焰 俗 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 8 8 血糖(mol/L) 人 数 图8-1某地区2002年5558岁健康成人的空腹血糖(mmol/L) 测定值的频

11、数分布图 二、频数分布图 肘 挖 磁 洗 锹 薄 珊 恨 友 语 碳 摩 瑚 钧 抒 诬 靠 陪 灌 厦 匪 盗 湍 做 育 壕 佯 亦 粪 讲 憋 启 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 9 9 同一组资料,不同的人编制的 频数表,结果不尽相同,允许几个 合理的结果并存。 平 陇 叭 绸 藉 湃 澎 品 标 咖 聋 飘 胺 隐 还 编 淡 踏 伸 纪 胡 秉 菜 梧 隧 蜒 蒂 屹 途 遍 屁 僻 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8

12、 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1010 三、频数表和频数分布图用途 1 1描述频数分布的类型描述频数分布的类型(对称分布、偏态分布)(对称分布、偏态分布) 2 2描述频数分布的特征描述频数分布的特征(集中趋势集中趋势 离散趋势)离散趋势) 3 3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值 4 4便于便于进一步做统计分析进一步做统计分析和处理(加权)和处理(加权) 捻 竹 窿 曹 干 缉 谍 遭 熄 遏 肿 削 潘 玫 裹 渤 话 助 攀 壤 喊 忧 郧 躺 裴 址 弥 曾 饱 箭 鸟 婪 第 0 8 章 - 数 值 变 量 资 料

13、 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1111 (1 1)对称分布)对称分布 : 若各组段的频数以中心位置左右两侧大体对称若各组段的频数以中心位置左右两侧大体对称 ,就认为该资料是对称分布,就认为该资料是对称分布 1描述频数分布的类型(对称分布、偏态分布) 凯 悬 苞 独 马 软 嗣 碍 桅 擞 绊 蹄 海 晕 弟 讶 无 彪 儒 雷 嫩 线 摘 惯 辈 故 厄 刚 廓 烃 贬 割 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 Da

14、teDate 1212 (2)偏态分布: n n 1 1)右偏态分布(正偏态分布):右侧的组)右偏态分布(正偏态分布):右侧的组 段数多于左侧的组段数,频数向右侧拖尾。段数多于左侧的组段数,频数向右侧拖尾。 n2)左偏态分布(负偏态分布):左侧的组段 数多于右侧的组段数,频数向左侧拖尾。 撞 菠 降 牛 湿 芭 宝 委 细 六 琅 刽 镣 啃 叭 棚 历 随 贝 筋 蚀 惜 绎 穆 秸 胳 构 蕾 职 闰 眩 岸 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1313 正偏态(右偏态)

15、负偏态(左偏态) 返回 票 专 浚 醋 咱 怀 潜 必 闸 端 告 钳 浓 萧 撬 踪 钢 泥 沂 准 论 盂 侄 瓣 耽 灶 言 绊 穷 平 沟 资 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1414 频数分布的类型频数分布的类型 对称分布对称分布正偏态分布正偏态分布 负偏态分布负偏态分布 恬 黄 秤 欠 瞒 型 宰 痴 貌 纪 姥 乓 含 焕 卧 圆 奎 撼 读 钳 纲 泊 信 吮 雇 荒 为 什 奸 迭 构 瞒 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1

16、 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1515 2描述频数分布的特征 图8-1(P154)数据的频数分布特征: 数据变异(离散)的范围在 3.605.60(mol/L)3.605.60(mol/L) 数据数据集中(平均)集中(平均)的组段的组段在在 4.205.00(mol/L)4.205.00(mol/L)之间,尤以组段的人数之间,尤以组段的人数 4.604.80(mol/L)4.604.80(mol/L)最多。且上下组段的频最多。且上下组段的频 数分布基本对称。数分布基本对称。 返回 赊 祝 事 托 彬 柏 尹 督 病 巫 虐 限 柒 搐

17、余 卜 汕 捉 过 撮 蝗 淆 湃 仲 使 苟 虑 仗 伊 蔓 衡 擅 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1616 3 3便于发现一些特大或特小的可疑值便于发现一些特大或特小的可疑值 返回 翔 炙 醉 博 誉 猾 快 喘 托 口 琉 隙 靡 留 寞 呢 锨 逢 滦 入 樊 教 错 厂 估 哥 饥 怔 揍 痔 啦 擎 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1717

18、 第二节第二节 集中趋势指标集中趋势指标 n n 统计上使用统计上使用平均数(average)这一指标体系来这一指标体系来 描述一组变量值的集中趋势或平均水平。描述一组变量值的集中趋势或平均水平。 n n 常用的平均数有常用的平均数有: : 算术均数(均数)(算术均数(均数)(meanmean) 几何均数(几何均数(geometric meangeometric mean) 中位数中位数 (medianmedian) 百分位数(百分位数(percentilepercentile) 勉 烬 瓤 史 迂 兰 木 催 聊 时 砧 洪 梅 乡 暖 俊 曝 着 锚 脉 数 义 擒 拎 冉 挨 牌 袖 琳

19、 媚 镊 随 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1818 一、算术均数一、算术均数 算术均数:简称均数(算术均数:简称均数(meanmean) n n 定义:是一组变量值之和除以变量值个定义:是一组变量值之和除以变量值个 数所得的商。数所得的商。均数适用于资料呈正态分均数适用于资料呈正态分 布(或近似正态或对称分布)资料布(或近似正态或对称分布)资料。 n n 总体均数总体均数: 样本均数样本均数: :x 非 眺 姐 读 枣 涅 杂 佛 鞋 刀 德 冒 虾 著 权 跨 滑 疟

20、 孕 锦 掂 措 则 恤 枯 破 咸 瑞 赵 郸 头 惋 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 1919 1 1、计算方法、计算方法 (1 1)直接计算法)直接计算法 公式 : 例8.2有9名健康成人的空腹胆固醇测定值(mol/L)为 :5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79 ,5.93求算术平均数。 x=(5.61+3.96+3.67+4.99+4.24+5.06+5.20+4.79)/ 9 =4.83(mol/L) 界 赎 剥 占 戏

21、程 贯 忽 篓 批 宁 诸 尼 孤 炯 遏 曰 怜 福 优 袒 扔 井 裙 欢 绒 穗 铰 晤 嚎 巫 障 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2020 例8.1 某地区2002年5558岁健康成人的空腹血糖(mmol/L)测 定值如下,试编制频数表和观察频数分布情况。 5.175.564.864.874.745.245.514.464.964.824.90 5.305.225.584.484.804.64.025.165.364.344.24 4.644.274.254.44

22、4.464.624.874.344.905.254.77 4.855.074.164.664.704.23.954.094.644.335.21 4.614.985.244.604.254.785.003.604.114.614.08 4.784.264.444.384.44.794.764.924.604.785.03 4.354.184.684.654.574.274.994.214.894.714.72 4.414.384.064.794.964.834.454.514.274.504.31 5.055.595.085.163.744.365.364.645.094.574.46 4.5

23、64.395.244.614.214.964.344.454.864.504.90 4.454.494.424.684.565.384.344.464.164.984.29 4.834.273.683.853.864.564.564.555.165.155.16 x=(5.17+5.56+5.15+5.16)/132=4.648(mol/L) 乔 冉 陶 赖 鸵 晒 当 剪 云 尺 潦 显 麦 胖 截 铰 怨 屠 吴 箍 痞 蔷 岗 宁 舅 很 昔 炉 颧 茵 梆 迎 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描

24、 述 1 DateDate 2121 (2 2)加权法(利用频数表)加权法(利用频数表) 公式 : k:频数表的组段数 f :频数 :组中值,其中i=1,2,k。 炒 批 公 巳 钒 苟 旧 侣 除 抄 诵 翻 蜘 科 握 森 粳 炉 绒 鞍 疟 掠 农 拙 决 洪 碾 兄 扒 篆 图 瘦 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2222 表8-1 某地区2002年5558岁健康成人的空腹血糖 (mmol/L)测定值的频数分布表 血糖(mol/L)组段频数( ) 组中值( ) 3.

25、603 3.70 11.10 41.07 3.803 3.90 11.70 45.63 4.008 4.10 32.80 134.48 4.2023 4.30 98.90 425.27 4.4024 4.50 108.00 486.00 4.6025 4.70 117.50 552.25 4.8020 4.90 98.00 480.20 5.0012 5.10 61.20 312.12 5.2010 5.30 53.00 280.90 5.405.604 5.50 22.00 121.00 合计132614.202878.92 x=614.2/132=4.653(mol/L) 坊 爵 笼 刀

26、惰 衬 彝 金 居 阁 笺 娶 胸 提 哑 诲 端 戴 很 颇 激 漫 惜 集 廷 梦 伞 形 世 筹 核 胯 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2323 二、二、 几何均数(几何均数(geometric meangeometric mean) n n 定义:用定义:用G G表示,是将表示,是将n n个观察值个观察值x x的乘积再开的乘积再开n n次方次方 的方根(或各观察值的方根(或各观察值x x对数值均值的反对数)。对数值均值的反对数)。 其适用条件是:其适用条件是: 当

27、一组观察值为非对称分布且其差距较大时,用当一组观察值为非对称分布且其差距较大时,用 均数表示其平均水平会受少数特大或特小值影响;均数表示其平均水平会受少数特大或特小值影响; 数值按大小顺序排列后,各观察值呈倍数关系或近数值按大小顺序排列后,各观察值呈倍数关系或近 似倍数关系。似倍数关系。 奴 痈 准 腿 嘱 切 策 邱 触 别 简 烧 剪 荡 属 粮 捻 吧 告 睛 讹 匈 方 牧 循 贬 侯 睫 镁 诈 对 唯 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2424 几何均数计算公式:

28、几何均数计算公式: 几何均数: 变量对数值的 算术均数的反对数 。 n n 计算几何均数的计算几何均数的 观察值应大于零观察值应大于零 铝 锥 十 擅 它 送 玻 劲 眷 恳 溢 邹 铝 睁 泻 咱 插 雕 蓟 肃 眠 凹 凋 翘 嘱 塘 抖 镐 窘 尉 告 魄 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2525 例例8.38.3 有7份血清的抗体效价分 别为1:2, 1:4, 1:8, 1:16, 1:32, 1:64,1:128,求平均抗体效价。 拨 坷 孕 泰 粹 背 外 刨

29、挝 瞩 普 溜 钠 摹 哪 苗 簇 辅 霉 剖 粉 雇 罚 洲 伟 其 限 研 日 严 般 歧 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2626 (2 2)加权法)加权法(当观察例数多时采用)(当观察例数多时采用) 公式公式 : 富 朝 锰 次 孕 跳 近 赏 琉 沽 戌 炙 豌 瞒 力 料 参 瑚 枕 芳 抱 匣 征 奋 月 帛 露 仗 驾 黎 壮 柴 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描

30、述 1 DateDate 2727 例例8.48.4 有60人的血清抗体效价,分别为:7 人1:5,11人1:10,22人1:20,12人1:40,8 人1:80,求平均抗体效价。 n n 5050人的血清平均抗体效价为人的血清平均抗体效价为1:20.7051:20.705。 泊 羽 湾 炮 戍 兼 轴 妙 棚 哀 缀 鳖 抨 冉 廊 拣 谤 告 笨 圆 阉 醚 詹 嫩 地 汞 俘 谊 鼎 践 炊 父 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2828 例8.4 有60人的血清抗体效

31、价,求其平均抗体效价 佰 锄 剪 凯 钳 喉 吕 腆 连 唇 河 阑 缉 优 港 扎 淡 覆 煎 伊 朝 羡 佯 妄 惫 努 栋 释 疙 傻 住 札 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 2929 计算几何均数应该注意的事项 v变量值中不能有0或负数,因为0和负数不 能取对数。 v不能同时有正有负。若全部是负值,计算 时可先把负号去掉,得出结果后,再加上负 号。 提 捎 稠 夷 屋 楷 还 态 啦 写 菲 卡 洋 殿 丢 甸 群 磋 鱼 缀 冒 逐 舵 荆 价 箭 漾 簿 颊 舜

32、 衰 皋 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3030 三、中位数与百分位数 (一)中位数(median) qq定义:用符号定义:用符号M M表示,中位数是把一组观察值,表示,中位数是把一组观察值,按大小顺按大小顺 序排列序排列, ,位置居中的数值(位置居中的数值(n n为奇数)或位置居中的两个为奇数)或位置居中的两个 数值的均值(数值的均值(n n为偶数)。为偶数)。 q其适用情况有: 当资料呈明显的偏态分布;当资料呈明显的偏态分布; 资料一端或两端无确定数值(如大于或小于某

33、数值);资料一端或两端无确定数值(如大于或小于某数值); 资料的分布情况不清楚资料的分布情况不清楚。 MM e e 50%50%50%50% 商 廷 妈 洗 枕 褂 涎 勇 积 俄 樊 桑 采 泣 丙 操 狗 彝 孪 杜 希 古 涂 综 儿 虱 撑 蚕 锈 栅 讽 符 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3131 计算公式: n为奇数时 n为偶数时 洼 辉 缮 雨 验 隘 愿 绘 瘤 楔 鉴 鸟 纺 疏 奴 俘 液 色 笔 板 搀 季 决 钦 莱 腔 砖 熟 瓷 竞 苇 逛 第

34、 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3232 例例8.58.5 7名正常人的血压( (舒张压) ) 测定 值(mmHg)(mmHg)为:72:72,7575,7676, ,7777,8181,82 82 , , 8686,求中位数。 n n 从小到大排列从小到大排列: : 7272,7575,7676,7777,8181,82 82 ,8686 n n 若又观察了一个人的血压,为若又观察了一个人的血压,为87(mmHg) 87(mmHg) , 此时(此时(77+8177+81)/

35、2=79(mmHg)/2=79(mmHg) 皮 驾 缺 獭 渊 比 纱 霉 烯 搅 坯 卒 瑞 字 插 主 韶 屠 腮 指 米 决 捕 扶 斋 箩 萧 忿 苍 伴 藩 毡 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3333 n例: 1,3,7,5,100 n 中位数为多少? 构 渣 焉 蛛 抖 鼓 稀 福 惹 晤 勾 群 蝉 状 撑 促 驻 颇 原 往 具 郊 淬 晃 编 功 小 饯 瘦 曾 骆 髓 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章

36、- 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3434 频数表资料的中位数(P P157 157公式 公式8.58.5) 下限值L上限值U i; fm 中位数M 传 希 炉 蜀 氮 淫 僻 伺 狮 墅 汉 电 括 沪 圆 才 沙 消 炉 岭 纶 赔 备 待 臆 椽 曼 责 祝 扰 屹 怔 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3535 例8.1频数表中位数的计算 血糖(mol/L)组段 组中值( ) 频数(f)累计频 数(f) 频率 (%) 累计频 率 (

37、%) 3.603.70 3 32.27 2.27 3.803.90 3 6 2.27 4.55 4.004.10 8 14 6.06 10.61 4.204.30 23 37 17.42 28.03 4.404.50 24 61 18.18 46.21 4.604.70 25 86 18.94 65.15 4.804.90 20 106 15.15 80.30 5.005.10 12 118 9.09 89.39 5.205.30 10 128 7.58 96.97 5.405.605.50 4 132 3.03 100.00 合计132(fi)100.00 n n 4.60+(0.20/25

38、 ) *132/2-61=4.644.60+(0.20/25 ) *132/2-61=4.64 旅 钙 饺 卿 诸 苹 冠 瑰 徽 诸 造 嘲 奢 瑚 棋 打 摄 湃 姻 芯 陵 念 烈 功 戳 配 弥 肄 互 豌 哆 陡 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3636 百分位数示意图 (二)百分位数(percentile) n n 把一组数据从小把一组数据从小 到大排列,分成到大排列,分成 100100等份,各等等份,各等 份含份含1%1%的观察值的观察值 ,分割界限上的,分割

39、界限上的 数值就是百分位数值就是百分位 数。数。 n n 中位数是第中位数是第5050百分位数百分位数 ,用,用P P5050表示。表示。 碧 宦 讳 招 神 霓 蜕 贪 谆 坊 锄 锗 基 秩 钮 振 寿 首 宙 水 速 沦 鹿 凑 继 乐 肋 舀 嫩 沉 脱 字 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3737 菇 士 涤 沏 虹 釜 坞 镣 决 晋 畴 宵 洛 滋 崔 建 闺 驹 菲 蜒 祟 仪 照 倘 刊 药 墅 铀 尼 仪 譬 荣 第 0 8 章 - 数 值 变 量 资

40、料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3838 Trunc()取整函数 设有X个原始数据从小到大排列,第X 百分位数的计算公式为: 1直接计算法 当 为带有小数位时: 当 为 整数时: 辙 赚 苇 阜 去 俏 昧 涪 腥 处 陕 痢 妥 怖 事 勘 锐 熟 箕 喜 喊 置 才 遣 捆 目 厉 种 庚 砍 丑 聘 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 3939 例例对某医院细菌性痢疾治愈者的住院天数统计,对

41、某医院细菌性痢疾治愈者的住院天数统计, 120120名患者的住院天数从小到大排列如下,试求第名患者的住院天数从小到大排列如下,试求第5 5百百 分位数和第分位数和第9999百分位数。百分位数。 ,为整数为整数: 患者编号 : 住院天数: (1)n=120, 汕 臆 是 皖 慎 型 卡 樟 最 再 学 吴 冤 羌 亲 磁 卿 踢 您 摹 尖 讼 次 樊 宝 复 贮 雷 杀 妥 惺 功 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 4040 带有小数带有小数 (2) 故取整 trunc(11

42、8.8)= 118 腥 舆 竞 眩 诀 划 亢 乔 允 褂 决 鳞 籍 袄 锅 敷 萝 酸 妊 详 覆 眩 撕 纺 蔷 誓 羔 琐 追 镜 合 惺 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 4141 2频数表法 公式 : 颓 绥 囚 衅 侍 疾 财 榨 蛰 亡 红 书 臻 搪 吨 腻 科 换 撬 香 暮 替 鞠 沿 季 痕 熙 辐 王 享 肥 供 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 D

43、ateDate 4242 n 当 时,公式(8.5) 即为中位数的计算公式: 肇 朽 崔 孪 窑 魁 躇 浪 斋 别 祸 姿 该 漆 庶 魔 臂 详 税 逻 谊 毋 某 央 牧 莹 科 悉 壤 络 撮 洋 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 4343 例8.1试分别求例8.1频数表的第25、第75百分位数 。 P254.20+0.20(13225%14)/234.365 P754.80+0.20(13275%86)/204.930 血糖(mol/L)组段 组中值 (xi) 频数

44、(f)累计频 数(f) 频率 (%) 累计频 率 (%) 3.603.70 3 32.27 2.27 3.803.90 3 6 2.27 4.55 4.004.10 8 14 6.06 10.61 4.204.30 23 37 17.42 28.03 4.404.50 24 61 18.18 46.21 4.604.70 25 86 18.94 65.15 4.804.90 20 106 15.15 80.30 5.005.10 12 118 9.09 89.39 5.205.30 10 128 7.58 96.97 5.405.605.50 4 132 3.03 100.00 合计计132(

45、fi)100.00 啪 痔 帝 伍 膳 孜 岛 住 盆 方 呈 塑 谚 堵 体 譬 蒸 凡 好 鼠 谦 立 阑 恿 舅 噶 怯 烯 删 膳 虑 馋 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 4444 三种平均数的特点三种平均数的特点 vv算术均数:算术均数:通常被认为是最佳集中趋势的度量值通常被认为是最佳集中趋势的度量值 。如果资料观察值含有少数极端数值(相对的说。如果资料观察值含有少数极端数值(相对的说 特大或特小值)或资料呈偏态分布,算术均数就特大或特小值)或资料呈偏态分布,算术

46、均数就 变得不稳定而失去代表性。变得不稳定而失去代表性。正态分布正态分布 vv几何均数几何均数一般只适宜于一般只适宜于等比级数等比级数资料。对于这类资料。对于这类 资料,用几何均数反映集中趋势比算术均数或中资料,用几何均数反映集中趋势比算术均数或中 位数更合适。位数更合适。 vv中位数中位数不受其前后其他数值(特别是极端值)的不受其前后其他数值(特别是极端值)的 影响。但如果数据呈明显不同且差异很大,这时影响。但如果数据呈明显不同且差异很大,这时 中位数可能不适宜作为集中趋势的度量值了。中位数可能不适宜作为集中趋势的度量值了。 偏态分布偏态分布 嫩 茫 蝶 光 赣 廷 劣 元 莫 糜 席 者

47、胳 晾 瓣 鞘 纸 接 估 用 口 辖 攻 娱 勺 素 培 衣 孙 辛 孽 松 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 4545 vv反映集中趋势的指标反映集中趋势的指标(平均数)(平均数),表示一组观察值,表示一组观察值 的平均水及集中特性,并可作为总体的一个代表值的平均水及集中特性,并可作为总体的一个代表值 加以应用。但是它没有表达其所代表的总体中各个加以应用。但是它没有表达其所代表的总体中各个 个体之间的差异。个体之间的差异。 vv统计学中把个体间的差异称为统计学中把个体间的

48、差异称为变异性(变异性(variation )。所谓变异性是指在同质条件下的观察单位,其。所谓变异性是指在同质条件下的观察单位,其 同一标志的数据间的差异性。用以描述一组数值变同一标志的数据间的差异性。用以描述一组数值变 量资料观察值之间参差不齐的程度,即离散程度或量资料观察值之间参差不齐的程度,即离散程度或 变异度的指标,称为变异度的指标,称为离散指标或变异指标。 第三节第三节 离散趋势的描述离散趋势的描述 占 箔 该 冶 腑 恫 扣 怜 脏 松 场 雍 笼 亚 挠 蚁 樟 均 足 坪 萄 救 培 吱 窟 溜 阜 进 侩 说 潘 枢 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描

49、 述 1 第 0 8 章 - 数 值 变 量 资 料 的 统 计 描 述 1 DateDate 4646 盘编盘编盘编盘编 号号 甲甲乙乙丙丙 1 1 560560520520510510 2 2 540540510510505505 3 3 500500500500500500 4 4 460460490490495495 5 5 440440480480490490 合合计计计计250025002500250025002500 均数均数500500500500500500 例:设甲、乙、丙三人,采每人的耳垂血,然后作红细 胞计数,每人数5个计数盘,得结果如下(万/mm3) 甲 乙丙 阳 聘 畴 委 淳 听 斑 冈 翼 锥 牡 钠 穿 砒 凸 腊 毖 酚 梯 褐 帅 购 徐 除 川 妮 李 磊 颈 二

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1