统计_但2015_2(统计描述).ppt

上传人:本田雅阁 文档编号:2880357 上传时间:2019-06-01 格式:PPT 页数:48 大小:1.40MB
返回 下载 相关 举报
统计_但2015_2(统计描述).ppt_第1页
第1页 / 共48页
统计_但2015_2(统计描述).ppt_第2页
第2页 / 共48页
统计_但2015_2(统计描述).ppt_第3页
第3页 / 共48页
统计_但2015_2(统计描述).ppt_第4页
第4页 / 共48页
统计_但2015_2(统计描述).ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《统计_但2015_2(统计描述).ppt》由会员分享,可在线阅读,更多相关《统计_但2015_2(统计描述).ppt(48页珍藏版)》请在三一文库上搜索。

1、统计描述,1.统计图、表(直观) 2.特征指标,2019/6/1,计量资料的统计描述,集中趋势描述 均数:对称分布,特别是正态分布资料 几何均数:等比级数资料,对数正态分布资料 中位数:不适合用几何均数描述的偏态分布资料 末端有不确定数据的正态分布资料 离散趋势描述 极差:不稳定 四分位数间距:用于偏态分布资料 方差与标准差:用于正态分布资料,描述平均变异绝对变异 变异系数:用于正态分布资料变异度对比相对变异,2019/6/1,2019/6/1,编制步骤,求极差 极差(range)也称全距 确定组段数和组距 根据组距写出组段 分组划记并统计频数,2019/6/1,2019/6/1,2019/6

2、/1,集中趋势的描述 均数,直接计算法 频数表法,2019/6/1,集中趋势的描述 几何均数,公式,2019/6/1,集中趋势的描述 中位数,n为奇数: n为偶数:,2019/6/1,离散趋势描述-极差四分位距,极差R: 最大值与最小值之差 四分位距 = -,2019/6/1,离散趋势描述-方差标准差,总体方差与总体标准差 样本标准差,2019/6/1,离散趋势描述-变异系数,不同均数资料的变异度比较 不同度量单位资料的变异度比较,2019/6/1,分类变量的描述_相对数,强度相对数:率 某时期内发生某现象的观察单位数 同期可能发生某现象的观察单位总数 结构相对数 :构成比 某一组成部分的观察

3、单位数 同一事物各组成部分的观察单位总数 相对比 甲指标/乙指标,2019/6/1,计算相对数的注意事项,结构相对数不能代替强度相对数(以比代率) 计算相对数应有足够数量 正确计算合并率 注意资料的可比性 相对数的抽样误差,2019/6/1,统计表,意义:用简明的表格形式,有条理地罗列数据和统计量, 方便阅读、比较和计算。 制表原则:重点突出、简明扼要 基本要求: 标题:说明表的内容,在表格的正上方,需注明表中所列资料 的收集时间、地点、人群(When WhereWho) 标目: -横标目:每行数据的意义,对象,在表的左侧 -纵标目:每列数据的意义,指标 线条:顶线、底线、标目线、合计线(四条

4、横线), 组合表中允许在纵标目下出现短横线 数字:准确可靠。小数位数对齐,保留位数一致。 无数字用“-”表示,缺失数字用“”表示 备注:在表格的下方,对表中的标注数字进行说明,顶线,标目线,合计线,底线,表1 标题,备注:,统计图,意义:将统计数据形象化 制作原则: 正确选用统计图:根据资料性质和分析目的 标题:说明图的内容,在图的正下方(WhenWhereWho) 坐标轴:横轴:对象或对象分组特征 纵轴:指标 比例一般为5:7;或7:5 图例:对不同颜色或线条进行说明,不影响图形的展示,以直方面积描述各组频数的多少,面积的总和相当于各组频数之和,适合表示数值变量的频数分布。 -横轴为数值变量

5、值 -纵轴为频数,统计图_直方图,统计图_直条图,直条图:用相同宽度的直条长短表示相互独立的某统计指标值的大小。便于进行同类指标的对比。 直条尺度必须从0开始 各直条宽度相等,间隔与直条等宽或为一半,简单条图,复式条图,统计图_圆图,圆图和百分条图:描述分类变量的各类别所占的构成比。 圆图:以圆形总面积作为100%,将其分割成若干个扇面表示事物内部各构成部分所占的比例。 百分比条图:以矩形总长度作为100%,将其分割成不同长度的段表示各构成的比例,圆图,统计图_线图,线图:用线段的升降来表示数值的变化,适合于 描述某统计量随另一连续性数值变量变化而变化的趋势 横轴表示时间或其他连续性变量, 纵

6、轴表示统计指标 普通线图:纵横轴都是算术尺度, 纵轴一般以0作起点 半对数线图:纵轴为对数尺度, 适宜作指标变化速度的比较,统计图_线图,线图,线图,统计图_箱式图,箱式图:使用5个统计量反映原始数据的分布特征,即数据分布中心位置、分布、偏度、变异范围和异常值,异常值检测: 低于:Q1 - 1.5 (IQ) 高于:Q3 + 1.5 (IQ),箱式图,129 134 136 140 141 142 144 155 158 162 165 220 最小值 Q1 中位数 Q3 最大值 异常值 * 120 130 140 150 160 170 180 190 200 210 220,异常值检测: V

7、alue Q3 + 1.5 (IQR) Value Q1 - 1.5 (IQR),统计图_其他,统计地图:用不同的颜色和花纹表示统计量的值在地理分布上的变化,描述研究指标的地理分布 散点图:反映两个数值型变量的相关关系,常用统计图选择,数值型变量 直方图 箱式图 分类变量 圆图 数值型/分类变量 直条图 线图,统计描述步骤 (单变量),数据类型,数值变量,分类变量,指标:相对数 率 构成比 相对比 统计表 统计图:圆图 线图 直条图,分布类型,对称分布 (正态分布),偏态分布,指标: 集中趋势:均数 离散趋势:标准差 统计表 统计图:直方图 直条图 箱式图 线 图,指标: 集中趋势:中位数 离

8、散趋势:四分位距 统计表 统计图:直方图 直条图 箱式图 线 图,统计描述章节是重中之重 是学习后续章节的基础,数据库建立,设计正确的数据库,保证统计软件能识别 数据库一般为行列表 第一行为变量名 一个case 占用一行 一个variable占一列 尽可能采用数据形式录入,2019/6/1,数据的前处理,数据库:数据的储存备份使用权限 数据双输的必要 数据库名称,变量定义,必要的说明 原始数据的重要性!电子数据库纸质数据库 数据考察:数据类型? 分布? 异常值? 缺失数据的处理? 数据清理与锁定 数据库软件: Access, EpiData, Oracal 统计软件中的数据库,2019/6/1

9、,SPSS软件简介,常用窗口:数据窗程序窗结果输出窗口 变量定义: 变量名:不超过8个字符,最好以英文字母加数字组成, 避免用中文 变量类型:数值型日期型字符型 小数位数 缺失值定义 变量标签:可用中文 值标签:分类变量需要定义值标签 文件类型: 数据文件.sav 程序文件.sps 结果文件.spo,2019/6/1,Xian Jiaotong University-Medical School,描述性统计,计量资料 图表形式:箱式图、直方图、直条图、线图 指标形式:集中趋势:均数、中位数、几何均数 离散趋势:极差、四分位距、方差、 标准差、变异系数 分类资料 图标形式:直条图、线图、圆图 指

10、标形式:率、比,2019/6/1,数据库一般操作,数据库合并:merge 追加变量、追加病例 数据库拆分:split 衍生数据:产生新的变量,2019/6/1,Xian Jiaotong University-Medical School,常用命令_衍生数据命令,产生新变量 (transform) Recode: numeric - string Compute: constant functions Date/time:,2019/6/1,常用命令_数据步命令1,数据步 Insert variables Insert case Go to case Sort cases,Select cas

11、es: give some conditions Weight cases: just used for grouped database.,2019/6/1,Xian Jiaotong University-Medical School,常用命令_数据步命令2,File commands Split file: split file into sub-database according to the categorical variables Merge files: Add cases: the files should be have same structures. Add vari

12、ables: Key variable (unique identification number for the observations),2019/6/1,常用命令_数据步命令3,数据库架构改变 Transpose: row - column (transpose rows and columns ) Restructure: long - short (repeated measurement),2019/6/1,描述性统计过程,Descriptive statistics Frequencies: continuous variables categorical variables

13、Descriptive: continuous variables (Normal distributed) Explore: continuous variables Crosstabs: categorical variables,2019/6/1,基本统计图,Graphs Bar graph: continuous/categorical variables (comparison) Pie graph: categorical variables (constituent ratio) Line graph: proportions and time variables (time t

14、rend) Histogram: continuous variables (frequency distribution) Scatter plot: continuous variables (correlation analysis ) Box plot: continuous variables (check median, quartiles, maximum, minimum),2019/6/1,统计图_连续型变量,measures that are recorded on a naturally occurring number scale. Box plots Histogram,2019/6/1,Xian Jiaotong University-Medical School,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1