生物统计实验saPPT演示文稿.ppt

上传人:rrsccc 文档编号:8880778 上传时间:2021-01-23 格式:PPT 页数:85 大小:803KB
返回 下载 相关 举报
生物统计实验saPPT演示文稿.ppt_第1页
第1页 / 共85页
生物统计实验saPPT演示文稿.ppt_第2页
第2页 / 共85页
生物统计实验saPPT演示文稿.ppt_第3页
第3页 / 共85页
生物统计实验saPPT演示文稿.ppt_第4页
第4页 / 共85页
生物统计实验saPPT演示文稿.ppt_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《生物统计实验saPPT演示文稿.ppt》由会员分享,可在线阅读,更多相关《生物统计实验saPPT演示文稿.ppt(85页珍藏版)》请在三一文库上搜索。

1、1,生物统计与试验设计实验课(SAS),山东农业大学信息科学与工程学院数学系,陈 茂 学,2,SAS系统是用于数据分析与决策支持的大型集成式模块化软件系统。 其早期的名称为统计分析系统- Statistical Analysis System(缩写为SAS) 在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统。,第一章 SAS系统简介,3,1.1 SAS软件简史 早在60年代,美国北卡罗来纳州 Raleigh的SAS软件有限公司开始研制统计分析系统- SAS软件包。1976年研制成功,并作为产品推向市场。目前已被120多个国家和地区的29000多个机构所采用,直接用户300多万人。

2、起初, SAS是建立在DOS环境下的。有适于不同机型的各种版本。在WINDOWS出现不久, SAS公司就研制出WINDOWS环境下运行的SAS系统。,4,1.2 SAS软件的结构 SAS软件是模块式结构,整个系统有30多个模块组成。 SAS/BASE-基础核心模块。 SAS/STAT-常用和多元统计分析模块。 SAS/IML-矩阵运算模块。 SAS/ETS-时间序列预测模块。 SAS/QC-工业生产质量控制和实验设计模块。 SAS/ASSIST-处理一般简单问题模块。 SAS/INSIGHT-交互式统计分析模块。 SAS/OR-运筹学模块。 SAS/AA-Analyst application

3、分析员应用模块。,5,1.3 SAS软件的功能 功能十分强大,包括客户机与服务器之间的信息交换和计算、数据访问、数据存储和管理、数据报告和分析、质量控制和项目管理、图形处理和实验设计、应用开发。,6,1.4 进入SAS系统的方法和标志 在WIN95或WIN98下(假设已经装好SAS),直接调用SAS快捷键或选择“开始”-“程序”-“The SAS System”即可进入SAS系统。 进入SAS后,屏幕出现两个窗口,即LOG(记录)、PROGRAM EDITER(程序编辑器,简写PGM)窗口,通过菜单条“Window”或“Globals”选项可以进入 OUTPUT(输出)窗口。,7,SAS6.1

4、2界面,8,SAS8.2界面,9,SAS9.0界面,10,菜单中的几个子菜单,1 文件子菜单,11,2 编辑子菜单,12,3 查看子菜单,13,4 工具子菜单,14,5 运行子菜单,15,5 解决方案子菜单,16,6 帮助子菜单,17,2.1 SAS过程与SAS程序 SAS过程(SAS PROCEDURE)是SAS研制者为解决特定问题而编写的、经过编译的SAS程序,以“.DLL”为其扩展名,存储在SAS各子目录下,供用户调用。 SAS程序(SAS PROGRAM)是SAS用户运用SAS语言编写的一段程序。其目的是为了将用户的数据告诉SAS系统调用特定的SAS过程完成某项任务。,第二章 用SAS

5、需了解的几个基本概念,18,2.2 SAS文件与SAS数据集 SAS文件是由SAS系统创建和管理的有特殊 结构的文件。如:在程序编辑窗口,输入n行数据存盘得到的文件。 SAS数据集是SAS文件的一种,其扩展名为.SD2。产生SAS数据集的主要方法有: 1 PGM窗口运行一段SAS程序( SAS数据步)来产生。 2 用VIEWTABLE界面输入并存储的方式来产生。 3 其他方式(SAS/INSIGHT, SAS/AA,转换等)。,19,2.3 SAS程序结构 SAS程序包括: 1 SAS数据步(SAS DATA STEP)。 作用是建立SAS数据集。 2 SAS过程步(SAS PROCEDURE

6、 STEP)。 作用是激活SAS过程。 例如:调查并测得8名14-16岁中学生有关指标的数据如下,写一段SAS程序,分析男女生体重均值之间的差异是否显著。,20,DATA students; INPUT name$ sex$ age weight height; CARDS; Wang M 14 40 150 Zhang M 16 42 170 Li F 15 44 149 Tang M 15 38 162 Liu F 14 47 162 Chen F 16 52 168 Zhu M 14 45 158 Jia F 16 45 167 ; PROC TTEST; CLASS sex; VAR

7、weight; run;,从“DADA”到独占一行的“;”为SAS数据步; 从“PROC”到“RUN;”为SAS过程步。 students-产生SAS数据集的名字; INPUT-产生5个变量;($-字符型) CARDS-表明各变量的具体取值; TTEST-t检验; CLASS-以性别sex变量为分组变量; VAR-指明分析的变量(如weight); RUN-表明程序的结束。,21,程序运行结果(6.12),22,程序运行结果(SAS 9.0):,23,2.4 SAS程序的产生办法 1 在PGM窗口直接编写SAS程序。 2 利用VIEWTABLE建立好SAS数据集后,借助部分非编程SAS模块自动

8、产生SAS程序(如SAS/AA)。 3 直接调用由SAS软件应用开发者编好的SAS程序。,2.5 SAS程序的运行 在PGM窗口内有了SAS程序后,只需按一下工具拦中的小人像图标,SAS系统就开始执行操作,完成指定的任务。如果程序有错,错误信息显示在LOG窗口内。如果程序正确,计算结果显示在OUTPUT窗口内。,24,第三章 SAS语言,3.1 SAS程序设计概述 SAS程序分:数据(DATA)步和过程(PROC)步。 DATA步的基本语句有DATA,INPUT,CARDS,.,3.2 SAS常量、变量、函数、表达式和数组 3.2.1 常量 数值、字符、日期、时间常量。 如:数值常量,1024

9、,-10,1.5E23 字符常量,“JAC”,“1232” 3.2.2 变量 如 x,xy,x1,abc;x$,name$,25,3.2.3 函数 (1) 算术函数:绝对值ABS( ),平方根SQRT( ),. (2) 截取函数:取整INT( ),舍入ROUND( ), (3) 数学函数:EXP( ),LOG( ),LOG2( ),LOG10( ) (4) 三角函数:SIN( ),COS( ),TAN( ),ARSIN( ) (5) 字符函数:字符串长度LENGTH( ),取子字符串SUBSTR( ),如SUBSTR(“ABCDEF”,2,3)=“BCD” (6) 日期与时间函数:DATE(

10、),TIME( ),YEAR( ),26,(7) 随机函数: UNIFORM( )、RANUNI( )均匀分布 NORMAL( )、 RANNOR( )正态分布 RANEXP( )指数分布 RANBIN( )二项分布,RANPOI( ) 普松分布,.,(8) 概率分布函数:P(=x) PROBBNML(p, n, x),二项分布函数; POISSON(lambda, x), 普松分布函数; PROBNORM(x), 标准正态分布函数;,27,(9) 分位数函数: PROBIT(p), 标准正态分布的分位数, 如PROBIT(0.025)=-1.96;.,(10) 样本统计函数: MEAN( )

11、,均值;如MEAN(2,4,9)=5 MAX( ),最大值;MIN( ),最小值;SUM( ),求和; VAR( ),方差;STD( ),标准差;,28,3.2.4 SAS运算符 (1) 算术运算符:+,-,*,/,* (2) 比较运算符:=或EQ,=或NE(不等于),或GT, =或GE, =或LE (3) 逻辑运算符: INPUT name$,运行结果,30,(2) 列方式 INPUT 变量$起始列号-终止列号.小数位数; 字符长度可以为1-200。 例如:,DATA one; INPUT name$1-10 hgt 13-16 .1 age 11-12; CARDS; Carl Hui 3

12、01700 C.J. Jiang401808 ; PROC PRINT; RUN;,31,另外还有命令方式、指针方式等。 仅对行固定表示符的使用进行说明。 行表示符: 例:,DATA new; INPUT x1-x3 ; CARDS; 12 34 16 25 27 23 23 56 24 76 98 55 ; PROC PRINT; RUN;,32,3.4 SAS程序结构 3.4.1 顺序结构 3.4.2 转移结构,SELECT 表达式; WHEN 语句1; OTHERWISE 语句; END;,多分支 结构:,IF THEN 语句 ;ELSE 语句;,3.4.3 分支结构,GOTO 标号;(

13、标号 OK:y=x+20;) IF THEN GOTO 标号;,33,3.4.4 DO循环结构,DATA test; ARRAY x(10) t1-t10; INPUT t1-t10; SUM=0; DO I=1 to 10; sum=sum+x(I); END; CARDS; 1 2 3 4 5 6 7 8 9 10 ; PROC PRINT; RUN;,DO 循环变量=初值TO 终值BY 步长; SAS语句; END;,例:,34,3.5 数据预处理 3.5.1 产生新变量,DATA one; INPUT x y; x2=x*x; x3=x*x*x; z=x/y*100; yp=LOG(y

14、); CARDS; 1 232 3 234 2 223 4 354 ; PROC PRINT;RUN;,35,3.5.2 修改变量 例如:x=x-100;y=LOG(y); 3.5.3 删除变量 例如:,DATA one; INPUT x1 x2 x3 y; DROP x2 x3; CARDS; 1 2 3 40 2 4 5 80 3 5 7 83 ; PROC PRINT; RUN;,36,4.1 完全随机化设计,例1 夏玉米硼肥肥效试验。处理A施硼肥;处理B不施硼肥;完全随机化设计,各重复5次,小区产量结果如下: A39, 37.6, 44.3, 42.4, 44.1 B33.9, 35.

15、9, 39.1, 33.5, 38.1 试分析两处理平均产量间有无显著差异。,第四章 两均值检验及统计量计算,DATA tem; INPUT g$ n; DO i=1 to n; INPUT x; OUTPUT; END; CARDS; A 5 39.0 37.6 44.3 42.4 44.1 B 5 33.9 35.9 39.1 33.5 38.1 ; PROC TTEST; CLASS g; VAR x; RUN;,37,38,例2 为鉴定某小麦新品系A的生产能力,以当地的优良小麦品种B为对照,两两组成一对分别种植于相邻的两个小区上,重复8次,试验结果如下: A21 20 18 17 16

16、 17 19 20 B15 17 15 16 16 16 17 19 试分析两种子产量之间有无显著差异。 程序如下:,4.2 配对设计,39,DATA tem; INPUT x1 x2; d=x1-x2; CARDS; 21 15 20 17 18 15 17 16 16 16 17 16 19 17 20 19 ; PROC MEANS MEAN STDERR T PRT MAXDEC=4; VAR d; RUN;,40,例3 某班31个学生,某门课程的考试成绩如下: 25 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86

17、 86 87 89 89 89 90 91 91 92 100,4.3 统计量的计算,计算均值、方差、标准差、变异系数、中位数、极差。,data ex3; input x ; cards; 25 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86 86 87 89 89 89 90 91 91 92 100 ; proc means mean var std cv median range maxdec=2; var x; run; quit;,解 SAS程序:,41,data ex3; input x ; cards; 25

18、 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86 86 87 89 89 89 90 91 91 92 100 ; proc means mean var std cv median range maxdec=2; var x; run; quit;,输出结果:,42,例1设有5个品种的单因素完全随机化设计,各重复4次,小区产量结果如下,试进行方差分析。,5.1 单因素完全随机化设计的方差分析,第五章 方差分析,43,DATA one; INPUT a$ n; DO i=1 TO n; INPUT y; OUTPUT; E

19、ND; CARDS; A1 4 24 30 28 26 A2 4 27 24 21 26 A3 4 31 28 25 30 A4 4 32 33 33 28 A5 4 21 22 16 21 ; PROC ANOVA; CLASS a; MODEL y=a; MEANS a /LSD ALPHA=0.05; RUN; QUIT;,44,方差分析结果,45,多重比较结果,46,例2 有6个大豆品种的比较试验,随机区组设计,4个区组,试验结果如下表。试进行方差分析。,5.2 单因素随机区组设计的方差分析,47,DATA two; DO a=A1,A2,A3,A4,A5,A6; DO b=1 to

20、4;INPUT y; OUTPUT; END; END; CARDS; 58 54 50 49 42 38 41 36 32 36 29 35 46 45 43 46 35 31 34 34 44 42 36 38 ; PROC ANOVA; CLASS a b; MODEL y=a b; MEANS a /TUKEY; RUN;,48,方差分析结果,49,多重比较结果,50,例3:玉米试验。A施肥期:前期A1 ,后期A2 。 B施肥量:B1N5;B2N10;B3N15。 设置5个区组,试验结果如下,进行方差分析。,5.3 多因素随机区组设计的方差分析,51,DATA ex3; DO a=A1

21、,A2; DO b=B1,B2,B3; DO c=1 to 5; INPUT y; OUTPUT; END; END; END; CARDS; 50 59 45 52 58 60 53 58 62 55 64 66 67 71 63 55 60 56 62 45 71 65 75 78 80 55 59 58 63 60 ; PROC ANOVA;CLASS a b c; MODEL y=a b c a*b; MEANS a b a*b/LSD; RUN;,52,方差分析结果,53,A因素多重比较结果,54,B因素多重比较结果,55,例4 A、B、C、D、E 五个水稻品种试验的拉丁方设计。试验

22、设计及试验结果如下表。试进行方差分析。,5.4 拉丁方设计的方差分析,56,DATA ex4; DO r=1 TO 5; DO c=1 TO 5; INPUT t$ y; OUTPUT; END; END; CARDS; D 37 A 38 C 38 B 44 E 38 B 48 E 40 D 36 C 32 A 35 C 27 B 32 A 32 E 30 D 26 E 28 D 37 B 43 A 38 C 41 A 34 C 30 E 27 D 30 B 41 ; PROC ANOVA;CLASS r c t; MODEL y=r c t; MEANS t/LSD; RUN;,57,方差

23、分析结果,58,处理的多重比较结果,59,第六章 相关与回归分析,6.1 相关系数的计算,例1 某物质在凝固时放出的热量y(卡/克)与此物质中4种化学成分(%)x1,x2,x3,x4有关,求这5个变量间的相关系数。数据与程序如下:,60,DATA hald; INPUT x1 x2 x3 x4 y; CARDS; 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 54 18 22 93.

24、1 21 47 4 26 115.9 1 40 23 34 83.8 11 66 9 12 113.3 10 68 8 12 109.4 ; PROC CORR; VAR x1-x4 y; RUN;,61,相关分析结果,62,例2 某植物的苗龄x(d)与株高的试验数据如下,求x与y的直线回归方程。,6.2 简单线性回归,其SAS程序如下:,DATA two; INPUT x y; CARDS; 5 2 10 5 15 9 20 14 25 19 30 25 35 33 ; PROC REG; MODEL y=x; RUN;,63,方差分析与参数估计,64,如果输出预测值, 在 MODEL 语句

25、后加/p,PROC REG; MODEL y=x/P; RUN;,PROC GPLOT ; PLOT 纵轴变量名*横轴变量名; SYMBOL V=符号 CV=颜色 I=NONE 其他图形选项; RUN;,用GPLOT过程作图,其中:符号散点符号;I=NONE散点间不连线; I=RL表示线性回归(RQ、RC是二、三次回归),65,PROC GPLOT; PLOT y*x; SYMBOL V=star I=RL CV=orange CI=blue; RUN;,其中:CV、CL分别表示点的符号和回归线的颜色,上例作y关于x的回归和散点图。程序如下:,66,67,6.3 曲线回归,例3 苹果叶面积y(

26、cm2)生长量与前期间隔天数x(d)的数据如下表,求x与y的指数曲线回归方程。,其SAS程序如下:,DATA three;INPUT x y; yp=LOG(y); CARDS; 0 5.7 5 43.7 10 76.7 15 102.3 20 183.4 25 225.1 30 344.2 ; PROC REG; MODEL yp=x; RUN;,68,输出结果:,指数方程:y=e2.6594*e0.1175 x=14.2877e0.1175 x,69,在例1中,建立y与x1,x2,x3,x4的多元线性回归方程。,(数据步) PROC REG; MODEL y=x1 x2 x3 x4; RU

27、N;,6.4 多元线性回归,70,输出结果,71,采用逐步回归方法筛选自变量,建立y与x1,x2,x3,x4的多元线性回归方程。程序如下:,PROC REG; MODEL y=x1 x2 x3 x4/SELECTION=STEPWISE; RUN;,注意:在REG过程中,可以有多个MODEL语句。,72,引入、剔除变量显著性水平的选择 在 MODEL 语句中的选项 “SELECTION=方法” 后面加入选项。 1 引入变量显著性水平 STEPWISE法用:SLE=水平值,缺省值为0.15. 2 剔除变量显著性水平 STEPWISE法用:SLS=水平值,缺省值为0.15.,73,DATA hal

28、d; INPUT x1 x2 x3 x4 y; CARDS; 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 54 18 22 93.1 21 47 4 26 115.9 1 40 23 34 83.8 11 66 9 12 113.3 10 68 8 12 109.4 ; PROC REG; MODEL y=x1 x2 x3 x4/SELECTION=STEPWISE SLE=0.1

29、 SLS=0.1; RUN;,74,逐步回归分析结果,75,76,77,7.1.1 离散型分布的检验,例1 研究大豆蛋白质型类的遗传,蛋白质型类A与蛋白质型类B杂交第一代(F1)为AB,当F1自交得F2共分离成A型类为24,AB型类为35,B型类为21,问这种现象是否符合孟德尔1:2:1的遗传分离定律。,7.1 适合性检验,第七章 非参数统计,解:SAS程序如下:,78,data ex1; input f$ y ; cards; A 24 AB 35 B 21 ; proc freq; weight y; tables f/nocum testp=(25 50 25); run; quit;,

30、输出结果:,79,7.1.2 连续型分布的检验,检验是否服从正态分布。,例2 对100名女生测定血清总蛋白含量(g/L), 数据如下:,74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5 75.8 75.8 68.8 76.5 70.4 71.2 81

31、.2 75.0 70.4 68.0 70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7 67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7 75.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.3 73.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4,解:SAS程序如下:,80,解:SAS程序如下:,data ex

32、1; input x; cards; 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0 70.4 72.0 76.5 74.3 76.5 77.6 6

33、7.3 72.0 75.0 74.3 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7 67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7 75.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.3 73.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4 ; proc capability graphics ; histogram x / normal; run;,81,82,卡平方检验:2=4.06491174;自由度=5;p=0.540。,83,7.2 独立性检验(列联表分析),解:SAS程序如下,例2 考察不同灌溉方式对水稻叶子衰老情况的影响, 观测结果如下表,试检验叶子衰老与灌溉方式是否有关。,84,data ex2; do a=1 to 3; do b=1 to 3; input f; output; end; end; cards; 146 7 7 183 9 13 152 14 16 ; proc freq; tables a*b/chisq expected nocol norow nopercent; weight f; run;,85,理论频数 Ti .T.j / n,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1