2019年SAS课件——第13讲 分析家模块数据管理功能.ppt

上传人:上海哈登 文档编号:2823582 上传时间:2019-05-23 格式:PPT 页数:96 大小:1.38MB
返回 下载 相关 举报
2019年SAS课件——第13讲 分析家模块数据管理功能.ppt_第1页
第1页 / 共96页
2019年SAS课件——第13讲 分析家模块数据管理功能.ppt_第2页
第2页 / 共96页
2019年SAS课件——第13讲 分析家模块数据管理功能.ppt_第3页
第3页 / 共96页
2019年SAS课件——第13讲 分析家模块数据管理功能.ppt_第4页
第4页 / 共96页
2019年SAS课件——第13讲 分析家模块数据管理功能.ppt_第5页
第5页 / 共96页
点击查看更多>>
资源描述

《2019年SAS课件——第13讲 分析家模块数据管理功能.ppt》由会员分享,可在线阅读,更多相关《2019年SAS课件——第13讲 分析家模块数据管理功能.ppt(96页珍藏版)》请在三一文库上搜索。

1、1,菜单系统“分析家” 的数据管理功能 (Analyst Application ),计算机统计分析软件(SAS系统9.1.3),2,“分析家”的数据管理功能目录,1. Analyst入门 2. 数据操作 3. 数据变换 4. 合并数据表 5. 数据的转置及堆叠和折分 6.* 生成图形和统计分析功能,3,“分析家”简介,分析家(Analyst)是为了完成基本统计分析而设计的一个菜单系统;它是用图形界面来调用SAS功能的一个模块.用户通过选择菜单系统的不同菜单项可完成数据管理,各种基本的分析功能和绘图功能.在所选择的菜单项完成每项任务后,立即显示相应的结果;因分析家是通过数据步编程和调用SAS过

2、程联合完成的,故所用的SAS程序可以显示在一个单独窗口供我们学习使用;每项任务完成后所保留的SAS程序,有关的图形和结果,在分析的过程中随时可以调出显示.,4,“分析家”简介 分析家(ANALYST)的功能,1. 从菜单栏目的文件(File),编辑(Edit),查看(View)和数据(Data)下可完成数据管理功能;包括数据的筛选,数据的变换和转置等. 2. 图形(Graphs)栏目下是图形功能,包括直方图,盒须图,饼图,等高线图,二维或三维散点图和曲面图等. 3. 报表(Report)栏目支持PRINT过程的列表和TABULATE过程的汇总报表.,5,“分析家”简介 分析家(ANALYST)

3、的功能,4. 统计(Statistics)栏目下是主要的统计分析功能,包括描述统计,列联表分析,假设检验,方差分析(含线性模型和混合模型等),回归分析,多变量分析(主成分和典型相关),生存分析及功效与样本量大小. 5. 工具(Tools)栏目可对图形查看器等的设置进行修改. 6. 窗口(Wondows)栏目可切换窗口,改变窗口的显示方式等.,6,Analyst 入门 启动Analyst(分析家)的方法,(1) 键入命令ANALYST,(2) 用下拉菜单 解决方案(Solutions) 分析(Analysis) 分析家( Analyst),(3) 启动SAS系统时(从“开始” “运行”打开)加上

4、选项(-initcmd analyst ): “d:sas82sas.exe” -initcmd analyst,9,Analyst 入门,启动分析家(Analyst)后的界面,10,Analyst 入门,进入分析家窗口后,系统自动生成一个新的分析项目。分析家窗口分为左右两部分:左边为项目管理,用树状目录显示打开的数据及其对其所进行的分析;右边显示数据。该项分析所生成的输出结果的名字将列在项目管理的树状目录中,而输出的结果或图形将在单独的窗口里显示。,11,Analyst入门 Analyst的主菜单(Menus),文件(File) - 新建,打开和存贮文件,项目和数 据集,及打印报表. (2)

5、 编辑(Edit) -转换浏览和编辑的模式,并可 添加,拷贝和删除列和行. (3) 查看(View) -可以移动、隐藏列,还可修改 数据表的属性. (4) 工具(Tools) -定制输出标题,画图选项等 (5) 数据(Data) -对用户的数据筛选子集,排序, 概括,串接和合并及进行计算, 数据变换和转置.,12,Analyst入门 Analyst的主菜单(Menus),(6) 报表(Reports)-产生报告,列出观测等 (7) 图形(Graphs)-生成图表,图形和直方 图等. (8) 统计(Statistics)-选择统计分析及使用 索引搜寻任务和统计量. (9) 窗口(Window)-

6、切换到其他窗口. (10)帮助(Help)-显示Analyst和SAS系统 的帮助信息 .,13,Analyst 入门 Analyst的工具条(Toolbar),Analyst的工具条包括16个图标(如产生新表,打开文件,存贮当前的表,打印数据表,预浏览,对数据表排序,取子集,计算新列,生成汇总报表,生成直方图,生成二维散点图,计算汇总统计量,计算相关系数,进行单因子方差分析,进行回归分析,帮助) . 用户还可以定义其它工具条图标: 选菜单项工具(Tools)从下拉菜单选定制 (Customize)=进入定制工具对话窗口=建立图标.,14,Analyst入门 Analyst的工具条(Toolb

7、ar),新建一个新表 产生汇总报表 打开一个SAS文件 产生一个直方图 保存当前表格 产生一个散点图 打印数据表 计算汇总统计量 打印预览 计算相关系数 对表格进行排序 执行单向方差分析 对数据取子集 执行线性回归 由计算得到新列 分析家帮助,15,Analyst 入门 Analyst的索引(Index),使用索引来访问经常使用的一些统计任务和绘图任务. 例如以下任务: Brown-Forsythe test, Bar chart horizontal, One-Way ANOVA,N-Way ANOVA, Pie chart 等等 从按字母顺序的任务列表中选择某项任务后=OK,则进入完成该任

8、务的窗口. (在你不记得在哪个菜单中可以找到你想要的 过程的时候,可以到Index中来寻找),16,Analyst 入门 Analyst的项目(Project),一个项目就是在一个或几个数据集上分析的一些结果.一个项目用项目树显示,该树包含不同的数据表,报表,程序码,以及同该项目有联系的其它结果的目录.这些结果在项目树里呈现为一些分枝. 通过点击加号(+)或减号(-)来打开或关闭一个目录.通过点击某个分枝可以浏览目录中的这个分枝.如果分枝是一张数据表,可以浏览这张表,也可以打开这张表并进行分析.还可以从下拉菜单选择Interactive Analysis来启动SAS/INSIGHT并进行探索数

9、据分析. 从File菜单选择 Projects,用户可以创建,打开,存贮或删除这个分析项目(V8).,17,Analyst 入门 浏览和存贮程序码功能,用户在Analyst里对数据进行任何统计分析和绘图任务后,都可以浏览和存贮程序码.这些源程序可以拷贝到编辑窗进行编辑,然后再提交系统执行.,18,Analyst 入门 在多个窗口浏览结果,可以对一个或几个数据表进行分析,并在多个窗口同时浏览结果. 若双击在项目树的某项结果上,则在单个窗口浏览这个结果.在相同的结果上还可以打开一个新的窗口来浏览这个结果.,19,Analyst 入门 存贮任务选项功能,通过在任务对话窗里双击 Save Option

10、s来存贮同这项任务有关的选项. 以后当用户点击Reset纽时,这些选项将用来作为用户的缺省选项.,20,Analyst 入门 存贮文本和绘图结果,可把程序码及分析和绘图的结果存为文件. 选中项目树中的某个分枝,并从下拉菜单选择另存为 (Save as) 来存贮程序码和结果.然后指定文件名并选择一种文件类型.对于绘图结果,可用GIF,JPEG等格式来存贮.,21,Analyst 入门 定制用户的会话功能,通过从工具(Tools)菜单项=选择查看器设置(Viewer Settings),=并设置浏览器的特性来定制用户的分析会话. 选择图形设置(Graph Settings),并设置绘图的特性.全局

11、选项,用户在某项任务中规定的设置,这时都将被覆盖.,22,数据操作 打开数据集,Analyst的数据表显示来自SAS数 据集,SAS视窗和其它数据源(如文本 文件,Excel 电子表, SPSS文件) 的数 据. 从文件(Files)菜单可以创建新 数据表,打开SAS数据集及浏览,打开 非 SAS文件(V8).,23,数据操作 打开数据集,从文件(Files) 打开 将进入以下窗口:,用户可以选择将要打开的数据文件的类型,24,数据操作 打开数据集,如果打开的数据为SAS数据集,则常通过从 文件(Files) 用A名称打开 在弹出的选择成员窗口中从某个逻辑库中选择将被打开的SAS 数据集名字(

12、比如从SASUSER库中选择数据集 CLASS).,25,数据操作 数据集的浏览与编辑模式,在分析时当打开一个文件或SAS库的成员时 ,数据被转换为数据表.在此可浏览,编辑及整 理数据表的行和列. 数据表被打开的模式可以是浏览,编辑和 共享编辑三种模式之一(类似于VT界面). 由 编辑(Edit) = 模式(Model) = 可以从浏览,编辑和共享编辑 三种模式中任选一种.,26,数据操作 对列的操作,在数据表中可以对列或行进行操作.如移动列,插入列,拷贝列或删除列,隐藏列,固定列;添加行或删除行,按变量的值对行排序;以及浏览变量名或列标签.,27,数据操作 对列的操作-在浏览(或编辑)模式下

13、,1. 改变列的显示顺序 由查看(View) = 列(Columns) = 移动(Move) 在出现的Move Columns( 移动列)对话窗口选中想移动的变量按箭头方向上下随意移动来改变列的显示次序. 也可以先选中某列(该列加亮),然后点鼠标右键,在弹出的菜单项中选 Move来改变列的显示顺序。 以下介绍的其它列操作也可用类似的方法。,28,数据操作 对列的操作-在浏览(或编辑)模式下,2. 隐藏一些列不显示 由查看(View) =列(Columns) = 隐藏(Hide ) 在出现的Hide Columns(隐藏列)对话窗口选中想 隐藏起来不显示的变量放到Hide框里,然后按OK 可以让

14、所选中的几列不显示。 若由查看(View) =列(Columns) = 取消隐藏 (Hide ) 又可以把已被隐藏不显示的列重新显示在数据表中。,29,数据操作 对列的操作-在浏览(或编辑)模式下,3. 固定几列在表的前面不随游标而左右移动 由查看(View) =列(Columns) = 保持(Hold) 可以固定选中的几列总保持在表的左边位置显示.,4. 用列标签显示 由查看(View) =列(Columns) = 标签(Lables) 要求用变量(列)的标签显示数据表。,30,数据操作 对列的操作-在编辑模式下编辑数据,1. 插入新变量(列): 由 编辑(Edit) = 插入列(Inser

15、t Column) = 选字符型(Character)或数值型 (Numeric), 即可在数据表的最右边或选中变量(列)的左边插入新 变量.,2. 拷贝选中的一列或几列 首先选中数据表中要复制的几个列,然后 由 编辑(Edit)= 复制(Duplicate) 把它们复制到所选中列的面前.,31,数据操作 对列的操作-在编辑模式下编辑数据,3. 删除选中的一列或几列 首先选中数据表中要删除的某个列或几个列,然后 由编辑(Edit) = 删除 (Delete) 可删除选中的列.,32,数据操作 对行的操作-在编辑模式下编辑数据,在分析家窗口将光标置于打开数据表的某一行序号上并点击右键,就表示选中

16、该行,同时在弹出菜单中也显示了可对这一行进行的操作: Add在数据表的最后加入一新行; Duplicate将该行复制到数据表的最后一行; Delete-删除选中的行.,33,数据操作 对行的操作-在编辑模式下编辑数据,或者先选中某行,然后 由编辑(Edit) = 删除 (Delete) 则系统在询问对话框得到肯定后立即将把这一行 从数据表中删除; 或由编辑(Edit) =复制(Duplicate) 则将选中的行复制到数据表的最后一行. 由编辑(Edit) = 添加行 (Add row) 则在数据表的最后加入一新行.,34,数据操作 存贮数据,可以存贮数据表中的数据为SAS支持的任何 格式,包括

17、SAS数据集,文本文件,Excel和Lotus文件. 由 文件(File)=保存(Save),可存贮修改后 的数据集; 由文件(File)=另存为(Save as),可存贮当 前数据表为非SAS格式或存为其它SAS数据集. 由文件(File)=用SAS名称另存为(Save as SAS name),可存贮当前数据表为所选择的SAS 库中的SAS数据集.,35,数据操作 筛选数据,由 数据(Data) =过滤(Filter), 然后选择取数据子集(Subset data) ,并对数据集应用 Where条件(如SEX=M) 来浏览数据集的子集. 若要保存,可 选 文件 = 另存为 SAS . (比

18、如找出所有男生的观测),36,数据操作 排序对话窗(编辑模式),由 数据(Data)=排序(Sort), 可对数据表里的行进行排序.先从 候选的变量列表中选择用于排序的 变量;如选中的变量不只一个,对Sort by列表可用向上或向下的箭头规定 排序变量的顺序;选中一变量后,还可 规定按上升或下降的次序排序.,37,数据操作 产生某些分布的随机变量(编辑模式),由 数据(Data)=随机变量 (Random Variates), 可生成基于某个分布的随机变量. 分布包括正态分布,均匀分布,二项 分布,泊松分布,指数分布,伽码分布,几何分布,极值分布.,38,数据操作 分组概括数据,由 数据(Da

19、ta)=按组汇总 (Summarize by Group) , 可对数据表里的观测按分组变 量所分成的几个组分别计算概 括统计量.,39,数据操作 产生随机样本,由数据( Data)=随机抽样 (Random Sample), 可由原数据表生成用户指定样 本个数为n(或抽取的比例)的随 机样本.,40,数据操作 生成汇总报表,由 报表 (Report)= 数据列表(List Data), 可用列表方式显示数据表里数据 (可选择id变量,列表变量等).,由报表(Report)=表.(Tables) , 可用汇总报表的方式生成五种形 式的报表.,41,数据操作 生成汇总报表,选择菜单项报表(Rep

20、orts)=表.(Tables),再选择一 种表格形 式进行设 置.如选择表格(5),(1),(2),(3),(4),(5),42,数据操作 生成汇总报表,Summary标签下汇总了变量的选择,43,数据操作 生成汇总报表,Options按键可 打开设置附加 选项的窗口,Total,Total,44,数据变换 在编辑模式下,1. 计算新变量 由 数据(Data) = 变换(Transform) = 计算(Compute), 将显示计算对话窗,利用这个窗口来规定 关系式,公式或表达式,以便在数据表中生 成新的变量(列).,45,数据变换 在编辑模式下,2. 求秩(Rank) 由数据(Data)=

21、变换(Transform)=求秩(Rank), 将显示求秩对话框,利用这个窗口来变量(列)的 秩(包括简单秩等).,3. 对变量标准化 (Standardize) 由数据(Data) =变换(Transform) =标准化(Standardize) , 将显示变量标准化对话窗,利用这个窗口 可以将变量(列)标准化.,46,数据变换 在编辑模式下,4. 重新定义记录的值(Recode Values) 由 数据(Data)=变换(Transform)=记录值(Recode Values),将显示重新定义记录值的对话窗,利用这个窗口可以对某一个列重新赋值,5. 重新定义记录的范围(Recode Ra

22、nge) 由数据(Data)=变换(Transform)=记录范围 (Recode Range),将显示重新定义记录范围的对话 窗,利用这个窗口可以对某一个列按照一定的区 域重新赋值.,47,数据变换 在编辑模式下,6. 转换变量类型(Convert Type.) 由 数据(Data)=变换( Transform)= 转换类型(Convert Type.),将显示转换变量类型对话窗,利用这个窗口来指定将转换的变量(把数值型转换为字符型,或反之).,7. 计算对数(Log(Y) :先选中一数值变量, 由数据(Data)=变换( Transform)= Log(Y),对该变量进行对数变换,并得到新

23、的变量。,48,数据变换 在编辑模式下,8. 计算平方根 (Sqrt(Y): 先选中一数值变量,由 数据(Data)=变换( Transform)= Sqrt(Y), 对该变量进行求平方根变换,并得到新的 变量。,9. 计算倒数(1/Y) :先选中一数值变量, 由数据(Data)=变换(Transform)= 1/Y,对该变量进行求倒数变换,并得到新的变量。,49,数据变换 在编辑模式下,10. 计算平方(Y*Y) :先选中一数值变量, 由数据(Data)=变换(Transform) = Y*Y, 对该变量进行求平方变换,并得到新的变量.,11. 计算指数(Exp(Y) :先选中一数值变量,

24、由数据(Data)=变换(Transform)= Exp(Y) ,对该变量进行求指数变换,并得到新的 变量。,50,合并数据表,合并数据表功能是版本8新增加的功能. 可按列来合并数据表,或者按行连接数据表. (1)由数据 (Data)=合并表(Combine Tables) =按列合并(Merge by Columns) 可将指定的几个数据表由By变量匹配合并. (2)由数据(Data) =合并表(Combine Tables) =按行合并(Concatenate by Rows) 可将指定的几个数据表按行串接成新数据表.,51,合并数据表,A,B,A B,A B,合并表,数据串接,SAS 数

25、据集,SAS 数据集,数据并接,52,合并数据表 串接SAS数据集-简单连接,NUM VARA 1 A1 2 A2 5 A3,串接(Concantenate),A:,B:,NUM VARA VARB 1 A1 2 A2 5 A3 3 B1 4 B2 6 B3,COMBINE:,NUM VARB 3 B1 4 B2 6 B3,把第二个数据集B的观测串接在第一个数据集A的所有观测后面,53,NUM VARB 3 B1 4 B2 6 B3,合并数据表 串接SAS数据集-插入式连接,NUM VARA 1 A1 2 A2 5 A3,串接(Interleave),A:,B:,NUM VARA VARB 1

26、 A1 2 A2 3 B1 4 B2 5 A3 6 B3,COMBINE:,按两个数据集A和B的共同变量NUM的值排次序后串接在一起(analyst41.sas),54,合并数据表 串接SAS数据集,在Analyst环境下要串接 数据集可在下拉菜单选: (1) 数据(Data) 合并表( Combine Tables) 按行连接( Concatenate by Rows),(2) 选要串接的数据集 (3)指定是简单连接还是插入式连接 (4) 选择串接的变量名,55,合并数据表 并接SAS数据集-匹配合并,NUM VARA 1 A1 2 A2 3 A3,NUM VARB 1 B1 2 B2 4

27、B3,并接(Match Merge),C:,D:,NUM VARA VARB 1 A1 B1 2 A2 B2 3 A3 4 B3,COMBINE:,按两个数据集C和D的共同变量NUM的相同值匹配合并. (analyst42.sas),56,合并数据表 并接SAS数据集,在Analyst环境下要并接数据集可在下拉菜单选: (1)数据(Data) 合并表( CombineTables) 按列合并Merge by Columns,(2)选并接的数据集 (3)指定并接的方式(有三种:见右边屏幕的中间) (4) 选by变量 (5) 选择并接的变量名,57,数据的转置及堆叠和拆分 转置数据集,当希望把数据

28、表中的某些列变为行,行变为列 时,可用此项功能.在浏览模式下, 由 数据(Data)=转置(Transpose), 则显示转置对话窗,在这里可以规定将被转置 的一些(变量)列(Transpose)名字;还可以规定 一个变量(Group by),用于转置时按该变量的不 同值进行转置.转置后新列的前缀用户可以规 定,记录源变量名的列名也可以规定,当然也可 以用缺省名字.,58,数据的转置及堆叠和拆分 转置数据集例1,例1:SAS数据集produ中包含三种产品从2002年1月开始共15个月的销售数据,即三个观测16个变量(3行16列)的SAS数据集,其中变量LIME记录产品号。为了分析三种产品的销售

29、量如何随时间而变化的规律,首先应把该数据集转化为3个变量(即三种产品)15个观测(即15个月份的销售量)的数据;在转化后的数据集中还要求加上日期变量DATE。,(analyst51.sas),59,数据的转置及堆叠和拆分 转置数据集-例1,转置,数据集Produ,Analyst: 数据(Data) 转置(Transpose),60,数据的转置及堆叠和拆分 转置数据集的具体步骤,1.启动“分析家”,并打开数据集Produ; 2.选 数据(Data) 转置(Transpose); 3. 在转置窗口下, 选中想要转置的变量(这里是t1t15),然后点击Transpose,即把选中的变量送到Trans

30、pose窗口内; 规定转置后列变量的名字,如规定列变量名的前缀为PRODU,缺省时前缀名字为COL; 规定存放转置后源变量的列名字,缺省时名字为 _SOURSE_; 按OK键.,61,数据的转置及堆叠和拆分 转置数据集的具体步骤,4. 存贮转置后的数据为一新的SAS数据集 文件(File)=用SAS名字另存为=选择逻辑库,并规定数据集的名字(如Product)后按保存键. 5. 加工数据集Product; 因转置后生成的数据集没有日期变量Date,以下步骤就是用来增加一个日期变量. 打开刚生成的SAS数据集Product,并转换为编辑模式; 选数据(Data) 变换(Transform) 计算

31、(Compute) 在以下出现的Compute:Product窗口做以下的选择:,62,数据的转置及堆叠和拆分 转置数据集的具体步骤,(计算公式由SAS日期时间函数给出),63,数据的转置及堆叠和拆分 转置数据集的具体步骤,选择正确后,按OK键,则在数据表窗口变量列后面生成新变量Date,但此时该变量的值为日期时间相应的数值. 选中变量Date,点右键,在弹出的子菜单中选Properties,然后在出现的列属性 Column Properties对话框中修改输出格式为Format:MONYY7.;按OK键. 变量_SOURSE_在这里没有用,可以删除. 把符合要求的数据表存为SAS数据集(如仍

32、用名字Product).,64,数据的转置及堆叠和拆分转置数据集-例2,例2:SAS数据集trans中包含某企业从1981年至1995年的销售资料.该数据集的每个观测记录年度及该年12个月的销售量,共有15行13列.为了分析该企业月销售量如何随时间而变化的规律,请把该数据集转化为2个变量(DATE和SALES)180个观测(即15年12个月)的数据.,(analyst52.sas),65,数据的转置及堆叠和拆分 转置数据集-例2,按年转置 并加日期,66,数据的转置及堆叠和拆分 转置数据集的具体步骤,1.启动“分析家”,并打开数据集trans; 2.选数据(Data) 转置(Transpose

33、); 3. 在转置窗口下, 选中想要转置的变量(这里是jandec),然后点击Transpose,即把选中的变量送到Transpose窗口内; 选Group by变量(这里是YEAR),然后点击 Group by,即把选中的变量送到Group by窗口内; 规定转置后列变量的名字,如规定列变量的前缀名为SALES; 规定转置后源变量的列名字,缺省时名字为_SOURSE_; 按OK键.,67,数据的转置及堆叠和拆分 转置数据集的具体步骤,68,数据的转置及堆叠和拆分 转置数据集的具体步骤,4. 存贮按年转置后的数据为一新的SAS数据集 文件(File)=用SAS名字另存为=选择逻辑库,并规定数据

34、集的名字(如Trans1)后按保存键. 5. 加工数据集Trans1; 因转置后生成的数据集没有日期变量Date,以下步骤就是用来增加一个日期变量. 打开刚生成的SAS数据集Trans1,并转为编辑模 式; 选数据(Data) 变换(Transform) 计算(Compute) 在Compute:Product窗口选择合适的日期时间函数,给出的计算公式,并计算出DATE的数值.,69,数据的转置及堆叠和拆分 转置数据集的具体步骤, 选中变量Date,点右键,在弹出的下拉菜单中选Properties,然后在出现的列属性 Column Properties对话框中修改输出格式为Format:YYM

35、MDD8.;按OK键. 变量_SOURSE_和YEAR在这里没有用,可以删除. 把符合要求的数据表存为SAS数据集(如用名字Trans2).,70,数据的转置及堆叠和拆分 加工数据集-堆叠列(Stacking Column),把选中的几个(变量)列的数值叠加为一列(即 每一个观测行叠加后变成几个观测行).在浏览 模式下, 由 数据(Data)=堆叠列 (Stacking Columns) 则显示叠加列的对话窗,在这里可以规定将叠加为一 列的哪几个变量列的名字;还可以规定叠加后新列的 名字,及规定一个名字用于记录叠加的这些列名. 当数据表中每个观测的一些数值是对同一个对象 重复几次测量得到的,叠

36、加列的功能特别有用 (见pr0 数据集) .,71,数据的转置及堆叠和拆分 加工数据集-堆叠列例子,例3. 数据集PRO记录了27个人在8岁,10岁,12 岁,14岁的生长指数(用Y1Y4表示).因分析处 理的需要,希望把每一行记录(观测) ,如 person sex y1 y2 y3 y4 1 F 21 20 21.5 23 加工为 person sex age y 1 F 8 21 1 F 10 20 1 F 12 21.5 1 F 14 23 加工后生成的新数据集PR包含有274=108行4列.,(analyst53.sas),72,数据的转置及堆叠和拆分 加工数据集-堆叠列例子的具体步

37、骤,1.启动“分析家”,并打开数据集PRo; 2.选数据(Data) 堆叠列(Stacking Column); 3. 在堆叠列窗口下, 选中想要堆叠的变量(这里是Y1Y4),然后点击Stack ,即把选中的变量送到Stack窗口内; 规定堆叠所成的新列的名字为Y (缺省时名字为_Stack_); 规定记录被堆叠的源变量的名字,缺省时名字为_Source_; 按OK键.,73,数据的转置及堆叠和拆分 加工数据集-堆叠列例子的具体步骤,Y,74,数据的转置及堆叠和拆分 加工数据集-堆叠列例子的具体步骤,4. 存贮堆叠后的数据为一新的SAS数据集 文件(File)=用SAS名字另存为=选择逻辑库,

38、并规定数据集的名字(如PR1)后按保存键. 5. 加工数据集PR1; 因堆叠后生成的数据集没有记录年龄的变量AGE,以下步骤就是用来增加一个年龄变量. 打开刚生成的SAS数据集PR1,并转为编辑模式; 选数据(Data) 变换(Transform) 记录值(Recore) 在出现的记录值信息窗口修改新列的名字 为AGE;,75,数据的转置及堆叠和拆分 加工数据集-堆叠列例子的具体步骤,76,数据的转置及堆叠和拆分 例2的另一解法-堆叠列的具体步骤,1.启动“分析家”,并打开数据集trans; 2.选数据(Data) 堆叠列(Stacking Column); 3. 在堆叠列窗口下, 选中想要堆

39、叠的变量(这里是jandec),然后点击Stack ,即把选中的变量送到Stack窗口内; 规定堆叠所成的新列的名字为Sales (缺省时名字为_Stack_); 规定记录被堆叠的源变量的名字,缺省时名字为_Source_; 按OK键.,77,数据的转置及堆叠和拆分 例2的另一解法-堆叠列的具体步骤,4.存贮堆叠后的数据为一新的SAS数据集 文件(File)=用SAS名字另存为=选择 逻辑库,并规定数据集的名字(如trans1) 后按保存键. 5. 加工数据集trans1; 因转置后生成的数据集没有日期变量 Date, 用与例2类似的方法来增加一个日 期变量.,78,数据的转置及堆叠和拆分 加

40、工数据集-拆分列(Splitting Column),把选中的一个将被分拆的(变量)列,按分拆by变量 的不同值分拆为几个新列.新列的名字用户可以规定 名字的前缀,也可以使用缺省的名字. 在浏览模式下, 由 数据(Data)= 拆分列(Split Columns), 则显示分拆列的对话窗,在这里可以规定将被分拆的 变量列名字;还可以规定分拆后新列的名字.比如想把 数据表中某个数值变量y的值按性别的不同分拆为二 列,则可以此项功能.,79,生成图形功能,在Analyst中可以生成以下几种类型的图形: 1. 条形图Bar Plot(V8) 2. 饼图Pie Plot(V8),80,生成图形功能,在

41、Analyst中可以生成以下几种类型的图形: 3. 直方图Histogram Plot 4. 盒型图Box Plot,81,生成图形功能,在Analyst中可以生成以下几种类型的图形: 5. 概率图Probability Plot 6. 散点图Scatter Plot,82,生成图形功能,在Analyst中可以生成以下几种类型的图形: 7. 等高线图Contour Plot 8. 曲面图Surface Plot,83,统计分析功能,描述统计(Descriptive): 1. 汇总统计量(Summary Statistics)-计算概括统计量 可以计算的概括性统计量有:均值、标准差、标准误、方差

42、、最小值、最大值、极差、求和、中位数、偏度、峰度等 可以输出直方图、盒型图 2. 分布(Distributions)-研究变量的分布 拟合正态、log正态、指数、Weibull分布 输出盒形图、直方图、概率图和Q-Q图,84,统计分析功能,描述统计(Descriptive): 3. 相关(Correlations)-计算变量间的相关关系 计算变量间的相关系数 绘制散点图和置信椭圆 4. 频数统计(Frequency Counts)-产生频数表 频数表,取值的百分比等 条形图,85,统计分析功能,列联表分析(Table Analysis ): 对两个或两个以上属性变量生成交叉表(二维列联表).在

43、Analyst中,由 统计(Statistics) 表分析(Table Analysis) 进入列联表分析的主窗口,选择列变量,行变量,分层变量(如果有),及单元频数变量. 按Input键,选择变量值的次序. 按 Statistics键,选择是否计算无关联性统计量,精确检验等. 按Table键来确定频数表所包含的内容.,86,统计分析功能,假设检验(Hypothesis Tests ): 可完成一个总体的4种检验: 单样本均值的 z 检验(总体方差已知) ; 检验在总体方差已知的情况下,均值是否等于某常值 单样本均值的 t 检验(总体方差不知道); 检验在总体方差未知的情况下,均值是否等于某常

44、值 单样本比率检验 检验两水平的变量为某一水平的比例是否等于某常值 单样本方差的检验. 检验一个变量的方差是否等于某常值.,87,统计分析功能,假设检验(Hypothesis Tests ): 可完成二个总体的4种检验: 两独立样本均值的t检验 ; 检验两组个体某个变量均值是否相差一个常数,或者两个变量均值是否相差一个常数 成对数据均值的t检验; 检验成对的两个变量的差值的均值是否等于常数,88,统计分析功能,假设检验(Hypothesis Tests ): 可完成二个总体的4种检验: 两样本比率的检验 ; 一个二值的变量在两个不同的组中取同一个水平的比率差值是否等于某一个常数,或者两个二值变

45、量取值为同一水平的比率差值是否等于某一个常数 两样本方差比的检验. 一个变量在两个不同的组中方差是否相等,或者两个变量方差是否相等,89,统计分析功能,方差分析(ANOVA): 可完成以下几种方差分析: 1. 单因子方差分析 ; 查看一个因子在不同的水平下响应变量是否有差异 2. 非参数单因子方差分析; 使用非参数的方法,查看一个因子在不同的水平下响应变量是否有差异 3. 多因子方差分析 ; 查看多个因子及其交互作用在不同的水平下响应变量是否有差异.,90,统计分析功能,方差分析(ANOVA): 可完成以下几种方差分析: 4. 线性模型 ; 使用一般线性模型(GLM)过程进行方差分析. 5.

46、重复测量分析 ; 执行REPEATED语句、MIXED过程来处理纵向数据的问题 6. 混合模型. 执行MIXED过程来进行方差分析.,91,统计分析功能,回归分析(Regression): 可完成以下几种回归分析: 1. 简单回归分析(只有一个自变量) ; 统计(Statistics) =回归(Regression)=简单(Simple) 一个响应变量对一个自变量的回归模型,其中自变量可以取到三阶。 2. 多元线性回归分析; 统计(Statistics)=回归(Regression)=线性(Linear) 拟合多元线性回归分析模型 3. Logistic回归分析; 统计(Statistics)

47、=回归(Regression) = Logistic 对离散响应变量拟合Logistic模型进行回归分析,92,“分析家”的数据管理功能 练 习 题,1、浏览数据表: (1) 用分析家打开数据集CLASS,浏览该数据集的属性,该数据集有多少个变量,多少个观测值?变量是否使用标签?,93,“分析家”的数据管理功能 练习题,(2) 把变量WEIGHT移到数据表的第一列,而变量HEIGHT移到数据表的第二列; (3) 对变量NAME加上标签名Students Name. 2、数据集排序对数据集CLASS: (1) 按AGE对数据集从大到小或从小到大重新排序,找出年龄最大的学生的身高和体重; (2)

48、按变量AGE和HEIGHT排序,找出15岁的学生中身高最大的数值。,94,“分析家”的数据管理功能 练习题,3、建立新变量-对数据集CLASS: 创建一个名为WHRATIO的新变量,其值等于体重与身高的比,并在其标签名中注明:体重身高比. 4、建数据集的子集: 将数据集CLASS中的所有男生抽取出来,生成新的数据集,并把它另存为 WORK.MCLASS. 5、转置或堆叠数据集: 对以下数据集V2,95,“分析家”的数据管理功能 练习题,V2中的5个变量是表示5种胶合板的品牌.每种品牌抽取4个样品做磨损试验得到的数据(磨损量).为了检验5种品牌的质量有无显著差异,使用方差分析方法来分析这组数据之前需对该数据集进行整理-转化为以下形式的数据集:,96,“分析家

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1