Stata简介及基本操作[教育课件].ppt

上传人:rrsccc 文档编号:10058708 上传时间:2021-04-15 格式:PPT 页数:33 大小:538.50KB
返回 下载 相关 举报
Stata简介及基本操作[教育课件].ppt_第1页
第1页 / 共33页
Stata简介及基本操作[教育课件].ppt_第2页
第2页 / 共33页
Stata简介及基本操作[教育课件].ppt_第3页
第3页 / 共33页
Stata简介及基本操作[教育课件].ppt_第4页
第4页 / 共33页
Stata简介及基本操作[教育课件].ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《Stata简介及基本操作[教育课件].ppt》由会员分享,可在线阅读,更多相关《Stata简介及基本操作[教育课件].ppt(33页珍藏版)》请在三一文库上搜索。

1、Stata 简介及基本操作,一、为什么使用Stata? Stata 是目前在欧美最为流行的计量软件,具有操作简单、功能强大的特点。由于使用Stata 的用户很多,对于最新的计量方法,常常可以下载由用户写的Stata 命令程序,十分方便。而官方的Stata版本也经常更新,以适应计量经济学迅猛发展的需要。 Stata 11 已于2009 年出版,但由于在中国普遍使用的仍是Stata 10,我们主要介绍Stata 10。,1,学习课件,1. 面临的问题 研究者经常地希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的软件是不存在的,不存在哪个软件能解决所有的问题。 计量经济学发展迅速,新的方法

2、层出不穷,而软件公司将这些新方法嵌入到软件中是存在滞后的。,2. 解决方案 Stata以其操作简单、运行快速而精确,全面的数据管理功能,精致的作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、物理、化学等多个学科领域得到广泛使用。 请浏览:,2,学习课件,3. STATA简介:发展历史,(1)Stata是一个用于数据管理和分析的统计软件,由Stata公司(StataCorp)研制开发。从1985开始,先后开发了1.1, 1.2,等多个版本。目前Stata的最新版本为2009年7月份推出的Stata 11.0。 (2)St

3、ata 11包括四种版本:Small(小型版)、IC(标准版)、SE(特别版)和MP(多处理器版)。其中属MP版本最为强大。MP版与SE版的功能完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏输入about 查看所安装的Stata所属的版本。,3,学习课件,(3)不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244字节,最大矩阵阶数为11000(即1100011000)。 Stata默认值为:最大变量个数为5000,最大矩阵阶数为400,最大内存为50兆(在Stata10中为10m)。如果用户需要更

4、多的内存或者更多的变量,可以在命令栏输入如下命令进行扩展。 . set maxvar # (.set maxvar 5000 ) . set maxsize # (.set maxsize 1000 ) . set memory #m (.set memory 50m ),4,学习课件,4. STATA简介:主要特点与功能 统计分析与计量分析的结合:, (1)单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计作图。 (2)多元统计:MANOVA、主成分、因子分析、典型相关、聚类、判别分析、对应分析、多维标度。 (3)线性回归、非线性回归、工具变量回归、广义线性回归、分位数

5、回归(稳健回归)、系统方程模型(SUR、联立方程)、离散选择模型(二项选择、排序选择、多项选择、条件Logit、嵌套Logit模型、二元选择模型等)、计数模型(泊松回归、负二项回归)、截断与归并模型、海克曼选择模型、逐步回归(stepwise)等。,5,学习课件, (4)时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、Johansen协整检验、VAR、VEC、滚动回归等。 (5)面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方程(GMM)、随机边界模型等)。 (6)调查数据分析 (7)生存分析 (8)蒙特卡洛模拟、自举法(bootstrap)、刀

6、切法(jackknife),6,学习课件,丰富的网络资源: http:/www.stata- http:/www.stata- 严谨、简练、灵活的程序语言: Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,也可以制作自己的对话框和窗口菜单。 强大的矩阵运算功能:Mata Mata是Stata的矩阵运算语言,实现各种运算。 兼容性: 在Stata中可以直接运行其它程序;其他语言编写的程序可以作为插件(Plugin)直接嵌入到Stata中。,7,学习课件,二、Stata 的窗口 安装好 Stata 后,点击电脑桌面上的Stata 图标,即可打开Stata。此时可以看到,在

7、最上方有一排菜单,即“File Edit Data Graphics Statistics User Window Help”。在此之下,有四个窗口,分别为:,左上“Review”(历史窗口):此窗口记录着自启动Stata以来执行过的命令。,左下“Variables”(变量窗口):此窗口记录着目前Stata 内存中的所有变量。,右上“Results”(结果窗口):此窗口显示执行Stata 命令后的输出结果。,右下“Command”(命令窗口):在此窗口输入想要执行的Stata 命令。,8,学习课件,为了使屏幕分割更美观实用,可以用鼠标将以上窗口拉到任意大小与位置。然后点击菜单Edit”“Pre

8、ferences” “General Preferences” “Windowing” “Lock splitter”,就可以锁定当前画面,而在以后重启Stata 时自动显示这个画面设置。,9,学习课件,Stata 的主界面,10,学习课件,三、Stata 操作,1将数据导入Stata 打开Stata 软件后,点击Data Data Editor 图标,即可打开一个类似Excel的空白表格。然后,用Excel 打开文件“实验数据.xls”,复制文件中的相关数据,并粘贴到Data Editor 中。 导入数据的另一方法是,点击菜单“File”“Import”,然后导入各种格式的数据。但这种方法有

9、时不如直接从Excel 表中粘贴数据来得方便直观。,11,学习课件,关闭 Data Editor 后,即会看到左下方的“Variables”窗口出现了8 个变量,分别为year、gdp、index、index1978、gov、pop、deflator、gcons。,12,学习课件,此时,可以点击 Save 图标(也可以点击菜单“File” “Save”),将数据存为Stata 格式的文件(扩展名为dta),比如wanger_law.dta。 这样,以后就可以用Stata 直接打开这个数据集了(不需要再从Excel 表中粘贴过来)。 打开的方式有两种。可以点击Open 图标(也可以点击菜单“Fi

10、le”“Open”),然后寻找要打开的dta 文件的位置。 另外一种方法是在命令窗口输入以下命令(假设文件在E 盘的根目录)并回车(按Enter 键),,use E:wagner_law.dta,clear,其中,选择项“clear”表示可以替代内存中的已有数据。,13,学习课件,如果要关闭一个数据集(如果对数据集进行了改动,别忘了先存盘Save),以便使用另外一个数据集,可以在命令窗口输入: . clear 这样,内存中所有的当前数据都被清空,然后可以再打开另外一个数据集。,14,学习课件,2变量的标签 在变量窗口,每个变量的“名字”(Name)旁边显示了其“标签”(label)。但目前的标

11、签过于简略,缺乏变量的解 释信息。 如果想将变量“gov”的标签改为“government expenditures”,可进行如下操作。以鼠标的右键点击变量名“gov”,然后选择“Edit variable label”,输入“government expenditures”即可。此时,再去看变量“gov”的标签,就已经改为“government expenditures”。另外,在右上角的结果窗口出现了以下一行命令: . label variable tc government expenditures ,这表明,直接在命令窗口输入上面这行命令,也能达到一 样的效果,但不如直接在变量上点击右

12、键操作方便。,注意:Stata 中字母的大小写是严格区分的,因此Stata 建议对于变量名一律使用小写字母。,15,学习课件,3审视数据 一个数据集可能很大,而我们常希望看到数据的概貌。想看数据集中的变量名单、标签等,可以在命令窗口输入: . describe,如果想给整个数据集加上一个标签,以说明这个数据集来自“Wagner Law 1978-2009”,可输入命令: . label data Wagner Law 1978-2009,如果再次使用命令“describe”,就会看到数据集的标签 “Wagner Law 1978-2009”。,如果想看变量 gov、gcons与gdp的具体数据

13、,可使用命令: . list gov gcons gdp,注意:如果数据较长,可用Ctrl+Break终止显示。,16,学习课件,有时我们想对数据集的一部分执行命令,比如只想看变量gov 与gdp 的前5 个数据,则可输入命令: . list gov gdp in 1/5,也可以通过逻辑关系来定义数据集的子集。如果要列出所有满足条件“year 1995”的变量gov与gdp 的数据,则可以使用以下命令: . list year gov gdp if year=1995,其中,“=”表示“大于等于”。其他表示关系的逻辑符号为“= =”(等于),“”(大于),“”(小于),“=”(小于等于),“=

14、”或“!=”(不等于)。查看具体数据的一个直接方法是,点击Data Editor 图标。,17,学习课件,如果想删除满足“year 2001”条件的观测值,则可使用命令: . drop if year=2001,反之,如果只想保留满足“year2001”条件的观测值,而删去所有其他观测值: . keep if year=2001,18,学习课件,5考察变量的统计特征 如果想看变量 gov、gcons和gdp的统计特征,可输入命令: . summarize gov gcons gdp,Variable Obs Mean Std. Dev. Min Max gov 3214454.13 19217

15、.2 1122.09 76299.93 gcons 3211441.76 12730.41 480 44396.9 gdp 3280670.91 94125.313645.218 340506.9,满足条件的统计: . summarize gov gcons gdp if year2000,如果不指明变量,则将显示数据集中所有变量的统计指标。 summarize,如果要显示内存中某些变量之间的相关系数,可输入命令: . correlate gov gcons pop gdp,19,学习课件,5画图 Stata 具有很强的画图功能。如果想看变量q 的直方图(假定组宽为1000),可输入以下命令:

16、 . histogram q, width(8000) frequency,20,学习课件,由于直方图不连续,如果想看连续的经验分布图,可使用以下命令: . kdensity gov,21,学习课件,如果要画 gov 与gdp 之间的散点图,则可输入以下命令: scatter gov gdp,22,学习课件,如果想在散点图上同时画出回归直线,可以使用如下命令: . twoway (scatter gov gdp)(lfit gov gdp),其中,“lfit”表示“linear fit”(线性拟合)。,23,学习课件,6生成新变量 如果要估计以下方程:,为了估计这个方程,需要在 Stata 中

17、对原变量取对数,可使用命令“generate”。 . generate lngov=log(gov) . generate lngdp=log(gdp) . reg lngov lngdp,如果要生成“虚拟变量”,定义为:,Stata命令为: generate dum=(if year=1995),24,学习课件,删除变量: drop 变量名 如:drop dum 修改变量值 replace 变量名=表达式 条件 如:replace dum=0 if year=1990,25,学习课件,在执行 Stata 命令时,有时需要调用许多变量,而某些变量名可能很长。此时,如果在命令窗口一一输入变量名,

18、可能较费事。 解决方法之一是:可以直接在左下角的“变量窗口”单击需要的变量,则该变量名就会显现在命令窗口。 解决方法之二是,如果有以下变量lnq1, lnq2, , lnq30,而只想使用其中的前15 个变量,则可以用lnq1-lnq15 来简略地表示这15 个变量。 解决方法之三是,用“*”号来节省变量名的书写。 假设想将内存中所有以“ln”开头的变量都去掉,则可输入命令: . drop ln*,26,学习课件,7Stata 的计算器功能 Stata 也可以作为计算器来使用。只要输入命令“display expression”即可。 比如“display log(2)”将计算ln 2。,27

19、,学习课件,8线性回归分析 使用 OLS 对方程进行估计,可输入命令: reg lngov lngdp,上表中的“_cons”表示常数项,“R-squared”显示R2 =0.9676,“Adj R-squared”显示0.9665。检验整个方程显著性的F 统计量之p 值(Prob F)为0.0000,显示这个回归方程是高度显著的。残差平方和为1.77,方程标准差Root MSE为0.24。,28,学习课件,如果要显示估计系数的协方差矩阵,可输入命令, . vce 其中,“vce”表示“variance covariance matrix estimated”。,在进行回归时,如果不要常数项,

20、可以加上选择项 “noconstant” reg lngov lngdp,noconstant,29,学习课件,如果要计算被解释变量的拟合值 ,并将其记为lntchat,可输入命令: . predict lntchat,如果要计算“残差”(residual),并将其记为e1,可输入命令: . predict e1,residual 其中,选择项“residual”表示预测残差。,30,学习课件,9Stata 的日志 如果希望在每次使用 Stata 时,储存其运行结果,可点击菜单“File”“Log”“Begin”,然后输入日志(log)的文件名,并存储在你指定的位置。从此以后,你在Stata中

21、的所有操作及其输出结果,都将被记录在此日志中,直至你选择退出。 如果要暂时关闭日志(不再记录输出结果),可输入命令“log off”。如果要恢复使用日志,可输入命令“logon”。如果要彻底退出日志,只要输入命令“log close”即可。如果要查看日志文件中的内容,只要点击存储位置上的日志文件图标即可。,31,学习课件,四、Stata 命令库的更新 由于 Stata 版本的不同(即使同为Stata 10),如果你发现某些命令无法运行,可在命令窗口输入, . update all 这将更新你的 Stata 命令库(包括Stata 的“ado”程序文件与其他可执行文件)。,32,学习课件,五、

22、进一步学习Stata 的资源 更多有关 Stata 的知识,将在本课程以后的内容中逐步介绍。 有关 Stata 的英文参考书包括Baum(2006)与Cameron and Trivedi(2009),中文参考书包括陈传波Stata 十八讲、劳伦斯汉密尔顿(2008 译)、王群勇(2007)、王天夫、李博柏(2008)。,加州大学洛杉矶分校( UCLA ) 网站 (http:/www.ats.ucla.edu/stat/stata/)提供了大量有关Stata的资源及实例(搜索“Stata UCLA”即可找到此网站)。 当然,Stata 本身的“帮助”(Help)菜单已经包含了详细的信息。在使用Stata 命令时(比如,reg),宜养成习惯,经常看其对应的帮助信息(输入命令“h reg”即可)。,33,学习课件,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1