Stata-简介及基本操作PPT课件.ppt

上传人:rrsccc 文档编号:9878288 上传时间:2021-04-01 格式:PPT 页数:33 大小:204.50KB
返回 下载 相关 举报
Stata-简介及基本操作PPT课件.ppt_第1页
第1页 / 共33页
Stata-简介及基本操作PPT课件.ppt_第2页
第2页 / 共33页
Stata-简介及基本操作PPT课件.ppt_第3页
第3页 / 共33页
Stata-简介及基本操作PPT课件.ppt_第4页
第4页 / 共33页
Stata-简介及基本操作PPT课件.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《Stata-简介及基本操作PPT课件.ppt》由会员分享,可在线阅读,更多相关《Stata-简介及基本操作PPT课件.ppt(33页珍藏版)》请在三一文库上搜索。

1、1,Stata 简介及基本操作,一、为什么使用Stata? Stata 是目前在欧美最为流行的计量软件,具有操作简单、功能强大的特点。由于使用Stata 的用户很多,对于最新的计量方法,常常可以下载由用户写的Stata 命令程序,十分方便。而官方的Stata版本也经常更新,以适应计量经济学迅猛发展的需要。 Stata 11 已于2009 年出版,但由于在中国普遍使用的仍是Stata 10,我们主要介绍Stata 10。,2,1. 面临的问题 研究者经常地希望利用多种方法从不同角度对数据进行分析,但拥有绝对优势的软件是不存在的,不存在哪个软件能解决所有的问题。 计量经济学发展迅速,新的方法层出不

2、穷,而软件公司将这些新方法嵌入到软件中是存在滞后的。,2. 解决方案 Stata以其操作简单、运行快速而精确,全面的数据管理功能,精致的作图,强大的统计与计量分析功能,简练标准的程序与矩阵运算功能、丰富的网络资源,在统计学、经济学、金融学、心理学、计算机科学、物理、化学等多个学科领域得到广泛使用。 请浏览:,3,3. STATA简介:发展历史,(1)Stata是一个用于数据管理和分析的统计软件,由Stata公司(StataCorp)研制开发。从1985开始,先后开发了1.1, 1.2,等多个版本。目前Stata的最新版本为2009年7月份推出的Stata 11.0。 (2)Stata 11包括

3、四种版本:Small(小型版)、IC(标准版)、SE(特别版)和MP(多处理器版)。其中属MP版本最为强大。MP版与SE版的功能完全相同,但MP版的运算速度比SE版的要快很多。用户可以在命令栏输入about 查看所安装的Stata所属的版本。,4,(3)不同版本对样本容量、变量个数、矩阵阶数、宏的字符长度等有着不同的限制。以SE版为例,其最大变量个数为32767,最大字符长度为244字节,最大矩阵阶数为11000(即1100011000)。 Stata默认值为:最大变量个数为5000,最大矩阵阶数为400,最大内存为50兆(在Stata10中为10m)。如果用户需要更多的内存或者更多的变量,可

4、以在命令栏输入如下命令进行扩展。 . set maxvar # (.set maxvar 5000 ) . set maxsize # (.set maxsize 1000 ) . set memory #m (.set memory 50m ),5,4. STATA简介:主要特点与功能 统计分析与计量分析的结合:, (1)单元统计:描述统计、假设检验(参数、非参数)、ANOVA、质量控制、统计作图。 (2)多元统计:MANOVA、主成分、因子分析、典型相关、聚类、判别分析、对应分析、多维标度。 (3)线性回归、非线性回归、工具变量回归、广义线性回归、分位数回归(稳健回归)、系统方程模型(SU

5、R、联立方程)、离散选择模型(二项选择、排序选择、多项选择、条件Logit、嵌套Logit模型、二元选择模型等)、计数模型(泊松回归、负二项回归)、截断与归并模型、海克曼选择模型、逐步回归(stepwise)等。,6, (4)时间序列分析:时间序列的平滑、相关图、ARIMAX、GARCH、单位根检验、Johansen协整检验、VAR、VEC、滚动回归等。 (5)面板数据(线性模型、工具变量回归、动态面板、分层混合效应、广义估计方程(GMM)、随机边界模型等)。 (6)调查数据分析 (7)生存分析 (8)蒙特卡洛模拟、自举法(bootstrap)、刀切法(jackknife),7,丰富的网络资源

6、: http:/www.stata- http:/www.stata- 严谨、简练、灵活的程序语言: Stata提供了严谨、简练而灵活的程序语句,用户可以编写自己的命令和函数,也可以制作自己的对话框和窗口菜单。 强大的矩阵运算功能:Mata Mata是Stata的矩阵运算语言,实现各种运算。 兼容性: 在Stata中可以直接运行其它程序;其他语言编写的程序可以作为插件(Plugin)直接嵌入到Stata中。,8,二、Stata 的窗口 安装好 Stata 后,点击电脑桌面上的Stata 图标,即可打开Stata。此时可以看到,在最上方有一排菜单,即“File Edit Data Graphic

7、s Statistics User Window Help”。在此之下,有四个窗口,分别为:,左上“Review”(历史窗口):此窗口记录着自启动Stata以来执行过的命令。,左下“Variables”(变量窗口):此窗口记录着目前Stata 内存中的所有变量。,右上“Results”(结果窗口):此窗口显示执行Stata 命令后的输出结果。,右下“Command”(命令窗口):在此窗口输入想要执行的Stata 命令。,9,为了使屏幕分割更美观实用,可以用鼠标将以上窗口拉到任意大小与位置。然后点击菜单Edit”“Preferences” “General Preferences” “Windo

8、wing” “Lock splitter”,就可以锁定当前画面,而在以后重启Stata 时自动显示这个画面设置。,10,Stata 的主界面,11,三、Stata 操作,1将数据导入Stata 打开Stata 软件后,点击Data Data Editor 图标,即可打开一个类似Excel的空白表格。然后,用Excel 打开文件“实验数据.xls”,复制文件中的相关数据,并粘贴到Data Editor 中。 导入数据的另一方法是,点击菜单“File”“Import”,然后导入各种格式的数据。但这种方法有时不如直接从Excel 表中粘贴数据来得方便直观。,12,关闭 Data Editor 后,即

9、会看到左下方的“Variables”窗口出现了8 个变量,分别为year、gdp、index、index1978、gov、pop、deflator、gcons。,13,此时,可以点击 Save 图标(也可以点击菜单“File” “Save”),将数据存为Stata 格式的文件(扩展名为dta),比如wanger_law.dta。 这样,以后就可以用Stata 直接打开这个数据集了(不需要再从Excel 表中粘贴过来)。 打开的方式有两种。可以点击Open 图标(也可以点击菜单“File”“Open”),然后寻找要打开的dta 文件的位置。 另外一种方法是在命令窗口输入以下命令(假设文件在E 盘

10、的根目录)并回车(按Enter 键),,use E:wagner_law.dta,clear,其中,选择项“clear”表示可以替代内存中的已有数据。,14,如果要关闭一个数据集(如果对数据集进行了改动,别忘了先存盘Save),以便使用另外一个数据集,可以在命令窗口输入: . clear 这样,内存中所有的当前数据都被清空,然后可以再打开另外一个数据集。,15,2变量的标签 在变量窗口,每个变量的“名字”(Name)旁边显示了其“标签”(label)。但目前的标签过于简略,缺乏变量的解 释信息。 如果想将变量“gov”的标签改为“government expenditures”,可进行如下操作

11、。以鼠标的右键点击变量名“gov”,然后选择“Edit variable label”,输入“government expenditures”即可。此时,再去看变量“gov”的标签,就已经改为“government expenditures”。另外,在右上角的结果窗口出现了以下一行命令: . label variable tc government expenditures ,这表明,直接在命令窗口输入上面这行命令,也能达到一 样的效果,但不如直接在变量上点击右键操作方便。,注意:Stata 中字母的大小写是严格区分的,因此Stata 建议对于变量名一律使用小写字母。,16,3审视数据 一个数

12、据集可能很大,而我们常希望看到数据的概貌。想看数据集中的变量名单、标签等,可以在命令窗口输入: . describe,如果想给整个数据集加上一个标签,以说明这个数据集来自“Wagner Law 1978-2009”,可输入命令: . label data Wagner Law 1978-2009,如果再次使用命令“describe”,就会看到数据集的标签 “Wagner Law 1978-2009”。,如果想看变量 gov、gcons与gdp的具体数据,可使用命令: . list gov gcons gdp,注意:如果数据较长,可用Ctrl+Break终止显示。,17,有时我们想对数据集的一部

13、分执行命令,比如只想看变量gov 与gdp 的前5 个数据,则可输入命令: . list gov gdp in 1/5,也可以通过逻辑关系来定义数据集的子集。如果要列出所有满足条件“year 1995”的变量gov与gdp 的数据,则可以使用以下命令: . list year gov gdp if year=1995,其中,“=”表示“大于等于”。其他表示关系的逻辑符号为“= =”(等于),“”(大于),“”(小于),“=”(小于等于),“=”或“!=”(不等于)。查看具体数据的一个直接方法是,点击Data Editor 图标。,18,如果想删除满足“year 2001”条件的观测值,则可使用

14、命令: . drop if year=2001,反之,如果只想保留满足“year2001”条件的观测值,而删去所有其他观测值: . keep if year=2001,19,5考察变量的统计特征 如果想看变量 gov、gcons和gdp的统计特征,可输入命令: . summarize gov gcons gdp,Variable Obs Mean Std. Dev. Min Max gov 3214454.13 19217.2 1122.09 76299.93 gcons 3211441.76 12730.41 480 44396.9 gdp 3280670.91 94125.313645.2

15、18 340506.9,满足条件的统计: . summarize gov gcons gdp if year2000,如果不指明变量,则将显示数据集中所有变量的统计指标。 summarize,如果要显示内存中某些变量之间的相关系数,可输入命令: . correlate gov gcons pop gdp,20,5画图 Stata 具有很强的画图功能。如果想看变量q 的直方图(假定组宽为1000),可输入以下命令: . histogram q, width(8000) frequency,21,由于直方图不连续,如果想看连续的经验分布图,可使用以下命令: . kdensity gov,22,如果

16、要画 gov 与gdp 之间的散点图,则可输入以下命令: scatter gov gdp,23,如果想在散点图上同时画出回归直线,可以使用如下命令: . twoway (scatter gov gdp)(lfit gov gdp),其中,“lfit”表示“linear fit”(线性拟合)。,24,6生成新变量 如果要估计以下方程:,为了估计这个方程,需要在 Stata 中对原变量取对数,可使用命令“generate”。 . generate lngov=log(gov) . generate lngdp=log(gdp) . reg lngov lngdp,如果要生成“虚拟变量”,定义为:,

17、Stata命令为: generate dum=(if year=1995),25,删除变量: drop 变量名 如:drop dum 修改变量值 replace 变量名=表达式 条件 如:replace dum=0 if year=1990,26,在执行 Stata 命令时,有时需要调用许多变量,而某些变量名可能很长。此时,如果在命令窗口一一输入变量名,可能较费事。 解决方法之一是:可以直接在左下角的“变量窗口”单击需要的变量,则该变量名就会显现在命令窗口。 解决方法之二是,如果有以下变量lnq1, lnq2, , lnq30,而只想使用其中的前15 个变量,则可以用lnq1-lnq15 来简

18、略地表示这15 个变量。 解决方法之三是,用“*”号来节省变量名的书写。 假设想将内存中所有以“ln”开头的变量都去掉,则可输入命令: . drop ln*,27,7Stata 的计算器功能 Stata 也可以作为计算器来使用。只要输入命令“display expression”即可。 比如“display log(2)”将计算ln 2。,28,8线性回归分析 使用 OLS 对方程进行估计,可输入命令: reg lngov lngdp,上表中的“_cons”表示常数项,“R-squared”显示R2 =0.9676,“Adj R-squared”显示0.9665。检验整个方程显著性的F 统计量

19、之p 值(Prob F)为0.0000,显示这个回归方程是高度显著的。残差平方和为1.77,方程标准差Root MSE为0.24。,29,如果要显示估计系数的协方差矩阵,可输入命令, . vce 其中,“vce”表示“variance covariance matrix estimated”。,在进行回归时,如果不要常数项,可以加上选择项 “noconstant” reg lngov lngdp,noconstant,30,如果要计算被解释变量的拟合值 ,并将其记为lntchat,可输入命令: . predict lntchat,如果要计算“残差”(residual),并将其记为e1,可输入命

20、令: . predict e1,residual 其中,选择项“residual”表示预测残差。,31,9Stata 的日志 如果希望在每次使用 Stata 时,储存其运行结果,可点击菜单“File”“Log”“Begin”,然后输入日志(log)的文件名,并存储在你指定的位置。从此以后,你在Stata中的所有操作及其输出结果,都将被记录在此日志中,直至你选择退出。 如果要暂时关闭日志(不再记录输出结果),可输入命令“log off”。如果要恢复使用日志,可输入命令“logon”。如果要彻底退出日志,只要输入命令“log close”即可。如果要查看日志文件中的内容,只要点击存储位置上的日志文

21、件图标即可。,32,四、Stata 命令库的更新 由于 Stata 版本的不同(即使同为Stata 10),如果你发现某些命令无法运行,可在命令窗口输入, . update all 这将更新你的 Stata 命令库(包括Stata 的“ado”程序文件与其他可执行文件)。,33,五、 进一步学习Stata 的资源 更多有关 Stata 的知识,将在本课程以后的内容中逐步介绍。 有关 Stata 的英文参考书包括Baum(2006)与Cameron and Trivedi(2009),中文参考书包括陈传波Stata 十八讲、劳伦斯汉密尔顿(2008 译)、王群勇(2007)、王天夫、李博柏(2008)。,加州大学洛杉矶分校( UCLA ) 网站 (http:/www.ats.ucla.edu/stat/stata/)提供了大量有关Stata的资源及实例(搜索“Stata UCLA”即可找到此网站)。 当然,Stata 本身的“帮助”(Help)菜单已经包含了详细的信息。在使用Stata 命令时(比如,reg),宜养成习惯,经常看其对应的帮助信息(输入命令“h reg”即可)。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1