考stata log文件时候,最后忘了打log close,但是打了log begin,有没有事!!!!

Stata学习教程_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
文档贡献者
评价文档:
喜欢此文档的还喜欢
Stata学习教程
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
大小:1.52MB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢让你快速上手的stata讲义28-第2页
上亿文档资料,等你来发现
让你快速上手的stata讲义28-2
标记去掉的命令;这样,do文件在运行的过程中就不;接下来,是“caplogclose”命令;接下来便是开启新的log文件的命令;名称;接下来就是导入数据、进行各种操作了;那么,怎样写这样一个do文件呢?主要有两种方法:;do文件;别忘了点击编辑器图标栏上的;辑的成果;如果用do文件编辑器编辑do文件,可以点击编辑器;上面所讲的内容恐怕不易在短时间内被Stat
标记去掉的命令;这样,do文件在运行的过程中就不会因为某项操作的显示结果太长而暂停运行。 接下来,是“cap log close”命令。要明白这条命令,得先明白什么是log文件。打个比方,开大会的时候,需要录像机全程录像,以备事后查用。同样,运行操作程序的时候,也需要全程记录所有的操作命令和操作结果,以备事后查用。log文件就是Stata中的录像带,用来忠实记录整个操作过程。如果准备拍新录像的时候,发现一盘旧录像带还在录像机里放着,那么就要先取出旧录像带,以便放入新录像带。同样,如果在进行新的程序操作之前,Stata还在运行着某个以前的log文件,那么就得先把这个log文件关掉,以便开启新的log文件进行记录。“log close”就是关闭旧的log文件的命令。在“log close”前面加“cap”的原因是:如果原来没有log文件在运行,那么运行“log close”命令会产生错误信息,Stata也就会因此中止do文件的运行;而前面的“cap”可以阻止在“log close”命令运行过程中的任何错误信息的出现,从而保证do文件的运行不会因此中止。接下来便是开启新的log文件的命令。“log using”命令用来开启一个log文件,命令后面是log文件的路径和名称。值得强调的是,Stata命令中出现文件的路径和名称时,可以用双引号包裹起来,也可以不用。命令最后“replace”的意思是:如果在那个路径下已经存在一个这样的文件,那么新开启的log文件把原文件完全覆盖;如果你想在已经存在的log文件后面继续记录,可以把“replace”换成“append”。log文件的操作还有其他常用命令。直接运行“log”命令可以查询当前log文件的工作状态;“log off”命令可以暂停log文件的运行,就像把录像机暂时关掉;“log on”可以重新开始log文件的运行,就像重新开动录像机;如果想查看log文件记录的内容,可以在“view”命令后面加上log文件的路径和名称。此外,点击图标栏的 接下来就是导入数据、进行各种操作了。后文会逐步介绍相关的内容。 那么,怎样写这样一个do文件呢?主要有两种方法:一、打开一个记事本文件,图标,也可以对log文件进行一系列的操作。直接在里面编辑,编辑好之后另存为后缀名为“do”的文件即可。二、用Stata自身附带的do文件的编辑器进行编辑。在Command框中输入“doed”,就可以打开do文件编辑器。如果想编辑已经存在的do文件,需要在“doed”后面加上do文件的路径和名称。另外,也可以直接点击Stata图标栏里的do文件。编辑do文件的过程中,别忘了点击编辑器图标栏上的辑的成果。 如果用do文件编辑器编辑do文件,可以点击编辑器图标栏里的图标来试运行图标来编辑图标来保存编do文件(也可以运行“run”命令加do文件的路径和名称)。试运行只会反馈do文件中的错误,而不会显示do文件的运行结果,这便于对do文件的调试。当do文件顺利通过试运行之后,便可以点击编辑器图标栏里的来正式运行(也可以运行“do”命令加do文件的路径和名称)。正式运行会显示所有的运行结果。此外,还可以通过Stata菜单栏中的“File ? Do…”来运行一个do文件。上面所讲的内容恐怕不易在短时间内被Stata的初学者(尤其是没有程序操作经历的初学者)完全接受。但是大家应该试着从一开始就养成写do文件的好习惯,并在实践的过程中慢慢体会do文件的好处及其所涉及的各种操作。 三、怎样把数据导入Stata? 想炒菜,得先把菜倒进锅里;同样,用Stata分析数据,得先把数据导入Stata。Stata默认的数据文件是后缀名为“dta”的文件。讲义附带的一个数据文件是“WAGE1.dta”,它可以直接用Stata打开。打开的方式无非有以下几种:1、运行“use”命令加数据的路径和名称。2、像上文中列出的do文件那样,先用“cd”命令进入数据所在的目录,然后用“use”命令直接加数据的名称来导入数据。当要操作的许多的数据文件都在同一个目录下面时,用这样的方法导入数据比较方便――导入新数据时,只需改变“use”命令后的文件名即可,而不需改变数据的路径。3、在菜单栏中选择“File ? Open”,并选择数据所在的路径;4、点击图标栏的 在前两种方式中,“use”命令后面,往往需要加一个“clear”。打个比方,想炒一锅新菜,得把原来的一锅菜倒出去;同样,想导入一个新数据,得把原来的数据清理出Stata。“clear”就是把原来的数据清理出Stata的命令。 考虑到编辑do文件的需要,大家应掌握前两种数据导入方式。通过一个do文件导入数据后,会看到如下的界面:,并选择数据所在的路径。 我们看到,黑色区域显示出了do文件的所有操作及其结果。Review框中显示出了曾经运行过的命令(打开do文件的命令);如果你想再次操作曾经操作过的命令,直接双击Review框中的相应命令即可,就不必重新输入一遍了。Variable框中显示的就是“WAGE1.dta”所包含的变量,有工资(wage),教育水平(educ)和工作经验(exper)等。 但是,当按照上述方法打开另一个数据文件“c04adult.dta”时(该文件为中国健康和营养调查的2004年的成人数据。因为太大,没有和讲义附在一起),显示界面中出现了红色的错误信息: 这几行提示告诉我们,没有足够的空间容纳数据;此外,还给出了三种可行的方案:1、更有效地存储和压缩数据,2、删掉某些变量或观测值,3、增大分配给该数据的空间。一般来说,我们选择第3种方案。毕竟,许多人不愿意“委屈”菜的质量和分量,那就换口大锅吧。 “换大锅”的命令是:set memory xxM。其中的“xx”为一个数字,代表分配给数据多大的空间;“M”为存储容量的单位,即兆字节。Stata默认的分配空间是1M。接下来,我分配给这个大数据10M的空间。分配完毕后,就可以顺利打开数据了:
到此为止,我们已经知道怎样把dta格式的数据文件导入Stata了。但是,对于许多不是dta格式的数据文件,我们应该怎么办? 对于后缀名是“raw”, “txt”和“csv”的数据,Stata可以用“insheet using”命令导入。这个命令的用法和“use”类似。对于那些可以另存为这三种格式的数据,可以先把它们转化成这三种格式,然后用“insheet using”命令导入。讲义附带着一个Excel文件“wage1_sub.xls”,是“WAGE1.dta”的子样本。打开这个Excel文件,另存为“txt”(制表符分隔的文本文件)或“csv”格式后,可以用“insheet using”命令导入。一般来说,在导入非“dta”格式的数据后,要把这些数据另存为“dta”格式。因此,在do文件的“insheet using”命令的下一行,最好紧跟“save”命令。一般的命令是“save *.dta”,“*”代表另存为的文件名。如果不加“.dta”,Stata默认的存储格式为“dta”。此外,如果想保存对数据的任何改动,也要使用“save”命令。 当源数据是Excel数据的时候,我们还可以将其直接复制粘贴到Stata里。以“WAGE1_sub.xls”为例:1、打开“WAGE1_sub.xls”,用鼠标选定包括变量名包含各类专业文献、幼儿教育、小学教育、各类资格考试、外语学习资料、生活休闲娱乐、高等教育、文学作品欣赏、让你快速上手的stata讲义28等内容。 
 新闻网页贴吧知道音乐图片视频地图百科文库 搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS 百度文库 专业资料 工程科技 让你快速上手的stata讲义_工程科技_专业资料 ...   Stata操作讲义_经济学_高等教育_教育专区。Stata 操作讲义 第一讲 Stata 操作... 让你快速上手的stata讲义... 59页 免费 聚类分析stata操作讲义 16页 免费 ...   stata简单讲义第六讲_经济学_高等教育_教育专区。线性相关和回归 赵耐青在实际... Stata操作讲义 57页 1下载券 让你快速上手的stata讲义... 59页 免费 STATA...   stata学习资料-第六章_日语学习_外语学习_教育专区。programming 那本书的第六... 2014年笑话大全之让你笑个够 儿童笑话大全爆笑 爆笑笑话精选文档贡献者 高不...   Stata 应用技巧 35页 1下载券 STATA 讲义 77页 1下载券 STATA 十八讲 186...Stata 的操作步骤: #1、建立自回归模型 #打开文件 use infln_wage.dta #查看...   小诀窍让你快速上手Dreamweaver_IT/计算机_专业资料。小诀窍让你快速上手 Dreamweaver 类型:网页大餐 加入时间: 9:26:18 上一篇 下一篇 1、善用拖放...   11页 免费 STATA 讲义 77页 2财富值 stata入门操作 28页 2财富值搜你所想,读你所爱 拒绝盗版,营造绿色文库
如要投诉违规内容,请到百度文库...   第十七章多因素回归分析的Stata实现_计算机软件及应用_IT/计算机_专业资料。第十七章本章使用的 Stata 命令:多因素回归 逐步回归 Logistic 回归 生存时间数据设定 ...   第八讲 有序分类资料的统计分析Stata实现_数学_自然科学_专业资料。第十二章有序分类资料的统计分析的 Stata 实现 本章使用的 STATA 命令: 列变量有序时的分类... 下载
 收藏
该文档贡献者很忙,什么也没留下。
 下载此文档
正在努力加载中...
第1章 Stata的基本介绍
下载积分:1
内容提示:
文档格式:DOC|
浏览次数:11|
上传日期: 14:09:11|
文档星级:
该用户还上传了这些文档
第1章 Stata的基本介绍.DOC
官方公共微信计量经济学stata操作指南_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
喜欢此文档的还喜欢
计量经济学stata操作指南
阅读已结束,如果下载本文需要使用
想免费下载本文?
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢79我常用到的stata命令
上亿文档资料,等你来发现
79我常用到的stata命令
我常用到的stata命令1;最重要的两个命令莫过于help和search了;闲话不说了;下面该正式处理数据了;为了使do文件能够顺利工作,一般需要编辑do文件;/*(标签;captureclear(清空内存中的数据);capturelogclose(关闭所有打开的日;setmem128m(设置用于stata使用的内;setmoreoff(关闭more选项;s
我常用到的stata命令1最重要的两个命令莫过于help和search了。即使是经常使用stata的人也很难,也没必要记住常用命令的每一个细节,更不用说那些不常用到的了。所以,在遇到困难又没有免费专家咨询时,使用stata自带的帮助文件就是最佳选择。stata的帮助文件十分详尽,面面俱到,这既是好处也是麻烦。当你看到长长的帮助文件时,是不是对迅速找到相关信息感到没有信心?闲话不说了。help和search都是查找帮助文件的命令,它们之间的区别在于help用于查找精确的命令名,而search是模糊查找。如果你知道某个命令的名字,并且想知道它的具体使用方法,只须在stata的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在stata下做某个估计或某种计算,而不知道具体该如何实现,就需要用search命令了。使用的方法和help类似,只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容,点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找,反复实验,通常可以较快地找到你需要的内容。下面该正式处理数据了。我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成,所以,当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同,你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在stata窗口上部的工具栏中有个孤立的小按钮,把鼠标放上去会出现“bring do-file editor to front”,点击它就会出现do文件编辑器。为了使do文件能够顺利工作,一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。/*(标签。简单记下文件的使命。) */capture clear
(清空内存中的数据)capture log close
(关闭所有打开的日志文件)set mem 128m
(设置用于stata使用的内存容量)set more off
(关闭more选项。如果打开该选项,那么结果分屏输出,即一次只输出一屏结果。你按空格键后再输出下一屏,直到全部输完。如果关闭则中间不停,一次全部输出。)set matsize 4000
(设置矩阵的最大阶数。我用的是不是太大了?)cd D:
(进入数据所在的盘符和文件夹。和dos的命令行很相似。)
log using (文件名).log,replace (打开日志文件,并更新。日志文件将记录下所有文件运行后给出的结果,如果你修改了文件内容,replace选项可以将其更新为最近运行的结果。)use (文件名),clear
(打开数据文件。)(文件内容)log close
(关闭日志文件。)exit,clear
(退出并清空内存中的数据。)这个do文件的“头尾”并非我的发明,而是从沈明高老师那里学到的。版权归沈明高老师。(待续) 我常用到的stata命令2实证工作中往往接触的是原始数据。这些数据没有经过整理,有一些错漏和不统一的地方。比如,对某个变量的缺失观察值,有时会用点,有时会用-9,-99等来表示。回归时如果使用这些观察,往往得出非常错误的结果。还有,在不同的数据文件中,相同变量有时使用的变量名不同,会给合并数据造成麻烦。因此,拿到原始数据后,往往需要根据需要重新生成新的数据库,并且只使用这个新库处理数据。这部分工作不难,但是非常基础。因为如果在这里你不够小心,后面的事情往往会白做。假设你清楚地知道所需的变量,现在要做的是检查数据、生成必要的数据并形成数据库供将来使用。检查数据的重要命令包括codebook,su,ta,des和list。其中,codebook提供的信息最全面,缺点是不能使用if条件限制范围,所以,有时还要用别的帮帮忙。su空格加变量名报告相应变量的非缺失的观察个数,均值,标准差,最小值和最大值。ta空格后面加一个(或两个)变量名是报告某个变量(或两个变量二维)的取值(不含缺失值)的频数,比率和按大小排列的累积比率。des后面可以加任意个变量名,只要数据中有。它报告变量的存储的类型,显示的格式和标签。标签中一般记录这个变量的定义和单位。list报告变量的观察值,可以用if或in来限制范围。所有这些命令都可以后面不加任何变量名,报告的结果是正在使用的数据库中的所有变量的相应信息。说起来苍白无力,打开stata亲自实验一下吧。顺带说点儿题外话。除了codebook之外,上述统计类的命令都属于r族命令(又称一般命令)。执行后都可以使用return list报告储存在r()中的统计结果。最典型的r族命令当属summarize。它会把样本量、均值、标准差、方差、最小值、最大值、总和等统计信息储存起来。你在执行su之后,只需敲入return list就可以得到所有这些信息。其实,和一般命令的return命令类似,估计命令(又称e族命令)也有ereturn命令,具有报告,储存信息的功能。在更复杂的编程中,比如对回归分解,计算一些程序中无法直接计算的统计量,这些功能更是必不可少。检查数据时,先用codebook看一下它的值域和单位。如果有-9,-99这样的取值,查一下问卷中对缺失值的记录方法。确定它们是缺失值后,改为用点记录。命令是replace (变量名)=. if (变量名)==-9。再看一下用点记录的缺失值有多少,作为选用变量的一个依据。得到可用的数据后,我会给没有标签的变量加上注解。或者统一标签;或者统一变量的命名规则。更改变量名的命令是ren (原变量名)空格(新变量名)。定义标签的命令是label var (变量名)空格”(标签内容)”。整齐划一的变量名有助于记忆,简明的标签有助于明确变量的单位等信息。如果你需要使用通过原始变量派生出的新变量,那么就需要了解gen,egen和replace这三个命令。gen和replace常常在一起使用。它们的基本语法是gen (或replace)空格(变量名)=(表达式)。二者的不同之处在于gen是生成新变量,replace是重新定义旧变量。虚拟变量是我们常常需要用到的一类派生变量。如果你需要生成的虚拟变量个数不多,可以有两种方法生成。一种是简明方法:gen空格(变量名)=((限制条件))[这外面的小括弧是命令需要的,里面的小括弧不是命令需要的,只是说明“限制条件”并非命令]。如果某个观察满足限制条件,那么它的这个虚拟变量取值为1,否则为0。另一种要麻烦一点。就是gen (变量名)=1 if (取值为一限制条件)replace(相同的变量名)=0 if (取值为零的限制条件)两个方法貌似一样,但有一个小小的区别。如果限制条件中使用的变量都没有任何缺失值,那么两种方法的结果一样。如果有缺失值,第一种方法会把是缺失值的观察的虚拟变量都定义为0。而第二种方法可以将虚拟变量的取值分为三种,一是等于1,二是等于0,三是等于缺失值。这样就避免了把本来信息不明的观察错误地纳入到回归中去。下次再讲如何方便地生成成百上千个虚拟变量。 我常用到的stata命令3大量的虚拟变量往往是根据某个已知变量的取值生成的。比如,在某个回归中希望控制每个观察所在的社区,即希望控制标记社区的虚拟变量。社区数目可能有成百上千个,如果用上次的所说的方法生成就需要重复成百上千次,这也太笨了。大量生成虚拟变量的命令如下;ta (变量名), gen((变量名))第一个括号里的变量名是已知的变量,在上面的例子中是社区编码。后一个括号里的变量名是新生成的虚拟变量的共同前缀,后面跟数字表示不同的虚拟变量。如果我在这里填入d,那么,上述命令就会新生成d1,d2,等等,直到所有社区都有一个虚拟变量。在回归中控制社区变量,只需简单地放入这些变量即可。一个麻烦是虚拟变量太多,怎么简单地加入呢?一个办法是用省略符号,d*表示所有d字母开头的变量,另一法是用破折号,d1-d150表示第一个到第150个社区虚拟变量(假设共有150个社区)。还有一种方法可以在回归中直接控制虚拟变量,而无需真的去生成这些虚拟变量。使用命令areg可以做到,它的语法是areg (被解释变量) (解释变量), absorb(变量名)absorb选项后面的变量名和前面讲的命令中第一个变量名相同。在上面的例子中即为社区编码。回归的结果和在reg中直接加入相应的虚拟变量相同。生成变量的最后一招是egen。egen和gen都用于生成新变量,但egen的特点是它更强大的函数功能。gen可以支持一些函数,egen支持额外的函数。如果用gen搞不定,就得用egen想办法了。不过我比较懒,到现在为止只用用取平均、加和这些简单的函数。有的时候数据情况复杂一些,往往生成所需变量不是非常直接,就需要多几个过程。曾经碰到原始数据中记录日期有些怪异的格式。比如,日被记录为。我想使用它年份和月份,并生成虚拟变量。下面是我的做法:gen yr=int(date)gen mo=int((data-yr*1)ta yr, gen( yd)ta mo, gen( md)假设你已经生成了所有需要的变量,现在最重要的就是保存好你的工作。使用的命令是save空格(文件名),replace。和前面介绍的一样,replace选项将更新你对数据库的修改,所以一定要小心使用。最好另存一个新的数据库,如果把原始库改了又变不回去,就叫天不应叫地不灵了。 我常用到的stata命令4前面说的都是对单个数据库的简单操 作,但有时我们需要改变数据的结构,或者抽取来自不同数据库的信息,因此需要更方便的命令。这一类命令中我用过的有:改变数据的纵横结构的命令 reshape,生成退化的数据库collapse,合并数据库的命令append和merge。 纵列(longitudinal)数据 通常包括同一个行为者(agent)在不同时期的观察,所以处理这类数据常常需要把数据库从宽表变成长表,或者相反。所谓宽表是以每个行为者为一个观察,不同时期的变量都记录在这个观察下,例如,行为者是厂商,时期有年,变量是雇佣人数和所在城市,假设雇佣人数在不同时期不同,所在城市 则不变。宽表记录的格式是每个厂商是一个观察,没有时期变量,雇佣人数有两个变量,分别记录2000年和2001年的人数,所在城市只有一个变量。所谓长 表是行为者和时期共同定义观察,在上面的例子中,每个厂商有两个观察,有时期变量,雇佣人数和所在城市都只有一个,它们和时期变量共同定义相应时期的变量取值。在上面的例子下,把宽表变成长表的命令格式如下:reshape long (雇佣人数的变量名), i((标记厂商的变量名)) j((标记时期的变量名)) 因为所在城市不随时期变化,所以在转换格式时不用放在reshape long后面,转换前后也不改变什么。相反地,如果把长表变成宽表则使用如下命令reshape wide (雇佣人数的变量名), i((标记厂商的变量名)) j((标记时期的变量名)) 唯一的区别是long换成了wide。collapse的用处是计算某个数据库的一些统计量,再把它存为只含有这些统计量的数据库。用到这个命令的机会不多,我使用它是因为它可以计算中位数和从1到99的百分位数,这些统计量在常规的数据描述命令中没有。如果要计算中位数,其命令的语法如下 collapse (median) ((变量名)), by((变量名))生成的新数据库中记录了第一个括号中的变量(可以是多个变量)的中位数。右面的by选项是根据某个变量分组计算中位数,没有这个选项则计算全部样本的中位数。合并数据库有两种方式,一种是增加观察,另一种是增加变量。第一种用append,用在两个数据库的格式一样,但观察不一样,只需用append空格 using空格(文件名)就可以狗尾续貂了。简单明了,不会有什么错。另一种就不同了,需要格外小心。如果两个数据库中包含共同的观察,但是变量不同,希 望从一个数据库中提取一些变量到另一个数据库中用merge。完整的命令如下:use (文件名) [打开辅助数据库]sort (变量名) [根据变量排序,这个变量是两个数据库共有的识别信息]save (文件名), replace [保存辅助数据库]use (文件名) [打开主数据库]sort (变量名) [对相同的变量排序]merge (变量名) using (文件名), keep((变量名))[第一个变量名即为前面sort后面的变量名,文件名是辅助数据库的名字,后面的变量名是希望提取的变量名]ta _merge [显示_merge的取值情况。_merge等于1的观察是仅主库有的,等于2的是仅辅助库有的,等于3是两个库都有的。]drop if _merge==2 [删除仅仅来自辅助库的观察]drop merge [删除_merge]save (文件名), replace [将合并后的文件保存,通常另存] 我常用到的stata命令5讲到这里似乎对于数据的生 成和处理应该闭嘴了。大家可能更想听听估计、检验这些事情。但我并不想就此止住,因为实际中总是有一些简单套用命令无法轻易办到的特殊要求。此时至少有两 条路可以通向罗马:一是找到更高级的命令一步到位;二是利用已知简单命令多绕几个圈子达到目的。下面讲一个令我刻骨铭心的经历,这也是迄 今我所碰到的生成新数据中最繁复的了。原始数据中包含了可以识别属于同一个家庭中所有个人的信息和家庭成员与户主关系的信息。目的是利用这些信息建立亲子 关系。初步的构想是新数据库以子辈为观察,找到他们的父母,把父母的变量添加到每个观察上。我的做法如下:use a1,clear [打开全部样本数据库]keep if gender==2&agemos&=96&a8~=1&line&10[保留已婚的一定年龄的女性]replace a5=1 if a5==0[变量a5标记和户主的关系。等于0是户主,等于1是户主的配偶。这里不加区分地将户主及其配偶放在一起。]keep if a5==1|a5==3|a5==7[保留是户主(=1),是户主的子女(=3),或是户主的儿媳(=7)的那些人。] ren h hf [将所需变量加上后缀f,表示女性]ren line lf [将所需变量加上后缀f,表示女性]sort wave hhidsave b1,replace [排序并保存]keep if a5f==1 [留下其中是户主或户主配偶的]save b2,replace [保存]use b1,clearkeep if a5f==3|a5f==7save b3,replace [留下其中是户主女儿或儿媳的并保存]use a3,clear [打开与户主关系是户主子女的儿童数据库]sort wave hhidmerge wave hhid using CHNS01b2, keep(hf lf)ta _mergedrop if _merge==2sort hhid line wave [处理两代户,将户主配偶女性库与儿童库合并]by hhid line wave: egen x=count(id)drop x _merge [计算每个年份家庭匹配的情况,x只取值1,表明两代户匹配成功] save b4,replace [保存]use a4,clear [打开与户主关系是户主孙子女的儿童数据库]sort wave hhidmerge wave hhid using CHNS01b3, keep(a5f a8f schf a12f hf agemosf c8f lf) ta _mergedrop if _merge==2 [处理三代户,将户主女儿或儿媳女性库与孙子女儿童库合并] sort hhid line waveby hhid line wave: egen x=count(id)gen a=agemosf-agemosdrop if a&216&x==3 [计算每个年份家庭匹配的情况,x不只取1,三代户匹配不完全成功。删除不合理的样本,标准是年龄差距和有三个可能母亲的那些家庭。]gen xx=x[_n+1]gen xxx=x[_n-1]gen y=lf if x==1replace y=lf[_n+1] if x==2&xx==1replace y=lf[_n-1] if x==2&xxx==1keep if x==1|(lf==y&x==2)[对于有两个可能母亲的儿童,有相同编码的女性出现两次的情况。上面的做法是为了保证不删除这部分样本。]drop a x xx xxx y _mergesave b5,replace [保存合并后的数据库][对男性数据的合并完全类似,不赘述。]log closeexit,clear我的方法是属于使用简单命令反复迂回地达到目的那一类的,所以非常希望有更简便的方法来替代。不过做实证时往往不是非常追求程序的漂亮,常常也就得过且过 了。曾经有人向我索要过上面的处理方法,因为一直杂事缠身,就没有回复。现在公开了,希望对需要的人能有所帮助,我也懒得再去一一答复了。 我常用到的stata命令6stata强大的功能体现在它可以方便地回归微观数据。而回归也是微观实证中最重要的方法。下面就开始讲stata中和回归有关的常用命令。基本回归方法有两种:线性设定下的最小二乘法(OLS)和两阶段最小二乘法(2SLS)。他们在实证分析中应用广泛,十分详细地掌握这两种方法是实证研究的基本要求。讲解的顺序是先依次介绍如何在stata中实现OLS和2SLS估计,然后再分析如何在实际问题中选择合理的方法。后一部分受Joshua Angrist教授的影响很大,因此,在后面引用他的思想时会详细注明。假设你已经清楚地了解待估计方程的形式,那么回归命令的基本格式就十分简单明了: reg (被解释变量) (解释变量1) (解释变量2)??方程中的相应变量可以简单地放在reg的后面。执行上面的命令后,stata会出现两个表格,分别报告一些方差分析和回归的参数估计结果。我们最关心的是参数的大小和显著性,这在第二个表格中列出。表格的最左边一栏列出了解释变量,在它的右边是相应的系数估计值,然后依次是估计值的标准误,t比率,原假设为系数的真实值等于零时错误地拒绝该假设的概率――p值,以及该估计值的置信度为(1-5%)的置信区间。我看到回归结果的第一眼是瞄着最关心的解释变量的符号、大小和显著性。看看解释变量影响的方向和大小是不是符合理论的预期,是不是合乎常识,以及这个估计值是不是显著。标记显著性的统计量是t统计量,在经典假设下,它服从t分布。t分布和标准正态分布形状很相似,但它的“尾巴”要比标准正态分布的“肥”一些,在样本量比较小的时候尤其明显,当样本量趋于无穷时,t分布的极限分布是标准正态分布。大家对标准正态分布的分布函数上一些关键点比较熟悉,比如,1.96是97.5%的关键点,1.64是95%的关键点,所以,我们希望知道什么时候可以安全地使用标准正态分布。下表列出了一些小自由度下二者的差异(Beyer 1987 “CRC Standard Mathematical Tables, 28th ed.”;Goulden 1956 “Methods of Statistical Analysis, 2nd ed.”)。可以看出,自由度超过一百时,二者的差别就已经相当小了。所以,当样本量的数量级是100个或以上时,可以直接认为t比率服从标准正态分布,并以此做检验。90%
9.92484包含各类专业文献、应用写作文书、生活休闲娱乐、中学教育、专业论文、外语学习资料、幼儿教育、小学教育、各类资格考试、79我常用到的stata命令等内容。 
 可通用于 xtgls 和 fe 之后 /cheerhappywo/blog/item/bd9f2f96a5dfb40ad21b70b0.h tml 我常用到的 stata 命令 最重要的两个命令莫过于 ...   常用Stata命令_IT/计算机_专业资料。我常用到的 stata 命令 1 最重要的两个命令莫过于 help 和 search 了。 即使是经常使用 stata 的人也很难, 也没 必要...   我常用到的stata命令_工学_高等教育_教育专区。我常用到的 stata 命令 1 最重要的两个命令莫过于 help 和 search 了。 即使是经常使用 stata 的人也很难, ...  culture sci health admin techno, panels(hetero) corr(ar1),修正异方差和一阶序列相关 ar(1) 我常用到的 stata 命令 最重要的两个命令莫过于 help 和 ...   stata命令集 9页 1下载券 我常用到的stata命令集 11页 免费 喜欢此文档的...表 1.为某一降压药临床试验数据,试从键盘输入 Stata,并保存为 Stata 格式文件...  [删除仅仅来自辅助库的观察]drop merge [删除_merge]save (文件名), replace [将合并后的文件保存,通常另存] 我常用到的 stata 命令 (续)讲到这里似乎对于...   我常用到的stata命令集 11页 免费Stata命令...使用 tabulate,sum 命令描述数据 Table urban girl,sum(height) (四) 期望值 ...  必须记住的常用命令请记住下面这些常用的基本命令。记住这些命令之后,当不知其...STATA 格式的数据文件 将内存中的数据压缩 保存内存中的数据 录入数据 编辑数据...  面板协整分析(FMOLS,DOLS) *** 说明:1-5均用STATA软件实现, 6用GAUSS软件...不具有传统线性回归模型中R2的含义 *=== xtpcse 命令 * 默认假设:存在截面异...

我要回帖

更多关于 stata for mac 的文章

 

随机推荐