前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >stata 导出 相关系数表_STATA数据处理技巧与计量分析二|基本语句介绍

stata 导出 相关系数表_STATA数据处理技巧与计量分析二|基本语句介绍

作者头像
全栈程序员站长
发布2022-07-04 12:39:01
1.5K0
发布2022-07-04 12:39:01
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是你们的朋友全栈君。

上期小统和大家一起了解了STATA数据处理技巧与计量分析的背景介绍,这期小统和大家一起学习一下基本语句介绍。

Stata操作界面

7d696b5c51a7d5b965499542a7491526.png
7d696b5c51a7d5b965499542a7491526.png

核心功能 (do file) Stata中的命令集合文件,在编程语言中成为脚本(scripts),是指为达到某一分析目的进行的数据读取、数据处理、分析等的命令集合。

58f0eaedc201cc1646522cbd612db6d4.png
58f0eaedc201cc1646522cbd612db6d4.png
4eb1ee295e44c7471690bbb2fec10642.png
4eb1ee295e44c7471690bbb2fec10642.png

Stata的基础语法

基本语法结构:

funName variable/(var list) if/in, by() other options

generate newVar=var1/var2

summarize var1 var2 newVar if group==1

regress indepVar depVar1 depVar2 depVar3,robust

•任何的实证分析,收集到的数据形形色色,格式不一。

•因此,很多时候,数据清洗或者初步的数据处理成为了最重要的环节。。。

数据导入与保存:

help insheet //可以导入csv或者txt数据文件(常用)

help import excel //导入excel文件(常用)

help import sasxport //导入sas文件(少用)

help use //导入dta文件(常用)

help save //保存为dta数据文件

eg:

insheet using “dataset.csv”,clear

import excel “dataset.xls”,firstrow sheet(Sheet1) clear

use dataset.dta,clear

save dataset2.dta,replace

数据处理常用命令:

help gen //赋值、计算变量(加减乘除、乘方,逻辑运算)

help egen //可以计算任何描述统计指标、分组。常与bysort组合使用,功能非常强大!

help replace //替换数据,常结合if使用

help destring //数字变量处理

help encode //对个体变量进行编号,分组变量或者面板数据常用

eg:

gen newVar=var1/var2 //两个变量相除

gen Year2017=(year==2017) //2017年的虚拟变量设置

egen meanVar=mean(var) //求某一个变量的均值

bysort industry:egen meanVar=max(var)

replace var1=0 if var1==. //把var1为缺失值的赋值为0

destring var1,replace //把文本格式的变量转化为数值变量

encode Stkcd,gen(Stkcd1) //个体数据进行数值化(编号)

数据探索命令——计量分析第一步

help summarize //描述统计(观测数、均值、标准差、最小值、最大值)

help tabstat //更为常用,可以自定义统计指标,并导出到excel

help winsor //缩尾处理,每次只能处理一个变量

help winsor2 //外部缩尾处理命令,更为方便,可多变量处理。

help scatter //绘制两个变量之间的散点图

help pwcorr //计算相关系数表格

eg:

sum var1 var2

tabstat var1 var2,stat(mean n sd max min median) c(s)

winsor2 var1 var2,replace cuts(1 99)

scatter y x

pwcorr var1 var2 var3,sig //报告p值

pwcorr var1 var2 var3,star(0.05) //把p值小于0.05的用*标记

小结:

•全部的处理都可以菜单式操作,但是不建议用。除非在你忘记命令如何写或者某些option不知道如何写的时候。

•对于任何指标的计算,本课程介绍的命令基本上可以解决90%以上。多思考。多层bysort+egen能发挥你意想不到的威力。

•数据清洗是每次实证分析的最基础最重要最耗时的一步,你的目标是把数据集中全部红色的变量变为蓝色或者黑色

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/149316.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档