Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >计量模型 | 前定变量#时间FE

计量模型 | 前定变量#时间FE

原创
作者头像
kemosabe
修改于 2021-11-10 09:14:37
修改于 2021-11-10 09:14:37
9180
举报

最近在某年会的学术汇报上看到一篇DID实证论文,不过作者构建的计量模型比较特别。这篇文章的基本财务数据来自工企数据库,但却用于评估2017年实施的某项政策的政策效应。我们知道,一般的工企数据库的年份区间是1998-2013年,就算是使用最新的数据也只能到2015年(最近EPS中国微观经济数据查询系统将其更新至2015年,但数据真实性与有效性本人暂未验证),那么作者是如何用1998-2013年的财务数据来评估2017年实施的某项政策的呢?

$Note:$ 该文首发于微信公众号DMETP,欢迎关注!

作者构建的基准模型如下式$(1)$(已简化,公式可左右滑动)。

$$

y{it}=\beta did{it}+\lambda X{i,2009-2013}×\mu _t+\varphi {i,t,ind}+\varepsilon _{it}

\tag{1}

$$

其中,$X{i,2009-2013}$是一系列企业层面的控制变量在2009-2013年的均值,数据来源于工企数据库,$\mu _t$是时间FE,$\varphi {i,t,ind}$包括个体FE、时间FE与行业FE。样本区间是2015-2019年。

可以观察到,被解释变量$y{it}$与核心解释变量$did{it}$均在个体与时间两个维度上变动,但控制变量$X_{i,2009-2013}$只随着个体变动,在时间维度上始终是一个恒常数。为了补充控制变量在时间维度上的信息,作者将这一系列控制变量与时间FE交乘,并称之为控制变量初始值的时间趋势。

仔细思考一下,这里至少存在四个问题:

  • 第一,只有当变量本身就存在明显的时间趋势时才能以变量初始值的时间趋势来作为替代。对于企业样本来说,企业的财务数据是否存在时间趋势应该是分阶段的,比如在成长期或衰退期,企业的资产、负债等财务指标逐年增长或缩减;但企业如果处在转型期间,则趋势不太明显。此外,并非所有的财务数据都有明显的时间趋势。
  • 第二,变量初始值是2009-2013年的均值,但样本区间是2015-2019年,因此即便能用初始值的时间趋势作为实际值的替代,变量初始值也缺乏2014年的信息,代表性可能没有想象中的那么强。
  • 第三,变量与时间FE的交互项本身不能定义为变量的时间趋势。往期推文有介绍过时间趋势,变量的时间趋势就是变量初始值与时间趋势项trend的交乘,而非初始值与时间FE的交乘,后者的范围更广,实际上包含了前者。
  • 第四,多重共线性。因为变量初始值为恒常数,因此与时间FE交乘后,不同变量的交乘项可以互相表出,即存在多重共线性。

实际上,模型中引入变量初始值(或称,前定变量)与时间趋势的交乘项是比较常见的做法,如陈诗一等(2021)在基准模型中通过控制三个前定变量(2007年各省人均实际GDP、二氧化硫工业排放强度与废气治理投资占比)与时间趋势三阶多项式的交乘项,以解决可能存在的因遗漏变量而导致的内生性,而时间趋势的三阶多项式则用来规避可能存在的多重共线性。

2 陈诗一, 张建鹏, 刘朝良. 环境规制、融资约束与企业污染减排——来自排污费标准调整的证据J. 金融研究, 2021, 495(9): 51-71.

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
计量模型 | 固定效应与交互固定效应
在LSDV法下,FE本质就是控制变量,所以在经济含义上,FE(包括交互FE)与一般意义上的控制变量并无二致。
kemosabe
2021/10/12
2.5K0
计量模型 | 时间固定效应与时间趋势项
这期推送将比较时间固定效应和时间趋势项的区别,并使用两种方法对模型中可能存在的trend进行识别。
kemosabe
2021/10/06
3.7K0
计量模型  |  时间固定效应与时间趋势项
回归分析中自变量取舍、检验及多重共线性处理(VIF)「建议收藏」
A1 正交假定:误差项矩阵与X中每一个x向量都不相关 高斯-马尔科夫定理:若满足A1和A2假定,则采用最小二乘法得到回归参数估计是最佳线性无偏估计 方程估计值b1和b2可以看做偏回归系数,也是相应自变量对y的一种偏效应 偏效应:在控制变量下,各自变量X对因变量Y的净效应 残差项:针对具体模型而言,被定义为样本回归模型中观测值与预测值之差 误差项:针对总体真实回归模型而言,它由一些不可观测因素或测量误差所引起 纳入无关自变量并不影响OLS估计结果的无偏性,但是如果无关自变量如果与其他自变量相关,会导致相应回归系数(b1,b2)的标准误增大;换句话说,如果总体中无关自变量对y没有偏效应,那么把它加入模型只可能增加多重共线性问题,从而减弱估计的有效性。 因此,不要加入无关自变量,原因是
全栈程序员站长
2022/09/02
3.4K0
我眼中的多元回归模型
模型自变量增加后,即便使用聚类等手段进行变量压缩,也不能将自变量的相关性完全剔除,这便会导致具有相关性的自变量溜进模型。由于自变量间关系不同,建模所选择的策略也会不同,模型的结果相对也会有较大差异,SAS中一般会使用selection参数进行变量控制,这个参数即为变量选择提供准则与方法。
许卉
2019/07/15
1.2K0
我眼中的多元回归模型
算法金 | 线性回归:不能忽视的五个问题
线性回归是一种统计方法,用于研究因变量 𝑌 和一个或多个自变量 𝑋 之间的线性关系。其理论依据主要基于以下几个方面:
算法金
2024/06/30
1070
算法金 | 线性回归:不能忽视的五个问题
对比R语言和Python,教你实现回归分析
r的取值范围是[-1,1],r=1表示完全正相关!r=-1表示完全负相关!r=0表示完全不相关。
1480
2020/03/03
1.8K0
突破最强算法模型,回归!!
读者问:“我听说在某些回归算法中,如岭回归和LASSO,数据标准化或归一化非常重要。但是,我不太清楚什么时候以及为什么需要进行这些步骤。方便大概解释一下吗?”
Python编程爱好者
2023/12/18
3190
突破最强算法模型,回归!!
Python数据科学:线性回归诊断
上面只是针对平均支出数据取对数,下面对收入数据也取对数,使得二者增加的百分比值大致一样。
小F
2020/10/09
2.3K0
Python数据科学:线性回归诊断
【应用】 信用评分:第4部分 - 变量选择
“以少胜多”是信用智能的主要理念,信用风险模型是实现这一目标的手段。 通过使用自动化流程并专注于关键信息,信用决策可以在几秒钟内完成 - 并且最终可以通过使决策流程更快而降低运营成本。 更少的问题和快速的信贷决策最终会提高客户满意度。 对于贷方来说,这意味着扩大客户群,吸纳风险较小的客户并增加利润。
陆勤_数据人网
2018/07/30
7900
【应用】 信用评分:第4部分 - 变量选择
R语言广义线性模型(GLM)、全子集回归模型选择、检验分析全国风向气候数据
我们正和一位朋友讨论如何在R软件中用GLM模型处理全国的气候数据。本文获取了全国的2021年全国的气候数据。
拓端
2022/12/17
9820
机器学习回归模型的最全总结!
回归分析为许多机器学习算法提供了坚实的基础。在这篇文章中,我们将介绍回归分析概念、7种重要的回归模型、10 个重要的回归问题和5个评价指标。
算法进阶
2023/09/21
1.9K0
机器学习回归模型的最全总结!
详解:7大经典回归模型
来源:csdn 深度学习爱好者本文约2900字,建议阅读5分钟本文给大家介绍机器学习建模中7大经典的回归分析模型。 什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下来的部分详细
数据派THU
2023/04/18
1.2K0
详解:7大经典回归模型
你应该掌握的 7 种回归模型!
线性回归和逻辑回归通常是人们学习预测模型的第一个算法。由于这二者的知名度很大,许多分析人员以为它们就是回归的唯一形式了。而了解更多的学者会知道它们是所有回归模型的主要两种形式。
红色石头
2019/05/25
2.3K0
面板数据与Eviews操作指南(上)
一、面板数据简介 信息技术的发展使得数据越来越膨胀,传统的截面数据和时间序列已经不能全面刻画经济的演变,在大数据背景下,同时分析比较横截面观察值和时间序列观察值的需求越来越大。面板数据就是指既含有截面又含有时间序列的数据,分析比较这种数据的模型就是面板数据模型。 相对于一般的回归模型,面板数据模型不仅能够更好的识别和度量单纯时间序列模型和单纯横截面数据模型所不能发现的影响因素,而且可以克服多重共线性的困扰,能够提供更多的信息、更多的变化、更高的自由度和更高的估计效率,减少共线性。因此,面板数据可以更准确地刻
数说君
2018/03/28
4.2K0
面板数据与Eviews操作指南(上)
广义线性模型(GLM)专题(2)——带约束的假设检验,模型诊断,0/1变量分析与建模
这一节我们继续广义线性模型的相关内容去说。事实上在这一节我们会发现,我们更多会回到一些更简单和实际的应用中来,因此这一节的内容不会有上一节那么难以理解,但相对应的,基本的概念和背景知识会比较多。我们也会提供对应的习题帮助大家理解。
学弱猹
2022/03/30
1.7K0
广义线性模型(GLM)专题(2)——带约束的假设检验,模型诊断,0/1变量分析与建模
机器测试题(下)
人工智能一直助力着科技发展,新兴的机器学习正推动着各领域的进步。如今,机器学习的方法已经无处不在—从手机上的语音助手到商业网站的推荐系统,机器学习正以不容忽视的速度闯入我们的生活。以下测试题可以粗略的检测你对机器学习的了解和掌握程度。 本文接上篇《机器学习测试题(上)》,有对机器学习有兴趣的小伙伴可自行测试。 21.在一个包含5000个特征及超过一百万个观测值的数据集上建立一个机器学习的模型,下面哪种方法能更高效地训练模型? A.从数据集中随机抽取样本来建立模型 B.使用在线学习算法 C.使用主成分分
小莹莹
2018/04/19
1.3K0
机器测试题(下)
常见的七种回归技术
介绍 根据受欢迎程度,线性回归和逻辑回归经常是我们做预测模型时,且第一个学习的算法。但是如果认为回归就两个算法,就大错特错了。事实上我们有许多类型的回归方法可以去建模。每一个算法都有其重要性和特殊性。 内容 1.什么是回归分析? 2.我们为什么要使用回归分析? 3.回归有哪些类型 ? 4.线性回归 5.逻辑回归 6.多项式回归 7.逐步回归 8.岭回归 9.Lasso回归 10.ElasticNet回归 什么是回归分析? 回归分析是研究自变量和因变量之间关系的一种预测模型技术。这些
智能算法
2018/04/02
1.2K0
常见的七种回归技术
一些数据处理的方法
这期推文其实在上期之后就一直在构思,只是在实际落地的时候有一些小问题需要解决,然后这段时间又在忙其他事情,所以就一直拖到了现在……
kemosabe
2021/09/08
2.4K0
一些数据处理的方法
回归分析技术|机器学习
原文:http://www.analyticsvidhya.com/blog/2015/08/comprehensive-guide-regression/ 回归分析是建模和分析数据的重要工具。本文
陆勤_数据人网
2018/02/28
9910
回归分析技术|机器学习
面板数据与Eviews操作指南(上)
假想,你现在需要分析2000-2014年,全国34个省级行政区基础建设投资对GDP的影响分析,或者说构建回归模型: GDP = a × 基础建设投资额 + e 但是问题来了,你现在手上的数据,不仅有时间序列(2000-2014),也有横截面(34个省),那么怎么办?是将每个省求14年的均值呢?还是对每一年求34个省的均值? 好纠结啊! 别急,面板数据就是用来处理这个的。面板数据是既有时间序列、又有横截面的数据,一般学经济的同学会比较常处理到这样的数据。 数说君的硕士毕业论文就用到了这个模型,因此本文也是数说
数说君
2018/04/04
3.7K0
面板数据与Eviews操作指南(上)
相关推荐
计量模型 | 固定效应与交互固定效应
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档