半-非参数模型的大样本筛分估计方法

摘要

在当代经济学研究中,研究者经常会发现参数模型的限制过于严格,一旦模型设定不准确就容易出现严重的估计偏误。相比之下,半参数模型更加灵活和稳健;但它也有潜在的问题,例如可能会引入非紧凑的无限维参数空间,或者优化问题不再适定。面对这些问题,筛分(Sieve)方法通过在一系列近似参数空间(即 sieves)上最大化经验目标函数提供了一种简便的解决方案。这种方法的核心在于:筛近似空间相比较原参数空间更简单易于分析,同时筛近似空间在原参数空间上是稠密的,这就使得上述优化问题从不适定变成适定的。通过选择不同的筛空间和经验标准,筛分方法在估计具有(或不具有)内生性以及潜在异质性的复杂半非参数模型时非常灵活,具有广泛的适用范围。筛分方法可以很简便地整合来自经济学理论的先验信息和条件约束,例如单调性、凸性、可加性、可乘性、排除性和非负性等。此外,筛分方法可以同时估计半非参数模型中的参数部分和非参数部分,并且在多数情况下这两部分的筛估计量都可以达到最优收敛速度。

本文描述了如何使用筛分方法估计半非参数计量模型。我们介绍了关于筛分方法估计量的大样本特征的一般结果,包括筛分方法极值估计量的一致性,筛分方法M-估计量的收敛速度,回归函数的级数估计的逐点正态性,无限维未知参数(函数)的平滑泛函的筛分估计量的 √n - 渐近正态特征和有效性等。本文提供了具体实例来阐述这些结果。

关键词: 筛极值估计法,级数,筛最小距离,半参数两步估计法,半非参数模型下的内生性

JEL: C13, C14, C20.

1 前言

在理论和应用计量经济学中,半参和非参建模技术越来越受到研究者的关注。1究其原因,部分来自于经济学理论很少给出变量之间的函数关系,也不会设定残差项的分布密度。半非参数模型越来越受欢迎的另一个原因是随着时代的进步收集和分析大型经济数据集的计算成本在下降。Barnett et al. (1991) 中的全部章节和Engle and McFadden (1994) 编写的计量经济学手册(Handbook of Econometrics)第四卷中的部分章节已经总结回顾了截至上世纪九十年代中期计量经济学在半参和非参模型上的进展。2更近一点的研究包括Horowitz(1998),他使用核方法(Kernel) 分别估计了四类具有代表性的的半参数计量经济学模型。此外,Pagan and Ullah (1999), Haerdle et al. (2004) 和Li and Racine (2006) 系统总结了当前影响较大的应用核方法、局部线性回归和级数估计方法来实现半参和非参计量模型的估计和检验的相关理论和实证研究。本文将回顾近年来关于使用筛分方法(Sieve)估计半非参数模型的大样本理论的一些研究进展(Grenander,1981)。

半非参数模型涉及无限维参数空间中的未知参数(函数)。因此,使用有限样本估计这类模型在计算上往往会非常困难。此外,即使可以解决在无限维参数空间上最大化经验目标函数的问题,所得到的估计量也很可能会具有例如不一致和/或非常慢的收敛速度的劣大样本性质。这是因为在无限维非紧凑空间上的优化问题可能不适定。为了解决这个问题,筛分方法在一系列显著简化的有限维参数空间(称之为“筛”,sieves)上求解目标函数最大化问题。为了确保得到一致的统计量,我们要求随着样本量的增长这些筛也愈加复杂,这样一来当样本量足够大时筛在原始参数空间上是稠密的。3

非参数或半参数模型中的无限维未知参数通常可以被视为具有特定性质(如二阶导数有界、单调、凹函数等)的某函数空间的成员。因此,我们可以借助许多在数学和计算机科学中已经开发出来的具有确定性的近似方法来挑选合适的、简便易算的、更接近未知目标函数的筛(sieves)。例如,我们可以使用基于幂级数、傅立叶级数、样条函数或其他基函数的线性生成空间来构造筛或近似空间;参考Judd (1998,第6、12章) 借助筛分方法得到经济和金融问题的数值解。由于我们可以用有限维参数来刻画这些已知近似空间,在使用筛分法估计非参或半参模型时本质上是将无限维未知参数估计问题转化为有限维参数估计问题。然而,为了获得估计量的理想理论性质,用来定义近似空间的未知参数个数的增长速度不能过快,需要随样本量上升而缓慢增加。正是这个特征使得筛分法超越了采用固定有限维参数空间的经典参数方法,具有更好的灵活性和稳健性。

筛分方法的一大优势在于非常易于实施。当未知函数非线性地进入目标函数(或矩条件),或满足一些已知的限制,例如单调性、凹性、可加性、可乘性或排除性时,或者当研究者已经知道误差分布满足某些尾部特征(如长尾)时,筛分方法应用起来就更加简便。通过选择不同的目标函数和筛,筛分方法提供了一种灵活可计算的适用于具有(或不具有)特定约束、内生性和潜在异质性的复杂半非参数模型的估计方法。此外,它可以同时估计半非参数模型中的参数部分和非参数部分,并且估计量通常可以达到两部分的最优收敛速度。我们将在后续章节中举例说明这一点。

虽然筛分方法易于实现,筛分估计量也通常具有理想的大样本特性,但其理论性质不能通过直接应用现有的经典参数模型理论来证明。任何关于筛分法的大样本理论都不仅应该考虑由于我们用更简单的筛分空间替代原始参数空间所导致的近似误差,还要注意控制随着样本量变大而逐渐增长的筛分参数空间的复杂程度。因此,筛分方法的大样本性质通常难以证明,这可能部分地解释了为什么当前使用这种技术的计量经济学应用比使用核方法的更少。然而,我们应该注意到,筛分估计方法同许多计量经济学的标准估计方法(如基于级数的方法)自洽,后者往往是筛分法的某种特殊形式。因此,在以往文献中其实已经出现过一些关于筛分方法大样本性质的结果,却并没有提到“筛”这个词。

在本文中,我们将介绍关于筛分法的大样本估计理论的一般结果,并举例说明如何应用这些结果。受篇幅所限,我们只选择一部分相对容易理解又不失一般性的半非参计量应用来介绍和总结筛分方法的相关理论。对于文中没有详细介绍的理论结果,文末给出了参考文献。

本文的其余部分安排如下。在第2 节中,我们首先介绍半非参数计量经济学模型的几个例子。然后定义筛分极值估计及几种特殊情况,包括筛分M 估计、筛分极大似然估计(MLE)、筛分广义最小二乘法(GLS)、筛分最小距离(MD)等。本文使用范例来具体说明各种目标函数。此外,我们介绍受到普遍关注的“级数”估计量,它是当目标函数为凹形且筛空间为有限维线性时所获得的筛分M 估计量。4此后,我们将讨论计量经济学中用到的经典函数空间和筛分空间,并通过一个蒙特卡洛研究来展示具体如何实现筛极值估计。5第3 节主要介绍无限维未知参数的筛分估计的大样本特性。我们首先为一般的筛分极值估计法给出全新的当原始参数空间不紧凑、问题本身可能不适定时的一致性定理。该定理在两个层面上意味着筛分M 估计量和筛分MD 估计量均满足一致性特征。然后,我们给出关于筛分M 估计量的收敛速度的结果,并通过实例说明如何应用这一结果。我们还回顾了级数估计量的收敛速度和逐点渐近正态性结果。在第4 节中,我们介绍了关于未知无限维参数的平滑泛函的筛估计量的√n - 渐近正态性的一般结果,其中n 表示样本大小。我们首先讨论流行的半参数模型两步估计法,其中第一步可以通过任何非参方法(如核、局部线性回归和筛分方法)估计未知函数(大多是无限维),第二步通过广义矩方法(GMM)来估计有限维未知参数。值得注意的是,上述第二步中GMM 估计量的√n - 渐近正态性定理同现有半参估计理论有些许不同。接下来,我们回顾了未知函数的平滑泛函的筛M 估计的渐近正态性以及筛MLE 估计的半参有效性。最后,我们介绍了近期关于半非参数条件矩模型中有限维参数部分的筛分MD 估计的理论;在这类模型中未知函数可以取决于内生变量。第5 节介绍了有关使用筛分方法做统计推断的其他专题,由于篇幅所限这些专题未能在本文中进行详细讨论。

在本文中我们一直假设存在一个完备的概率空间,数据是严格平稳遍历的,6同时所有的概率计算都是在真实概率测度Po 下完成的。对于随机变量 Vn 以及正数 bn, n ≥ 1, 我们定义Vn = OP(bn) 为 limc∞lim supnP(Vn≥ cbn) = 0, 定义 Vn= oP (bn) 为对所有 c > 0,limnP(Vn≥ cbn) =0 。表达式 plimn∞Vn= 0 同时意味着 Vn= oP (1) (也就是说, Vn依概率收敛到0 )。类似的,Vn= oa.s.(1)意味着 Vn几乎处处收敛到0。对于两列正数 b1n和b2n,表达式b1nb2n意味着 b1n/b2n上、下均有界,且这些界独立于 n。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180124G0H35P00?refer=cp_1026

扫码关注云+社区