首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

机器学习对经济学研究的影响研究进展

机器学习与经济学研究的融合将改变传统经济学的研究方式。本文就机器学习对经济学研究的影响进行了较为系统的梳理,着重分析了机器学习在大数据背景下对丰富经济数据多样性的贡献,机器学习对经济预测准确性的改进作用,以及机器学习在估计平均处理效应、处理效应异质性和结构模型等因果推断中的应用,对这些领域的重要研究进行了比较详细的介绍。在阐述机器学习优势的同时,本文也指出在经济学研究中使用机器学习方法可能存在的局限性,并对未来的研究方向进行了展望。

随着技术的进步,机器越来越在工作和生产活动中扮演起了人的角色。例如,Facebook能在照片中识别出人脸,Siri能够理解人的语言,谷歌能够直接翻译网页上的文字等。上述新兴科技实际上都依赖于机器学习技术的发展。什么是机器学习?从狭义的角度理解,所谓的机器学习就是一类算法,属于计算机科学的一个子领域,但从广义的角度来看,它又是一种综合了计算机科学、工程学、统计学等多学科知识的新技术。机器学习的方法不仅被广泛地应用于理工医学等领域,并且越来越受到社会科学研究者的重视。许多经济学家都认为机器学习会对经济学的发展产生广泛且深远的影响,以至于在不久的将来,机器学习将改变经济学的研究方式。

从理论上说,机器学习(尤其是深度学习)是人工智能的一个组成部分(Taddy, 2018),更是当前人工智能领域科研和应用的重要驱动力,其算法的快速发展将会引起市场决策和政策研究的根本性变革。为了加快我国在人工智能领域的技术进步,国务院于2017年7月发布了《新一代人工智能发展规划》,旨在2030年使我国的人工智能理论、技术与应用在总体上达到世界领先水平,并成为世界主要的人工智能创新中心。需要说明的是,《新一代人工智能发展规划》在强调发展高级机器学习、类脑智能计算、量子智能计算等前沿理论的同时,还特别指出在研究过程中要积极推动人工智能与心理学、数学、经济学和社会学等相关学科的交叉融合,以及开展跨学科的探索性研究。2017年10月,在科技部征集的重大变革性科研技术项目中,有4项与人工智能有关,其中一项就是针对下一代深度学习理论与技术,力求突破我国在机器学习领域理论基础薄弱、模型结构单一的瓶颈。由此看来,探讨机器学习对经济学研究方法的影响,既可以帮助我们更好地理解机器学习的内涵,又有利于我们更多地使用机器学习工具以改善经济学研究方法,并在提高研究精准度的同时不断拓展新的研究领域。

在本文中,我们试图将机器学习的方法融入经济分析的框架中,并从以下几个方面梳理了其对经济学研究的影响:(1)机器学习的定义以及分类;(2)在大数据的背景下,阐述机器学习从哪些维度丰富了经济数据;(3)介绍机器学习如何改进了经济预测的准确性;(4)机器学习在因果推断中的应用。

在经济学研究中,理论驱动的推理和数据驱动的分析总是相辅相成、必不可少的两个部分。所谓数据驱动的分析模式,其目标就是让数据说话。机器学习提供了一个强大的分析工具,能够让研究者更清晰地听到数据所要表达的内容。未来,随着机器学习的发展,其对经济学研究的意义可能不仅仅是提供新的数据或新方法,而是要帮助经济学家发现新问题。本文对使用机器学习方法进行经济学研究的已有文献进行了较为系统的梳理,在与传统计量方法的对比中,阐述机器学习的优势。

首先,在面对大数据时,机器学习中的无监督机器学习技术可以处理相对于标准估计方法来说维度过高的数据,以帮助经济学家从图像、文本等非常规数据中提取出具有经济意义的信息。其次,在进行经济预测时,机器学习中的有监督机器学习技术可以根据数据选择更加灵活的函数形式,具有很好的样本外预测能力,同时又能避免过度拟合的问题。并且,在经济学实证研究最为关心的因果推断问题上,机器学习又可以通过挑选重要的协变量来改善平均处理效应的估计结果、估计处理效应的异质性,同时在估计结构模型时发挥重要的作用。

然而本文也指出,由于侧重点的不同,机器学习算法在经济学研究中所扮演的角色,更多的是对现有计量方法的补充,而非替代。机器学习侧重于预测效果的准确性,它可以利用灵活的函数形式挑选出一系列具有最佳预测效果的协变量,但却无法准确地估计出某一协变量的变化对于因变量的影响程度,以及相应的统计推断结果。例如,在劳动经济学领域关于教育投入与回报的研究中,人们对增加受教育年限后,其工资是否会受到显著的影响,以及会变化多少非常感兴趣。机器学习的算法能够帮助我们找出一组变量,很好地预测工资水平,却无法准确回答受教育年限变量的显著性和影响程度的问题。而且,不同的预测变量组合也可能会产生同样的预测效果,使得最终选择的预测模型可能没有很好的经济含义,这是机器学习算法的灵活性所带来的成本。再者,机器学习算法在实证调优的过程中,为了简化模型的需要,可能会遗漏重要的经济变量,导致我们关心的变量的系数估计产生偏误。在上述方面,传统的计量方法依然有其优势。因此,我们应该根据具体的问题,在研究过程中将两种方法结合起来。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180918B1JP9T00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券