南风金融网 - 中原最权威行情财经门户

热门关键词:  xxx  www.ymwears.cn  缪学刚    
热门: 对付勒索软件的利器:二级 还在为云存储掏冤枉钱?那 【MLinEcon文献推送1】文本 帮助你预防灾难的10款免费 利用Intel傲腾存储制定更智 【MLinEcon文献推送3】新闻

【MLinEcon文献推送7】用机器学习算法评估职业培训的异质性效应

来源:南风金融网 作者:南风金融网 人气: 发布时间:2020-01-06 16:25:44
?
?

原文信息



Knaus, Michael C. & Lechner, Michael & Strittmatter, Anthony, 2017. "Heterogeneous Employment Effects of Job Search Programmes: A Machine Learning Approach," IZA Discussion Papers 10961, Institute of Labor Economics (IZA).
https://ideas.repec.org/p/iza/izadps/dp10961.html
陶旭辉(上海财经大学公共经济与管理学院博士研究生)


【写在前面】近些年的经济学研究非常重视如何正确地进行因果推断(Causal Inference)和处理效应(ATE)评估,尤其是我们更为关心地异质性因果效应(Heterogeneous Average Treatment Effect),并在这个领域发展了各种识别策略,包括工具变量、合成控制、倾向得分匹配、双重差分、断点回归等。这一系列构造反事实(Counterfactuals)的方法在运用过程中除了自身过多的假设难以满足外,还存在很难直接评估其处理效应的外部有效性(External Validity)。即,虽然我们很仔细地在分析和实验设计上做了相对严格的因果推断,但我们仍没能说明我们的因果效应对于其他样本或者设定下仍然存在。而一些补充性的分析(Supplementary Analysis)也越来越帮助我们建立对估计结果和识别策略的可信程度(Athey and Imbens,2017a,a Review)。机器学习便是因果识别政策效果评估(Policy Evaluation)方法上的最新进展。它帮助我们实现对高维数据控制组和实验组差异的调整和改善,使估计处理效应结果更加可信。固然,机器学习的优点并不仅限于此。从Reduced Form与Structural Model到现在的Machine Learning,这个学科总是燃烧着最旺的火焰,用更多的分析工具带给研究者更新的创造力。这个时代,可能真的是经济学研究最充满机会的时代(Stan & Herbert,2019)。




一、引言与背景介绍




传统计量在评估处理效应异质性通常采用两种方法,一类是在互斥组中分样本(Stratifying the Data in Mutually Exclusive Groups),另一类是在回归中采用交互(Interaction)。这两类方法都无法基于现有统计规则(Statistical Rules)系统和全面地考察数据的异质性,从而忽视一些重要问题。此外,以P值为标准的假设检验,当存在大量协变量的高维数据时,这种依靠关注统计显著性的事后选择(Ex-post Selection)将不再有效。机器学习提供了一个针对异质性检验行之有效的规则,它可以使我们尽可能少的遗漏一些重要的异质性并且不用为大量假设检验担忧。最重要的是,即使在存在协变量超过样本大小时,机器学习依然可以依靠灵活模型自洽保持计算的可行。因此,本文运用机器学习的方法作了一系列新的尝试,首先对几乎所有可能的样本分组进行异质性分析,系统地考察了不同失业人员在接受求职培训后的平均处理效应差异;其次,依据异质性的检验结果,提供了针对不同类失业人员能否参加求职培训分配规则,进而达到改善求职培训(Job Search Programmes)效果及提高项目收益-成本最大化的目的。


文章基于瑞士社保记录数据研究了求职培训对瑞士失业人员培训后就业的影响。之所以选取瑞士,除了数据可得之外,还因为瑞士是一个相对富裕的国家,失业率在3-4%(SECO, 2017, Federal Statistical Office, 2017)。不仅如此,瑞士的每一位失业人员必须(have to)在自己离家最近的地区进行失业登记,并获得70%-80%的替代率失业保障金。这某种程度上减少了失业人员样本自选择的问题。瑞士的求职培训项目,即(Job Search Programmes)JSP,是一种提供如何找工作以及求职申请技巧的培训课程,费用由机构出。培训时间相对较短,大概三周左右。这一规定也避免了实验组与控制组在Treated之后计算就业时长的差异过大的可能性,文章后面也通过对控制组调整进一步规避了这一问题。更为特殊的是,瑞士JSP计划存在一个社会工作者的角色(Caseworkers),他们有权决定谁能够参加JSP计划,而其他人不能,这为文章建议优化JSP计划提供政策操作的空间。




二、数据来源和变量




数据:采用2003年瑞士社保记录数据(Swiss Social Security Records),包括238902个未就业样本。经过一系列筛选,剩余样本85198个。其中,12998个参与了JSP项目,72200作为控制组。


变量:结果变量(Y)是就业时间(月);处理变量(D)为是否参加JSP计划;协变量(Z)包括三个维度,失业人员个人特征、社会工作者的失业特征,以及当地劳动市场的特征。共计1268个变量。


处理:因为参与JSP项目培训需要三周,为了使得对照组和实验组可比。同样将对照组失业人员在处理期认定为失业,即便他们已经就业。


描述性统计:


由上述描述性统计看,未参加JSP计划的失业人员相比参加者,就业时间更长。这可以初略的看出JSP计划的负向作用,但是均差(Standardised Differences)在减少。此外,从收入参与者和非参与者之间的收入和以往两年的就业时长可以看出,参加求职培训和不参加求职培训者存在自选择的问题(Selection basis)。这便对因果推断构建反事实有更大的需求。




三、模型与估计方法





模型:


CATE(异质性处理效应)识别:


方法步骤:

(1)运用Modified Covariate Method(MCM)方法选取变量估计倾向得分(Propensity Score)?,匹配实验组和对照组。并计算Inverse Probability Weighting(IPW)。


(2)a.随机将样本分为训练集(Training Sample)和估计集(Estimation Sample)s。b.再将训练集分部分样本作为验证集(Validation Sample),分为10等分(10-fold Cross-validation),其中训练集的目的是训练模型,验证集的目的是筛选模型,估计集的目的是获得估计结果。这里是在训练集中使用LASSO和WOLS方法建立惩罚项挑选异质性变量及模型。选择最优的标准是在验证集中获得均方误差和(Mean Square Error Sum)最小。c.将挑选好模型,在估计集中,再运用加权最小二乘(WOLS)和LASSO建立惩罚估计系数。c.计算异质性处理效应,


(3)重复步骤(2)S次,一般S=30。计算CATEs。按照不同的组分类估计CATEs


(4)估计方差。





四、实证




1.平均处理效应:(由下面两个图可知)


a.求职计划产生了锁定效应(Negative Lock-in Effects)



b.与非参与者相比,JSP参与者在前三个月的就业可能性降低了约15个百分点。这种负向作用直到16个月之后才消失。





c.总而言之,求职计划(JSP)对失业者就业概率是消极影响,从长期而言正向促进作用也并不显著。



2.异质性处理效应



由上图可知,求职培训对于不同类的失业人员效果有较大差异。诸如,JSP求职计划对于年收入低于25,000瑞士法郎的非熟练工人的就业具有正向促进作用。相比其他类型失业人员,在未来六个月将多增加0.3个月(≈9天)就业天数。


3.敏感性检验



由上述核密度图可以看出,大部分CATE均处于-0.8--1,即JSP项目使得失业人员就业时长减少0.8到1个月(大概24-30天)。然而,我们从图分布仍可以看到有少部分样本仍然具有正向显著的结果。这使得本文有机会尝试通过调整不同失业人员参加JSP的准入制度,可以实现优化制度的作用。


4.异质性效应的变量选择




由上图可以看出,CATE在不同分组情况下存在很大差异。其中low(=0),high(=1),我们可以看出参加就业培训的失业人员中,具有低技能比具有高技能的失业人员就业多0.26个月(约等于8天)。即具有较低素质、低水平的失业人员由JSP带来的负效应更小。


5.JSP的分配规则



如上图,可以看出假如采用“Best case”方案(即,将JSP项目分配给CATE更高的失业人员),可以减少就业率的消极影响大约60%(=((0.82 ? 0.33)/0.82)*100%)。




五、结论





本文用机器学习的方法系统地分析了求职计划(JSP)对失业工人异质性影响。为了探究失业人员所有可能异质性对就业的影响,文章采用了加权最小二乘、LASSO等方法进行了因果推断,估计了求职计划的平均处理效应(ATE)和异质性处理效应(HTE)。发现:第一,在平均处理结果看,求职培训没能促进就业,原因是存在工作上的锁定效应(Lock-in Effect);第二,培训开始后的前六个月,不同失业人员在接受求职培训后的平均处理效应存在显著差异。本文依据异质性的检验结果,提出了针对不同类型失业人员能否参加求职培训分配规则,进而达到改善求职培训效果及提高项目收益-成本最大化的目的。


排? ? 版 | 石庆宇

审?? ?核 |?郭? ?峰

责任编辑:南风金融网

最火资讯

首页 | 财经资讯 | 金融理财 | 价格行情

Copyright © 2012-2015 南风金融网门户站 版权所有 Power by DedeCms 豫ICP备12016580号  技术支持:南风金融网

电脑版 | 移动版