原创内容
No.684
杂谈 | 用数据分析的方式打开延迟退休
最近延迟退休的消息真的是炸得漫天飞,作为一个数据分析师,自然也想用数据分析的方式来聊聊延迟退休~
图片由海艺AI绘制
最近要说什么话题最火,除了奥运会应该就是闹了个大乌龙的延迟退休吧。随便刷一下短视频就能看到各种“64岁精致打工人上班vlog”的整活视频(大数据真是懂我)。
延迟退休这个话题,我可就不陌生了。非要说得话,我一个文科生日后转行做数据分析这件事多少也和这个话题沾点边,毕竟,我当年本科毕业论文写得就是延迟退休。
毕竟在这个问题上也算是半个专业人士了,和周围人讨论起这个话题的时候简直就是科普之魂在熊熊燃烧,于是我决定把大学毕业的论文翻出来做一篇非常数据分析的文章。
注:文章内容非常长(就当弥补我多日未更新),时间紧张但是又有兴趣的朋友可以收藏一下空了慢慢看。此外,文章内容中会包含大量的公式推导,对这部分内容看不下去的朋友可以直接跳过,不会对理解造成太大的困扰。
当然,对偏数理的内容实在是看不下去的的朋友们也可以选择直接关闭。这里我只聊数学逻辑,不讲观点。
实际上,养老金的问题测算是非常难的,需要考虑的因素非常非常多,多到这个东西几乎不能严谨地写出公式并计算出来。
经济增长率、工资增长率、通货膨胀率、养老金投资收益率、人口死亡率、社保缴费率、社保断缴情况、区域人口流入流出、人口出生率、地方财政情况、国家财政情况……等等因素都会影响到我们讨论所谓的养老金够不够花的问题。不难想象,如果要构建一个模型来讨论这个问题的难度有多大,至少以我的脑容量来说,从哪里下手都不知道,更别说去分析这个问题了。
虽然现实世界的复杂性让我们很难用一个单纯的模型来讨论这个宏大的问题,但是构建一个比较特殊的场景,这个问题就显得容易计算很多了。这种用一个特殊场景来假设和分析依然能得出有价值的结论的做法,就和数据分析师的工作有异曲同工之妙。
对于这个简单化的模型,我们其实有一个非常现实的但是又相对简单很多的现实场景,那就是公务员的职业年金。在这个场景中,很多非常复杂的问题直接就被抹零不需要考虑了,是一个分析延迟退休问题的很好的切入口。
首先简单说一下公务员的职业年金到底是什么。简单来说就是补充养老保险。
2015 年之前,我国的养老金是“双轨制”的,也就是机关事业单位和企业的政策不一样。2015年出台了新的政策,要求机关事业单位和企业实行一样的基本养老保险制度,机关事业单位职工和企业员工一样缴纳统一的基本养老保险。然而实行基本养老保险制度后,机关事业单位原有的待遇会有所下降(本来不用扣社保现在需要扣了,工资凭空下降一大笔,谁能乐意嘛),为了保证改革前后的公平为广大机关事业单位职工建立了补充养老保险,也就是职业年金。
换句话说,职业年金其实是养老金中非常重要的一个部分,但是相比养老金,很多很重要的参考因素就可以直接忽略了,模型得到了极大的简化。虽然我们用职业年金的话题来讨论整个社会的养老金有失偏颇,但是凭借思维直觉我们也能对整个社会的养老金问题有所推论。
我们日常或许会提到这么一个话题:养老金够不够花,但是我们在讨论这个问题的时候一般不太会讨论说养老金1万够不够花或者养老金5千够不够花。毕竟够不够花这个问题不能一概而论,五千块工资有五千块工资的活法,五万块工资有五万块工资的活法,钱够不够花实际上是一个相对的概念。
尽管绝对值不好讨论,但是相对比例却很容易讨论。如果你退休前的工资是五千块,退休后的工资也是五千块,你肯定会觉得是够花的,但如果你退休前的工资是五万块,退休后的工资是五千块,你肯定会觉得不够花。绝对数其实没有那么重要,真正让人无法接受的东西永远都是落差。
为了更好地聊这个话题,我们通常会用这么一个概念:养老金替代率。养老金替代率指的是劳动者退休时的养老金领取水平与退休前工资收入水平之间的比率。
一般来说,一个国家或地区的养老金替代率水平如果能够保持在70%—80%的区间,就可以保证员工退休后的生活水平和退休前基本一致;若仅能够维持60%
的替代率,则只能保证其基本的生活。
这个倒是不难理解,因为这里的工资指得是税前工资,按照正常扣税扣五险一金来说,到手的工资就是税前工资的70%-80%,换句话说,保持70%-80%的工资就意味着退休工资和在上班的时候工资是差不多一样的,生活水平也就是有保障的。60%的替代率也就意味着退休后的工资比退休前要低出个20%左右,日子将就将就也是能过的,也是绝大多数人都是可以接受的生活质量轻微下降。如果低于55%,一般就会认为是警戒水平了,各种各样的社会问题就会开始出现。
说出来大家可能会觉得略微有点难以接受,但事实情况就是如此,我国养老金制度设计的替代率是60%。
可能一部分人沉默了,为什么不是80%呢?这里就得提到另一个概念了,养老金三大支柱。我国养老金的体系分别由“第一支柱”基本养老保险、“第二支柱”企业年金、“第三支柱”个人商业养老保险“三大支柱”共同组成。
社会保障制度的根本目的在于实现社会的底线公平,避免社会因为贫穷和不公出现动乱。基本养老保险作为社会保障制度的一部分,要做的就是实现社会底线公平,替代率设计为60%合情合理。至于大家想要80%怎么办呢?中间的20%由第二支柱和第三支柱共同承担。
因为职业年金其实就是第二支柱的一部分,所以这里我们可以简单粗暴地把他认定为目标替代率是20%(补上60%-80%的这个差额缺口)。
看到这里,和我一样不在体制内,也没有企业年金的朋友们有没有想到什么?既然制度设计是60%,我想要80%,中间差的20%的缺口就需要自己想办法了,说白了就是要通过自行购买商业养老保险来解决这个问题。更进一步说,如果你也想要补充那个20%的缺口,下面这个模型讨论的问题其实完全可以套用到自己购买商业养老保险的上去。
因为现行政策中,职业年金个人缴费部分实行“实账积累制”,单位缴费部分会计入职工本人职业年金个人账户中。缴费费率是单位8%,个人4%。
这意味着我们可以把职业年金我可以当作简单的强制存款来处理:每月固定把月工资的12%存起来,退休之后按月领取。我自己给自己银行强制存款或者买商业保险啥的,原理上根本就是完全一样的嘛。
一开始就说了,选择职业年金这个玩意做测算,就是很单纯因为算起来简单。但是这东西还不至于简单到可以支持我做模型,对于一个可以写公式做计算的东西来说,我还得假设更多的东西:
1.假定职业年金的目标替代率为20%;
2.将单位缴费和个人缴费视为一个整体计算,以当前政策为例,缴费率为单位缴费的8%加上个人缴费的4%,即缴费费率为12%;
3.由于当前的计发月数在设计时主要考虑了死亡率,考虑到模型计算的时间长达35-40 年,因此引入生命表进行领取年限计算,假定职业年金为终身年金,职工退休后可以一直领取职业年金直到其死亡;
4.假定职工年工资增长率为常数;
5.假设央行基准利率长期内保持不变,是一个常数;
6.假定职工养老金的领取依据为个人账户中的积累值,每年所领取的养老金金额根据利率和通货膨胀率进行调整;
7.假定职业年金没有任何的税费和投资管理成本;
8.只考虑2014年10月之后进入机关事业单位工作的职工的情况。
(高能公式推导环节预警,可跳过)
为了方便推导公式,这里对一些变量做一个命名:
因为职业年金的缴费就像每个月定时往银行卡里存款,所以我们可以算出到退休时我们一共存了多少钱:
第一年:工资W * 缴费比例 * (1+利率)
第二年:第一年总金额(利率是复利)+工资W *(1+工资增长率)*(1+利用率)
第三年:第一年总额+第二年总额+……
总之,也就是下面这个公式:
虽然稍微有一点绕,但这个就是复利数学而已,看不懂/不理解并不影响阅读内容。
在此基础上,我们还可以算一下退休时养老金账户里一共有多少钱可以待领取:
钱不会凭空出现,也不会凭空消失。在这个场景中,我们其实不难想象,我存的总钱数和我待领取的养老金数其实是相等的,也就是上面两个公式的计算结果必须是一样的:
是不是还挺好理解的?恭喜你这里掌握了一个精算的基本原理,账户平衡原理。
还记得一开始提到的养老金替代率公式么?套在这里其实就是这样的:
我们把这个关系代入到上面的等式中,就可以化简上面这个长长的恒等式,得到一个养老金替代率的计算公式出来:
公式都列出来了,接下来就是开始测算的时候,所谓测算,就是就是假设这些参数为不同的值,带入这个公式里计算一样结果。
虽然这个问题已经很简化了,简化到可以用一个公式表示了,但真要开始计算还是有点复杂,所以我们再做进一步的假设,把不是很关心的参数设置为常数。
因为机关事业单位普遍对学历要求偏高,且未来也有越来越卷的趋势。结合我国义务教育的入学年龄和学制,假设我国机关事业单位职工的平均初次参加工作的年龄为25周岁,即假设参数a为常数25。
职业年金的缴费基准是职工工资,而职工工资本身是变动的,根据模型来看,工资增长率是分析职业年金替代率的一个非常指标之一。理论上来讲,机关事业单位职工的工资增长率应与GDP增长率保持一致。根据国家统计局网站上公布的近十年来机关事业单位职工工资增长率的数据和GDP增长率的数据来看,机关事业单位职工工资增长率和GDP增长率在长期上具有一致性,因此可以使用长期GDP增长率来估计机关事业单位职工的工资增长率。
根据近年来GDP的数据来看,我国GDP增速趋于放缓。参考发达国家的历史经验,未来GDP继续维持长期的高增长并不现实。我选择对经济形势进行较为乐观的估计,假定未来长期的GDP增速为6.5%,即假设工资增长率g为常数6.5%(毕竟我论文是2017年写的,当时看似乎合理,现在看这个假设已经不合理了)。
通货膨胀率是指是货币超发部分与实际需要的货币量之比,一般用价格指数的增长率间接表示。根据国家统计局公布的近10年消费者价格指数(CPI)来看,我国的消费者价格指数自2000后逐步趋于稳定在3%左右,因此本文假设未来长期的通货膨胀率f为常数3%。
基准利率是金融市场中具有普遍参照性的利率,本文中计算职业年金的替代率的模型主要利用的是账户精算平衡原理,因此参考的中国人民银行的一年期定期存款利率作为计算利率。
参照央行基准利率的变化表,2000年之前我国的利率水平较高,但是近10年来一直维持在3%左右的低利率水平。考虑到我国未来经济增速将有所下降,加上部分学者的观点,未来我国将很有可能长期维持低利率水平 ,因此本文中假定年利率保持3%不变。
考虑到退休金的领取不得不考虑一个死亡率的问题,我们这里用精算生命表来计算。给大家简单科普一下,生命表其实就是一个死亡率的统计数据表,找了一个比较便于大家理解生命表是一个什么样的东西的图放在这里:
保监会网站上会有官方的生命表数据,作为各大保险公司设计产品时的依据。这个内容其实并不太重要,大家知道有这么个东西就可以了。其中最重要的一个常识就是男女的死亡率有明显的差异,女性普遍上寿命更长。
剩下的三个参数,缴费费率、投资收益率和退休年龄就是我们讨论的重点内容了。
首先,我们按照职业年金的总和缴费率为12%,退休年龄为男60岁,女55岁退休的场景,计算一下在不同的投资收益率下的替代率情况:
我们可以看到不同性别下差异非常明显,男性在投资收益率达到8%时即可达到目标替代率,而女性要在收益率达到11%的时候才能达到目标替代率。
有过投资经验的朋友们应该可以想象得到,在三四十年的长周期下,保证净年投资收益率在8%左右其实是很困难的,更何况是11%了。
前面有提到,这个模型其实和我们个人买养老金的模型很像,所以我们再算算不同的缴费率下的差异:
我这里算了8%,12%,16%三个版本的数据出来。对男性而言,当缴费率为8%时,保底投资收益率(也就是说这个收益率就可以保证20%的替代率达成)为10%;当缴费率为12%时,保底投资收益率为8%;当缴费率为16%时,保底投资收益率为6%。但是对女性而言,当缴费率为8%时,保底投资收益率高达12%;当缴费率为12%时,保底投资收益率也达到了10%;当缴费率为16%时,保底投资收益率为8%。
仅从理论上来看,女性职工的替代率远低于男性职工主要有两大原因:一是女性退休年龄早于男性,缴费期间会比男性短;二是女性的寿命普遍较长,领取年金的时间会比男性略长一些。
延迟退休的话情况又如何呢?我们依旧是可以把数据带入计算:
对于男性职工而言,在缴费率为12%的条件下,如果60岁退休,职业年金替代率区间为[6.53%,63.296%],若延迟到65岁退休,替代率区间为[8.476%,103.333%],保底投资收益率从8%降至6%。同样,对女职工而言,如果55岁退休,职业年金替代率区间为[6.668%,25.725%],若延迟到60岁退休,替代率区间为[8.454%,40.946%],保底投资收益率从11%降至9%。
这个计算是不是还挺有意思的?顺手给大家几个计算的中间表看看吧:
虽然是一直说自己是文科生毕业转行数据分析,但是我大学的专业实际上一个很依赖数据分析计算能力的专业,上面的这些计算结果也都是用R写程序算出来的。
从这个角度上来说,我其实并不是传说中的零基础自学成才转行数据分析。这些专业课和测算为我做一个数据分析师打下了坚实的基础,很多时候我都觉得虽然我看专业名字和数据分析八竿子打不着,但实际上也算得上是科班出身了。
断更了一段时间,没别的原因,就是单纯的懒了(游戏真好玩),也是时候回来努力一下了~
二号姬
半路出家自学成才的文科数据人,看过了大厂的风景也做过了小厂的CDO~目前是闲职,写写稿带带学生,欢迎勾搭~