品玩SAS:需要正视的青春期生育率

这一部分不考,你们稍微看一下就好。

——生物老师

今天在网上看了一个各国青春期生育率(每千名15-19岁女性生育数)的视频,发现视频上各国青春期生育率大多处于逐年下降的状态。然而回想前段时间爆出的直播平台上为数不少的“00后宝妈”,似乎随着经济的发展,移动互联网的普及,各类信息的流动越发迅速便捷,加之西方文化的交融,国人对于性的观念不在那么保守,在年轻一代也更为明显,甚至“早孕生子”成了吸金、出名的一大网红捷径。这种现象明显与视频展现的情况不符,那么经济的发展与青春期生育率是否有什么关系?又有什么关系呢?

本期“品玩SAS”就以青春期生育率与经济发展水平的关系为题,探讨不同经济发展水平下的青春期生育率,以及经济发展对青春期生育率的作用关系。以下数据取自世界银行统计的2013年至2016年世界各国人均GDP和青春期生育率。

指标说明:

Country:国家名

2013GDP:人均GDP(美元)

2013SYL:青春期生育率(百分比)

数据来源:世界银行

1.建立数据集

首先将收集的excel格式数据导入到SAS系统。

proc import out=sasuser.GDP /*输出的数据集名*/

datafile="d:\sastest\liu\GDP.xls"; /*要导入的excel文件的完整路径和数据名、扩展名*/

sheet="Data"; /*指出电子表格中的表单名字*/

getnames=yes; /*指出第一行是否有字段名*/

run;

proc import out=sasuser.SYL

datafile="d:\sastest\liu\SYL.xls";

sheet="Data";

getnames=yes;

run;

proc print data=sasuser.GDP;

title '人均GDP';

run;

proc print data=sasuser.SYL;

title '青春期生育率';

run;

如下为SAS系统中GDP和SYL的数据信息。

2.处理、汇总数据

将两表合并,剔除GDP或SYL中数据为缺失值的国家。

proc sort data=sasuser.GDP;

by Country;

run;

proc sort data=sasuser.SYL;

by Country;

run;

data GDP_SYL;

merge sasuser.GDP sasuser.SYL;

by Country;

data GDP_SYL1;

set GDP_SYL;

if _013GDP=.thendelete; /*去除数据缺失国家*/

if _016GDP=.thendelete;

if _013SYL=.thendelete;

if _016SYL=.thendelete;

proc print;

title '汇总信息';

run;

下图为处理、汇总过后的数据集,信息完整。

3.计算GDP和生育率均值

建立新的数据集,求出各国最近四年人均GDP与青春期生育率的均值,删除原始数据。

data GDP_SYL2;

set GDP_SYL1;

SYL_jz=(_013SYL+_014SYL+_015SYL+_016SYL)/4; /*计算青春期生育率均值*/

GDP_jz=(_013GDP+_014GDP+_015GDP+_016GDP)/4; /*计算人均GDP均值*/

drop _013SYL _014SYL _015SYL _016SYL _013GDP_014GDP _015GDP _016GDP;

proc print;

run;

4.正态检验

为判断人均GDP与青春期生育率之间的关系,需要先进性正态检验,符合正态分布才可继续分析。

proc univariate data=GDP_SYL2 normal; /*normal正态检验*/

var SYL_jz GDP_jz;

run;

青春期生育率均值正态检验结果。

人均GDP均值正态检验结果。

由于样本数据少于2000个,此处直接观察Shapiro-Wilk(W检验)即可,两个指标的P值均小于0.0001,符合正态分布。

5.相关性分析

下面对两个指标进行相关性检验。

proc corr data=GDP_SYL2; /*corr相关性分析*/

var SYL_jz GDP_jz;

run;

通过皮尔森相关系数可以看出青春期生育率均值和人均GDP均值之间的相关性,P值小于0.0001结果可信,-0.57469表明两者存在明显的负相关,即人均GDP越高,青春期生育率越低。下面继续探讨两者间具体的相关公式。

proc reg data=GDP_SYL2; /*reg回归分析*/

model SYL_jz=GDP_jz; /*因变量=自变量*/

run;

quit;

由上图参数估计表可知,P值小于0.0001结果可信,两者之间关系为:青春期生育率=74.00207+人均GDP×(-0.00061134)。

通过以上分析可以看出经济发展与青春期生育率确实存在相关性,并且伴随着国家经济水平逐年提高,青春期生育率呈现下降趋势。这样看来早孕问题更应该是性教育缺失以及追名逐益所导致的不良现象了,规整“网红”、直播平台,正视性教育,是社会的责任、观念的进步更是对孩子的保护。

原文发布于微信公众号 - AI机器思维(jiqisiwei)

原文发表时间:2019-04-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券