最近在做数据统计学相关的一些课程,看到数据相关性的时候,想可以找一些实际的案例可以再课程中作为案例给学员操作,于是我找了 儿童升高和体重的数据,来做相关性的数据分析,我们来看原始的数据
这个是1-12岁的儿童的升高和体重的标准,是在网上搜到的数据,于是我对这组数据做了个回归分析:
1、选择身高和体重的数据
2、根据数据绘制散点图
3、对散点图进行指数函数的回归
发现竟然完全的重合在指数的回归曲线上,拟合度达到了 0.999
原来儿童的升高体重是根据回归函数设定的, 这也就意味着,我可以根据这个函数算出13岁孩子的 160CM的标准体重,首先我们的函数公式是 y = 2.2768e0.0192x ,X的变量就是儿童的升高,也就是意味着我只需要输入各个年龄段的儿童的升高,就可以得出相应的体重的数据,反之,我也可以输入体重数据,得到身高的数据,所有这两个数据是相关性的数据。
我根据回归函数的公式,得出160CM的儿童的体重是 49.12KG,这个就是我们所谓的儿童身高体重的标准数据。
这让我比较的震惊,我以前一直以为儿童的这个指标是用过大数据的抽样,然后在进行平均值 或者分位置的算法来算出各个年龄的儿童的标准的身高体重,=现在看来原来这些数据都是自己算出来的,是个完美的数据,所以如果你是一个孩子的家长,就不需要太在意这些数据了,千万不要被这些完美的数据忽悠。