Python 学习实例:给娃娃起个好名字

不管是想给自己起个不俗的英文名字,还是想让孩子的英文名字能赶上时代潮流,这个学习实例一定能让你信心满满的挑选自己中意的英文名。这篇学习实例中,用到了美国从1880年到2014年名字的数据库,通过Python解答你对名字的疑惑。

首先,是引用所需的功能包,和导入所需的数据。这里会用到常用的Numpy,pandas, 还有帮助数据可视化的matplotlib 和seaborn. 在Jupyter notebook中输入如下代码:

然后解压已经下载好的zip file: names.zip。 这个在美国人口普查网上是可以下载的。

解压后可以看到从1880年到2014年每一年的txt文件。上图还读取了2011年前面是行数据。不难看出,每行中包括名字,性别,和那一年有多少新生儿叫这个名字。一目了然。

确认读取正确后,可以将所有txt文件整合到一个列表中。

可以看到这个数据库里有3万多个名字。更有趣的是1880年一共就只有几千个名字,而到了2014年,发明创造和记录在案的名字竟然达到了三万多。 可见人民生活越来越有趣了。

接着我们将数据做个分类, 按照性别,名字,和被使用过的年份进行排序。

得到了一百多万条的大数据。

如果有心仪的名字,现在就可以使用"loc"调取,查看这个名字在历史上使用的人有多少。举个栗子:Oscar

可见这个名字是个有历史的名字,一百多年前就开始使用。不仅可以罗列名字的数据,还可以将名字情况绘制成图表:

History of Oscar

History of Max

History of Michael

History of Sean

History of Peter

History of Thor

History of Alex

History of Alfred

History of Wyatt

History of Edmund

History of Eduard

甚至可以将所有名字整合在一个表格中:

漫漫历史洪流中, 叫Michael的人真的很多很多。

最后附上TOP 10的英文名:

male

female

还有更多的功能和工具。期待进一步了解和分享。

PS:原数据和教程都来自Lynda。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180418G07XV300?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券