专栏首页DT数据侠全球亿万富豪们的财富密码

全球亿万富豪们的财富密码

世界上最有钱的人们都啥样?你不好奇吗?有一位数据侠就通过爬取富豪榜的数据,把2018年的富豪们的财富密码给扒了一扒!

世界财富的分布是一个倒金字塔形状的,来自71个国家的2212人共同拥有9.1万亿美元的财富。他们中的大多数人是白手起家,在科技、金融、时尚和体育行业建立起了自己的“帝国”。有一些人事业刚起步时就处在领先位置上,因为他们从自己的家族企业继承了一大笔财产。这个项目就是要通过数据可视化,分析这些富豪们。

▍项目介绍

在数据源方面我选择了福布斯富豪榜(福布斯杂志于1917年发起的富豪排名的榜单)的数据,我用Selenium工具进行了数据爬取。

至于为什么是福布斯?因为它是一家聚焦商业、投资、科技、企业家、领导艺术以及生活方式的超过百年历史的媒体。他现在有超过3800万的社交网络粉丝。重要的是它维护着一个富豪数据库,并且一直进行着及时更新。

▍项目目标

我的项目是为了回答下面的所有问题:

● 哪个国家的亿万富豪最多?

● 男女比例如何?

● 哪个国家的富豪拥有的财富比例最高?

● 他们的钱都是哪来的?

● 谁是最年轻和最老的亿万富翁?

● 目前他们的身价有何变化?

● 每个国家的首富分别是谁?

▍数据爬取

爬取数据的过程如下:

● 进入福布斯亿万富翁专题首页

● 找到页面的URL地址

● 爬取每个人的细节信息(排名、姓名、身价、年龄、收入来源、国籍、性别)

● 在过程中寻找X path时遇到一些麻烦,因为有时候扫描全网页会发现并没有什么独特的X path

● 对于性别和最新身价的信息,我单独进行了爬取,因为它们和其他信息不在同一页面

▍数据清洗

在得到初步的数据后,新的挑战是如何清洗数据并不丢失重要信息。我使用了Python Numpy、Pandas、正则表达式以及其他方法。我利用我拥有的另一组数据框架,给我的数据增加了两列。之后我增加了一列数据,它显示的是年初的身价和最新身价相比的变化。

清洗后的数据长这样:

▍数据清洗

在制作数据可视化图表时,我使用了Matplotlib和Seaborn文库包。

哪个国家亿万富翁数最多?

从下图可以看到,美国最多,有585名亿万富翁,其次是中国,有373名。之后是德国、印度和俄罗斯。

男女比例

男性1972人,占比89.2%,女性240人,占比10.8%。我自己是觉得有点吃惊,我本来以为女性占比会更多一些。

哪个国家亿万富翁们的财富占整体的比例最高?

如我们所期待的那样,美国排名第一,而且由于数据和其他国家情况差别很大,所以没有在图中展示。第二是中国。第三到第五比较有意思,分别是巴西、加拿大和澳大利亚。

最主要的收入来源?

下图可以看出人们的收入来源都很相似,地产收入是所有人的重要收入来源,投资排在第二。药物、零售、对冲基金、银行等也是很重要的收入来源。

最年轻和最老的富翁

在分析年龄方面我做了一个直方图,我发现大多数人的年龄在50到75岁之间,平均年龄是63岁,中位数是64岁。

最年轻的亿万富翁是安德烈森,她是丹麦人,年龄22岁,身价达到14亿美元。最老的是新加坡航运公司的创始人Chang Yun Chung,今年已经100岁了,身价为19亿美元。

身价最新变化

下图是前11位富豪在2018年1月和10月的身价变化。

各国首富

下图是各国首富的身价以及具体的信息。美国首富贝索斯,身价在1470亿美元左右。

▍结论

这个项目只是一个开始,并没有结束。未来,我希望对过去5年的情况进行分析,这样可以更好地看到这些变量带来的影响。此外我还希望解答下列问题:

● 哪些人加入或者离开了这个富豪榜?

● 富豪个人的排名等变化如何影响了他们的国家?

● 他们每年的财产增减幅度是怎样的?

此项目的代码可以在GitHub获取:https://github.com/patelnilesh1810/Forbes-project

注:本文编译自纽约数据科学院文章THE BILLIONAIRES 2018,点击“阅读原文”查看。内容仅为作者观点,不代表DT数据侠立场。文中图片来自作者。

作者 | Nilesh Patel

题图 | 视觉中国

本文分享自微信公众号 - DT数据侠(DTdatahero)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-01-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 马化腾成全球华人首富——2018胡润全球富豪榜出炉

    源 \ 21世纪经济报道 导读:昨天(2月28日),胡润研究院发布《2018胡润全球富豪榜》,世界首富和中国首富均易主! 其中,亚马逊创始人杰夫·贝佐斯以775...

    顶级程序员
  • 2020全球CEO年薪大榜:劈柴哥年入2.8亿美元登顶

    大佬们超能赚!仅劈柴哥一人的年收入,就比自己1085个员工打一年工都多,虽然对科技贡献大,但环境保护者却说,他们看到了富豪们有着「毁坏」世界的另一面。

    1480
  • 未来富豪,将出自这12大颠覆性领域

    大数据文摘
  • 「镁一刻」360奇酷手机叫板锤子坚果,果粉你们造吗?

    镁客网
  • AkShare-另类数据-彭博亿万富豪指数

    本接口提供彭博亿万富豪指数,由于源数据的问题,缺少第 442 位富豪的资料,所以最终只返回 499 个数据。第 442 位神秘富豪到底是谁?

    数据科学实战
  • AkShare-另类数据-福布斯中国榜单

    数据科学实战
  • 彭博全球科技富翁排行榜出炉,亚马逊贝佐斯居榜首 | 热点

    镁客网
  • 新闻数读 | 200亿;600亿;1/3;3.75亿;895亿;3个

    今日数字 1、200亿——硅谷神秘大数据公司Palantir估值超200亿美元 2、600亿——在从投资者那里获得巨额投资仅三个月后,Uber又要开始新一轮规模...

    CDA数据分析师
  • 「镁客晚报」苹果批Surface Pro很弱,然而iOS被爆比安卓更易感染病毒!

    镁客网
  • 工商总局重点整治咪蒙等 1000 个大 V 公众号 / 马化腾成华人首富 / 腾讯首批功能游戏曝光

    近日,工商总局下发了《关于开展互联网广告专项整治工作的通知》,通知指出将以社会影响大、覆盖面广的门户网站、搜索引擎、电子商务平台、移动客户端和新媒体账户等互联网...

    知晓君
  • 克隆TikTok后,小扎新晋全球第三大富豪,净资产超1000亿美元

    Facebook 的首席执政官扎克伯格的净资产超过1000亿美元,剽窃 TikTok 的小扎竟然走上了「人生巅峰」!

    新智元
  • 万豪酒店宣称数据库被入侵,5亿用户私密信息或外泄!

    今日,万豪国际集团官方微博发布声明称,旗下喜达屋酒店的一个客房预订数据库被黑客入侵,五亿用户信息或已经外泄。这可能会成为仅次于去年雅虎30亿用户信息泄露后,历史...

    大数据文摘
  • 比尔·盖茨官宣离婚,财产分割成谜!除了孩子和基金会,一切都是浮云

    二人推文内容一样:经过深思熟虑,并且为这段婚姻做了大量的努力后,我们决定结束婚姻。过去27年,我们养育了三个超棒的孩子,并且建立了一个全球性的基金会,让所有人都...

    新智元
  • 马云成全球50大领袖人物,力压贝索斯等大佬排名第二,凭什么?

    这几天两份榜单吸引了我的注意。 第一个是3月24日美国《财富》杂志公布的2017年年度全球50位领袖人物榜单。 ? 在这份榜单中,马云跻身榜单第二,超过亚马逊...

    罗超频道
  • 全方面回顾10月经济大数据,洞察经济大局

    工业物联网是物联网产业中一个重要的分支。工业与物联网技术的结合虽然目前并不为大众熟知,但它将会对全球工业带来颠覆性的改变。 工业物联网将在能源、交通运输(铁路...

    钱塘数据
  • 早报:刷单、炒信最高罚款200万 网络水军将受严厉处罚

    1、刷单、炒信最高罚款200万 网络水军将受严厉处罚 惩治刷单、网络水军、互联网平台恶意不兼容,将有法可依。新修订的反不正当竞争法4日经全国人大常委会表决通过...

    用户1335017
  • 身家一夜暴增61亿美元!马斯克晋身美国年薪最高CEO,谁是第二?

    据彭博统计,苹果CEO库克只排第二,获得的薪酬总额为1.337亿美元。马斯克获得近6亿美元薪酬,比库克还要多上3.5 倍。

    新智元
  • 如何利用大数据赚10亿美元?

    在《福布斯》杂志亿万富翁榜单上首次出现的新面孔中,越来越多人通过大数据赚取到巨额财富。这些大数据富翁都在各自领域中占据巅峰位置,他们以前所未有的方式收集、分析...

    腾讯研究院
  • 找到圣杯:终极理解币本位(上)

    本文是囤比特币系列文章学习笔记第一篇,原文链接:囤比特币:https://www.cybtc.com/forum-88-1.html

    凌帅出口

扫码关注云+社区

领取腾讯云代金券