一、前言
前一段时间,国外媒体 TOP BEAUTY WORLD 评选了全球最帅男性和最美女性Top100,肖战成为了该排行榜历届以来首位登顶的亚洲人。这一消息立刻成为了流量的热点。
想看一下榜单中的最美小姐姐的信息。可是现在还没有最美小姐姐的文字榜单信息。但网站里有上一届的全球最美女性前一百名的榜单数据,包含了姓名、地区和职业等信息。
全球最美 Top100 女神榜单数据,怎能不获取下来好好探究一波?下面我们利用 Python 爬虫将榜单数据获取下来,并进行数据可视化。
二、爬取数据
首先,我们想要获取到的数据,包括小姐姐的姓名、地区、职业等信息。检查发现网页属于静态网页,因此可以直接分析网页源代码,提取出我们想要的数据。
Python代码如下:
结果如下:
三、数据可视化
先来看看全球最美 Top100 女神得分情况
结果如下:
排第一、第二的 Lalisa Manoban 和 Taylor Swift 得分远远高于之后的美女。
Top100 美女地区分布
榜单上美女来自全球各地,分析那些地区上榜美女人数最多,取Top10。注意,有些美女是混血,比如上面的 "English-American",我们将其统计两次,即既是英国人也是美国人。
结果如下:
可以看到,英美地区的美女上榜人数最多,占了一半多,其次是韩国、中国的美女。
发现国内上榜的美女,职业均是演员。
结果如下:
最后看看美女们的职业
再检查了网站里数据发现,有个别数据美女职业是模特,其他都是Model,就这一个写为model,还有某一个Actress拼写错误,弄成了Atress。还有一个的职业是 TV Actress,也将她归入演员 Actress 内。数据量少,我们直接在表格中找到,将其更改。
榜单中美女们的职业,主要有三种:演员、模特、歌手。这些职业都对各方面都有一定要求,才能发展得好。职业的占比中,可以看到演员的占比是最高的,因为颜值是一个演员重要的名片,特别是如今这样一个看颜值的时代,也是打分成绩中占比最高的一项,因此在榜单中,演员占比最高也就不足为奇了。
作者:叶庭云
CSDN:https://yetingyun.blog.csdn.net/
热爱可抵岁月漫长,发现求知的乐趣,在不断总结和学习中进步,与诸君共勉。
更多阅读
领取专属 10元无门槛券
私享最新 技术干货