前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >你知道哪个世代的宝可梦最强吗?

你知道哪个世代的宝可梦最强吗?

作者头像
用户6825444
发布2020-06-30 16:47:15
1.4K0
发布2020-06-30 16:47:15
举报
文章被收录于专栏:木下学Python

前言

时光荏苒,岁月如梭,宝可梦宝陪伴了我们大多数90后的童年,小编也是比较喜欢宝可梦的,一直到现在出到了第八世代,各种各样的宝可梦让我们大饱眼福。

小编找来了一份宝可梦的数据集,包含了第一世代到第七世代宝可梦的数据,数据来自 kaggle,发布此数据的作者是从这个网站爬取得数据,这个网站相当于宝可梦的一个wiki,就是一些游戏数值,更新版本数据啥都存在这:

https://serebii.net/

作为热爱宝可梦的一份子,你是否能准确的回答以下问题呢:

  1. 宝可梦性别占比?
  2. 宝可梦体型分布?
  3. 宝可梦每个世代的数量?
  4. 宝可梦每个世代的水平,哪个世代最强,哪个最弱?
  5. 宝可梦属性分布如何?
  6. .宝可梦都被赋予了哪些能力呢?
  7. 宝可梦传奇数量是多少?
  8. 是否能识别传说中的神奇宝贝?

数据说话,接下来我们就从数据的角度来解答以上问题。

数据说明

数据一共包含了第一世代到第七世代的宝可梦的的数据,总共801条,41列。

关于这些列的含义小编的文档说明有,在这里也解释一下,主要有哪些列:

name:口袋妖怪的英文名称

japanese_name:神奇宝贝的原始日语名称

pokedex_number:国家宠物小精灵中宠物小精灵的条目号

percent_male:是雄性物种的百分比。如果口袋妖怪没有性别,则为空白。

type1:口袋妖怪的主要类型

type2:口袋妖怪的次要类型

classification:日月精灵宝可梦描述的宠物小精灵的分类

height_m:口袋妖怪的高度,以米为单位

weight_kg:口袋妖怪的重量,以千克为单位

capture_rate:宠物小精灵的捕获率

baseeggsteps:孵化神奇宝贝的蛋所需的步数

abilities:口袋妖怪能够拥有的能力的字符串化列表

experience_growth:宠物小精灵的经验成长

base_happiness:神奇宝贝的基本幸福

against_?:十八个特征,表示针对特定类型的攻击所造成的损失

hp:口袋妖怪的基础HP

attack:宠物小精灵的基础攻击

defense:宠物小精灵的基本防御

sp_attack:宠物小精灵的基础特殊攻击

sp_defense:宠物小精灵的基础特殊防御

speed:口袋妖怪的基本速度

generation:口袋妖怪首次引入的编号世代

is_legendary:表示口袋妖怪是否传奇。

把数据导入进来:

宝可梦性别

小编开始也是认为雄性的占比会比雌性的多一些,雄性大约占60%-70%左右吧,但经过计算发现并没有占那么多。

percentage_male 此字段是雄性物种的百分比,我们经过数据查看,雄性平均占比为55%,那雌性占比为45%

绘制圆环图来查看占比情况:

可以看出的确还是雄性宝可梦要多一些,但并没有多很多,可以说是比较均衡的了

宝可梦体型

宝可梦的身高体重是否具有相关性呢,就是说体重越重,身高也越高,我们来绘制散点图查看一下吧:

我们可以看到身高小于3m,体重小于400kg的范围内,身高体重是呈正相关性的,他们相互之间具有一定的影响,身高越高,可能体重也随之越重。

那从体型上划分,我们分为小型(身高≤1m),中型(1m<身高≤2m),大型(身高>2m),他们各自分别占多少呢?

小编的猜想是中小型偏多,大型的最少吧,那是不是这样呢,让我们一起来看看吧~

我们先把身高进行分组,再绘制饼图:

事实上和我们预想的一样,小型的就像皮卡丘这种,中型的喷火龙大家一定都熟悉的,大型的远古古拉顿,裂空座等。

在对比身高体型时,小编特意找了一个视频来查看每个宝可梦的身高,链接:

https://www.bilibili.com/video/BV1iE411N7ua/?spm_id_from=333.788.videocard.2

世代的数量

宝可梦出了那么多个世代,各种各样的宝可梦层出不穷,那从第一代到第七代每一个世代都会涉及多少个宝可梦呢?

我们以世代分组计算,并绘制折线图:

哎呀,可以看出从第一代到第七代的数量走势呈波浪形,一代多一代少这样换着来,但到了第六代突然减少了,可能是前面设计得够多了吧哈哈,当然感兴趣的可以深度挖掘。

世代的水平

出了那么多代,那大家可能比较关心那个世代的最强?那个世代的最弱?每个世代的水平怎么样?

一般从 HP,攻击,防御,特攻,特防,速度这六个指标可以判定一只宝可梦的强弱:

我们以每一个世代进行分组,并计算这六个指标的平均值,绘制雷达图进行对比:

小编之前认为每个世代的水平都差不都,但现在却是二代的水平要弱一些,除了特殊防御,HP 一般以外,其他的都是最低的水平;

第七代除了在速度上有所欠缺其他都是顶尖的,看来第七代还是比较强的;

最为均衡的那就是第四代了,各项都比较平均,不存在“偏科”的情况。

属性分布

那么多宝可梦,什么属性的最多啊?各个属性分布怎么样子呢?那个属性的数量又是最少的呢?

我们通过分组计算,绘制条形图:

看起来是拥有水属性的宝可梦最多,冰属性的最少,水属性的看起来是最受欢迎的一种属性咯,在选择宝可梦,选择大众的水属性的是一个不错的选择呢。

宝可梦能力

那么多宝可梦,大家一定很想知道宝可梦们都被赋予了哪些能力,小编也好奇什么能力最多的赋予给宝可梦。

我们绘制词云来查看一下:

chlorophyll(叶绿素),植物的能力;

sturdy(坚固),就是皮糙肉厚;

keen(敏锐的),速度灵活性方面的能力

swim(游泳),水性的能力,同时再次验证了水属性的宝可梦的数量最多的;

还有其他属性,就不一一解释了,看图即可(主要都是英文╮(╯▽╰)╭)

传奇数量

那传说中的宝可梦一共出了多少呢?

我们直接画一个图告诉大家吧:

分类器

既然我们知道了传说中的宝可梦的数量那是否可以建立一个分类器去识别他们呢?

小编选择了一些列,使用逻辑回归进行二分类,如下:

识别准确率达到了90%以上呢,那下次再有新的宝可梦,我们可以使用此模型去判断一下了~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 木下学Python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档