前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据挖掘学习小组之(抽样分布篇)

数据挖掘学习小组之(抽样分布篇)

作者头像
数据处理与分析
发布2019-08-28 16:40:38
3370
发布2019-08-28 16:40:38
举报
文章被收录于专栏:数据处理与分析

第六周

哈哈,又多坚持了一周,依然为自己点赞!

知识点

抽样分布,使用Python实现!

我的吐槽

在参加数据挖掘学习小组之前,居士做了一个调查:每周能投入在学习上的时间是多少。我记得当时我选了3-5小时。我这是第六周了,可以说每周投入的时间都超过了这个数字。因为自己的数学基础本身比较差,对数据挖掘也是门外汉,每周的学习做起来都要查大量的资料,我觉得自己找资料的时间都不止3小时,而作业时间也不只2小时,加在一起绝对超过了5小时。 不过,正是因为学起来有困难,我认为才有学习的必要。如果是学一些gis类的东西,结合自己的经验应该会容易很多,但这次要学的不是gis,是数据挖掘,是我为了提升自己的能力自己选的方向。为了学好这些知识,除了每周发起者写的一些学习内容与要求,我自己也买了一些机器学习的书籍在看,总之,为了遇见更好的自己,加油吧!

作业

直接代码吧!

截图

代码

代码语言:javascript
复制
import matplotlib as mpl
import pandas as pd
import matplotlib.pyplot as plt
import scipy.stats as stats
#防止乱码
mpl.rcParams['font.sans-serif'] = [u'SimHei']
mpl.rcParams['axes.unicode_minus'] = False

#读取数据
df = pd.read_excel(r'D:\BaiduNetdiskDownload\data\data.xlsx')

#获取数据的描述
des = df.groupby(['Embarked']).describe()
print('id\n','-*'*38+'-\n',des['ID'])
print('Age\n','-*'*38+'-\n',des['Age'])
print('Fare\n','-*'*38+'-\n',des['Fare'])

#绘分布图
plt.hist(df['Fare'],bins=30)
plt.show()

others

能力所限(工作之外的主要精力放在了机器学习部分),这次的作业没能全部完成,只完成了部分,有点惭愧了!

我这个人有个小毛病,光看书学不会,必须要写代码,要实践!毕竟我们伟大领袖都说过:实践出真知!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据处理与分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第六周
  • 知识点
  • 我的吐槽
  • 作业
    • 截图
      • 代码
      • others
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档