前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【Kaggle】Intro to Machine Learning 第一次提交 Titanic

【Kaggle】Intro to Machine Learning 第一次提交 Titanic

作者头像
Michael阿明
发布2020-07-13 14:22:17
4010
发布2020-07-13 14:22:17
举报

项目官网地址

自己简要再记录一下:

  • Join the competition
在这里插入图片描述
在这里插入图片描述

各个 tab 下可以查看数据Data、代码编写Notebooks、讨论、排名、比赛规则、队伍

  • 点击 Notebooks,新建文件
在这里插入图片描述
在这里插入图片描述
  • 添加比赛数据集
在这里插入图片描述
在这里插入图片描述
  • 编写代码
代码语言:javascript
复制
import numpy as np # linear algebra
import pandas as pd # data processing, CSV file I/O (e.g. pd.read_csv)
​
import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for filename in filenames:
        print(os.path.join(dirname, filename))
​
# 读取数据
test_data = pd.read_csv("../input/titanic/test.csv")
test_data.head()
train_data = pd.read_csv("../input/titanic/train.csv")
train_data.head()

# 简要的数据查看,分析男女生存状况
women = train_data.loc[train_data.Sex == 'female']["Survived"]
rate_women = sum(women)/len(women)
print("% of women who survived:", rate_women)

men = train_data.loc[train_data.Sex == 'male']["Survived"]
rate_men = sum(men)/len(men)
print("% of men who survived:", rate_men)

# 随机森林模型,选取4个特征
from sklearn.ensemble import RandomForestClassifier
y = train_data["Survived"]
features = ["Pclass", "Sex", "SibSp", "Parch"]
X = pd.get_dummies(train_data[features])# get_dummies编码处理
X_test = pd.get_dummies(test_data[features])

# 设置模型参数
model = RandomForestClassifier(n_estimators=100, max_depth=5, random_state=1)
model.fit(X, y)#训练
predictions = model.predict(X_test)#预测

# 输出预测文件
output = pd.DataFrame({'PassengerId': test_data.PassengerId, 'Survived': predictions})
# 写入csv文件
output.to_csv('my_submission.csv', index=False)
print("Your submission was successfully saved!")
  • 保存、运行
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

往下找到 output files

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

完成课程 Intro to Machine Learning,发了一张证书,哈哈,加油!

在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020/05/09 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档