Tensorflow简单神经网络解决Kaggle比赛Titanic问题(1)
又到了假期,忙碌了一个学期,终于可以休息一下了。
一直想再Kaggle上参加一次比赛,在学校要上课,还跟老师做个项目,现在有时间了,就马上用Kaggle的入门比赛试试手。
一场比赛,总的来说收获不小,平时学习的时候总是眼高手低,结果中间出现令人吐血的失误 >_Kaggle比赛介绍
简而言之,Kaggle 是玩数据、ML 的开发者们展示功力、扬名立万的江湖,网址:https://www.kaggle.com/
Kaggle虽然高手云集,但是对于萌新们来说也是非常友好的,这次的Titanic问题就是适合萌新Getting Started的入门题。
Kaggle 是当今最大的数据科学家、机器学习开发者社区,其行业地位独一无二。
(此话引用自谷歌收购 Kaggle 为什么会震动三界(AI、机器学习、数据科学界)?)
Titanic问题概述
Titanic: Machine Learning from Disaster
比赛说明
RMS泰坦尼克号的沉没是历史上最臭名昭着的沉船之一。 1912年4月15日,在首航期间,泰坦尼克号撞上一座冰山后沉没,2224名乘客和机组人员中有1502人遇难。这一耸人听闻的悲剧震撼了国际社会,导致了更好的船舶安全条例。
沉船导致生命损失的原因之一是乘客和船员没有足够的救生艇。虽然幸存下来的运气有一些因素,但一些人比其他人更有可能生存,比如妇女,儿童和上层阶级。
在这个挑战中,我们要求你完成对什么样的人可能生存的分析。特别是,我们要求你运用机器学习的工具来预测哪些乘客幸存下来的悲剧。
目标
这是你的工作,以预测是否有乘客幸存下来的泰坦尼克号或不。
对于测试集中的每个PassengerId,您必须预测Survived变量的0或1值。
度量值
您的分数是您正确预测的乘客的百分比。这被称为“准确性”。
提交文件格式
你应该提交一个csv文件,正好有418个条目和一个标题行。如果您有额外的列(超出PassengerId和Survived)或行,您的提交将会显示错误。
该文件应该有2列:
PassengerId(按任意顺序排序)
生存(包含你的二元预测:1存活,0死亡)
领取专属 10元无门槛券
私享最新 技术干货