前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何以Python为工具走入数据科学之门

如何以Python为工具走入数据科学之门

作者头像
叶锦鲤
发布2018-03-15 11:18:15
6320
发布2018-03-15 11:18:15
举报
文章被收录于专栏:悦思悦读

本次分享第【1】部分:什么是数据科学

本次分享第【2】部分:如何从小白成长为数据科学家

分享主题:Data Science学习分享会

分享时间:2016年4月18日晚8:00-10:00

分享地点:赤兔“数据挖掘”小组,线上

分享嘉宾:黄逸洲,来自美国华盛顿大学信息管理专业的研究生,专攻数据科学。

下面根据作者的经验,为大家提供一条基于python的数据科学入门之路。

开始学习之前,你可以问一下自己,什么是python?python对于数据科学会有什么帮助?

上图显示了python依然是比较受欢迎的一种语言。用这样的语言作为工具学习数据科学理论并实践,你会在路上遇到很多同道,遇到的问题很容易找到老师请教,还会有很多别人已经做好的开发包可以拿来使用。

学习的第一步当然就是配置环境,学习python基础,解决一些python问题,编写一些简单的python脚本。

推荐可以安装Anaconda,里面把各种包已经安装好了,也提供python和ipython供大家使用,比较方便。

python基础网上有很多很好地资料,如codeademy或者上一些mooc的课程,都很容易上手。

学好python基础就可以学习正则表达式,和进行简单的爬虫训练,beautifulsoup和scrapy都是很好地工具。

推荐coursera上的一门课:Learn toprogram and analyze data with Pythonn,里面从python基础,网络爬虫,再到网络的一些知识,如HTTP,TCP/IP都有所涉及,是很好的入门课程。

学习好一些基础知识之后,就是要知道怎么利用一些更为专业的科学库来处理和分析数据:

  • pandas和numpy都是经常会用到的包;
  • matplotlib是一个很好的数据成像包;
  • 数据可视化可以使用Tableau和D3等工具很容易的实现;
  • 机器学习则需要用到scikit-learn这个包,里面提供了很多算法函数,方便大家进行数据分析;
  • machinelearning推荐的课程当然就是Andrew Ng在coursera上的机器学习,浅显易懂,不需要太多数学基础;
  • 如果要进阶看更多理论方面的东西的话,推荐Andrew的CSS229。

这是十个最常用的机器算法,大家可以利用opendataset来训练一下自己:

另外,推荐Kaggle和Analytics Vidhya,里面有很多教程和比赛机会。说不定你的解法还能赢得比赛,拿到大奖。

最后当然是如今的热点VR和AI。如果有精力和兴趣的话可以学习deeplearning的知识以及神经元网络。

数据科学家和艺术家一样都需要自己的作品集来展示自己,在应聘中也是很有帮助的。

推荐陈丹奕老师在知乎上得专栏,很好的介绍了整个数据报告的生成过程。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2016-04-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智汇AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档