我想学习Python和R在数据科学项目中的使用。
我现在失业,刚从大学毕业,四处寻找工作,并认为如果我得到一些Kaggle项目在我的简介下是好的。
然而,我对这两种语言都知之甚少。过去使用过Matlab和C/C++。但我还没有生产出产品质量代码,也没有用这两种语言开发应用程序或软件。它一直是学术用途的肮脏代码。
我曾在一个大学项目中使用过一些Python,但我不知道基本原理,比如什么是包等等(没有用标准的Python教科书等阅读语言的复杂之处)。
在C/C++中做了大量的编码(3-4年前,然后切换到Matlab/Octave)。
我想开始在Python,Numpy,scikit,学习和熊猫等,但是仅仅阅读维基百科的文章或Python教科书对我来说是不可行的。
R也是如此,只是我对R一无所知。
有人有什么建议吗?
发布于 2014-10-20 16:12:45
有一个在线数据科学“游戏”,让您学习如何使用Python加载csv,并使用scikit来机器学习算法,如支持向量机。这是一个带有演示视频的博客帖子,实际的站点是探索数据科学。就我个人而言,我认为它的天才。
发布于 2014-10-21 07:06:21
我发现视频教程/IPython笔记本格式确实帮助我进入了python生态系统。
SciPy 2013年有两期教程,内容涉及滑雪(第一教程第1部分,笔记本电脑的github回购)。
PyCon2012和PyData2012也有类似的教程提供给熊猫,但我没有代表链接到youtube上搜索pandas tutorial应该可以让你找到它们。
既然您提到了Kaggle,我想您已经看到他们已经开始使用python教程了,用于泰坦尼克号乘客数据集(我这里没有代表提供链接,但是搜索Getting Started with Python: Kaggle's Titanic Competition应该可以帮助您)。
发布于 2014-11-12 19:31:27
现在真的有这么多好的资源。如果你想远离教科书,O‘’Reilly媒体和Packt出版公司在许多伟大的主题上提供了轻松而有效的阅读。这些书在实践中应用得更多。
就学习语言而言,Coursera、Code和Code都有很好的教程。我建议看一看以下几点:
https://datascience.stackexchange.com/questions/2303
复制相似问题