Medium网友分享了一篇帖子 介绍了他的深度学习心路历程

AiTechYun

编辑:Yining

Medium网友Favio Vázquez分享了他是如何学习深度学习并利用它来解决数据科学问题的。这是一个非正式的帖子,但内容很有趣。以下是他分享的内容。

关于我和深度学习的一点介绍

我的专业是物理和计算机工程。我在委内瑞拉学习过,后来在墨西哥做过物理学硕士。但我认为自己是一个数据科学家。因此,尽管我在数学、微积分和统计学方面有很好的背景,但从头开始学习机器学习和深度学习对我来说并不容易。这些主题并不新鲜,但是我们研究它们的方式,我们如何构建使用它们的软件和解决方案,以及我们与它们进行编程或交互的方式已经发生了巨大的改变。

我从哪里开始着手?

在我学习计算机工程的时候,有一个关于“人工智能(Artificial Intelligence)”的课程。对于这个课程,我时常会产生一些困惑。因此,我研究了专家系统(expert system),神经网络(neural net),遗传算法(genetic algorithm),并阅读了一些论文,我发现其中两篇非常有趣:

阿兰·图灵的《计算机器与智能》(Computing Machinery and Intelligence)

玛格丽特·博登的《创造力和人工智能》(Creativity and artificial intelligence)

当我阅读这些论文之前(我不知道机器学习的进展,或者它甚至存在),我认为我们离实现真正的人工智能还有很远的距离。所以,那时的我(22岁)对人工智能失去希望,于是我开始研究量子计算,对我来说,这是在人工智能之前发生的事情。然而,看看下图,事实证明我错了:

我对人工智能的兴趣

在2014年(24岁),我刚刚从物理系毕业,在做我的关于黑洞模拟工程的论文时,我意外地发现了Coursera、机器学习、吴恩达和Apache Spark。这对我来说无疑是个巨大的惊喜。

我对严谨的在线学习感到惊讶,我以前没有尝试过这样的课程(我仍然不知道为什么),于是我开始学习所有的课程,从基因组学到天文学,从Scala到Python,从机器学习到Søren Kierkegaard的哲学理论。

我没有学习捷径,也没有导师,所以我只是在探索这个世界,试着找出我想要做些什么。与此同时(2014年底),我在机器学习和Apache Spark项目中发现了吴恩达的课程,并在两周内完成了这门课程,我简直不敢相信这一领域有多么惊人。然后我开始编写我在Scala和Apache Spark中所学到的知识,因此我了解了分布式计算、Hadoop、HDFS以及所有这些伟大的东西。

我的一些早期(不是很好的)机器学习和spark的项目,你可以在我的GitHub上找到它们。

GitHub地址:https://github.com/FavioVazquez

我的第一个数据科学工作

我在2014年获得了第一份数据科学工作,我是公司里唯一的数据科学家,试图弄明白我们可以用数据做什么。在工作中我发现,事情不像在课上学到的那样简单!我不再在R中导入Iris数据集,我处理的是奇怪的数据,并且我不知道数据在现实生活中是“肮脏的”。但我一直都在学习。有趣的是,我当时并不确定数据科学是什么。我主要在Scala和Python中构建了一些简单的模型。

然后过了一段时间,我意识到我喜欢开源(Open Source)。我开始在一些简单的项目中进行合作,其中一些项目是我自己的,然后还有一些是Apache Spark这样的大型项目。有简单的项目,也有高级的项目,我觉得我是在为社会做贡献。

宇宙冒险

Roger Penrose的共形循环宇宙学理论

数据科学是继我对物理学和宇宙学之后的第二次热情,所以我来到墨西哥做物理学硕士。这是一次令人惊奇的经历,但仍有一些缺失。我需要代码!我爱上了编程!

我选修了基础物理课程,如经典力学,量子力学,但也有数值方法,高性能计算,以及贝叶斯推理和机器学习。在我的论文中,我用Python编写了很多代码,所以我很高兴。

成为一名数据科学家

当我完成我的硕士学位(2017年)的时候,我决定我想做的是帮助大家成为一名数据科学家。是的,我花了一段时间。

如果你想知道我是如何在这个领域找到一份令人惊叹的工作的,那就看看我在几周前做的一篇博客文章:如何找到一份数据科学家的工作?

文章地址:https://towardsdatascience.com/how-to-get-a-job-as-a-data-scientist-f417078fe13e

我也开始在我的LinkedIn上分享我的经历、想法和知识,这是非常重要的事情。我认识了很棒的人,这对我有很大帮助,现在我也在帮助别人。

LinkedIn地址:https://www.linkedin.com/in/faviovazquez/

每天我学习,代码,在开源项目中做贡献,并且帮助人们,所以我对我正在做的事情很满意。

深度学习呢?

等等,看到现在,你可能想问,这难道不是一个关于深度学习的帖子吗?

是的,但是我需要告诉你为什么现在的深度学习对我来说很重要。

作为一名数据科学家,你需要更新理论、技术和框架;因此,去年我们看到了深度学习的爆炸式增长,就在我对机器学习开始适应的时候,这是一个全新的学习方式。

但是,你知道我从哪里开始的吗?

是的!正是吴恩达的deeplearning.ai的学习课程。

deeplearning.ai学习地址:https://www.deeplearning.ai/

我真的对他感到惊讶。当我才开始接触这个领域时,他已经在教授这个领域的课程了。是的,我还在做这些课程。但我并没有就此止步。我也需要更多的实用信息。

于是我开始学习TensorFlow,然后是Keras。Keras是一个高级的神经网络API,用Python编写,能够在TensorFlow、CNTK或Theano上面运行。这是由François Chollet开发的,专注于快速的实验。能够从想法到结果,再到最少的延迟,是进行良好研究的关键。

有很好的学习实践深度学习的资源,比如GitHub的repos和一些相关书籍。现在我正在阅读《Deep Learning with Python》这本书,它对我的学习真的很有帮助:

注:这本书有中文版,AiTechYun截取了一些豆瓣网友对此书的评价。

深度学习的未来

预测是一种艺术,它告诉我们将要发生什么,然后解释它为什么没有发生。

我不知道如何预测未来。但我能说的是,我看到的是什么,就会发生什么。

我去年看到的深度学习的最好的东西之一就是Deep Cognition。这是创建和部署人工智能的一个解决方案。简单的拖放界面可以帮助你轻松地设计深度学习模型。Deep Learning Studio可以自动为你的自定义数据集设计一个深度学习模型,这要归功于他们的高级的AutoML功能。

Deep Cognition:http://deepcognition.ai/

我认为图形用户界面(GUI)和AutoML可以是深度学习的未来。不要误解我的意思,我喜欢编码,你也可以在那里编码。但我认为,我们明年编写的代码数量将会衰减。我们不可能花那么多的时间在全世界范围内编程相同的东西,所以我认为GUI和AutoML将帮助数据科学家提高效率和解决更多的问题。

  • 发表于:
  • 原文链接:http://kuaibao.qq.com/s/20180130B0PQLV00?refer=cp_1026

扫码关注云+社区