深度学习探秘之一:初识机器学习

事先声明,本文并不权威、甚至可能专业性都不够。因为我从去年开始接触深度学习,半路出家,只能跟没有接触过又想了解的朋友们一起探讨一下,如何开启这道神秘之门。从本文开始,将从我理解的角度从基础到实践,为大家写一个系列的文章。反正坑在这里了,慢慢填。

首先,我们来看看什么是深度学习。以前我们经常听说机器学习,深度学习是机器学习中的一种,是使用了深度神经网络的机器学习。好了,又挖了一个机器学习的坑。什么是机器学习?我们先从人类的知识学习过程讲起。

像上图描述的一样,人类通过对已经有的经验进行归纳总结出一套规律,当碰到新的问题时,可以通过先前总结的规律进行判断,从而得出一个新的结论。我们中文还发明了两个成语来描述这个事情,所谓举一反三、触类旁通。

几千年来,通过这样的学习方式,人类已经掌握了很多理论知识,同时也发明了很多工具来帮助人类,甚至创造了比人类计算速度快成千上万倍的计算机。有些伟大的科学家就想,能不能让计算机来替代人类思考和总结问题呢?其中之一就是图灵,他开始了人工智能的一系列理论研究,还提出了著名的图灵测试。可惜啊,被誉为计算机科学之父和人工智能之父的图灵英年早逝,甚至没有看到第一台电子计算机的诞生。我常常在想,如果图灵不去,我们或许已经在未来。

好了,言归正传,现在我们所知道的机器学习,正是借鉴了人类的学习过程,通过对历史数据的学习,训练出一个模型。当有新的数据出现的时候,模型可以将新数据作为输入通过一系列计算预测出一个输出。

我们现在这样讲其实有点跳跃,不太好理解,我们来尝试举个例子。机器学习里面有常见的几类问题,比如回归和分类。回归对于没有数学基础的朋友很难形象描述,我们讲个分类问题:比如区分男人和女人。假设我们不知道如何区分一个男人和女人,其实也不用假设,现在互联网上你很难知道你面对的一个人是男人还是女人。我们只知道这个人的网名、行为记录(比如聊天记录、消费记录、观影记录)等。幸运的是,我们有一些好朋友,我们清楚的知道他们的性别,那么这些好朋友就将成为我们的研究对象,我们总他们身上总结出一些规律,以此来判断其他网友的性别。

那有朋友要问了,我们人会思考,计算机怎么去想呢?机器不想,机器是计算,计算一个网友是男性还是女性的概率是多少。人类科学家基于统计分析已经建立了很多种模型,机器学习要干的事情就是选一种模型,把已知的各种数据输入,得到男人女人的概率,和我们已知的结果比较一下,然后再调整里面的参数,最终得到一个预测模型。在这个预测模型里面,你输入一个未知性别的一组数据,就得到这位网友是男女的概率是多少。

当然这个训练的过程说起来是简单,但是里面有很多问题。首先一个就是数据应该选哪些?因为我们的计算机计算能力毕竟有限,不可能把所有的数据都放进去计算。并且有些数据经过分析知道与结果没有帮助的,就没必要放进去了。所以要经过一些分析,把对结果影响比较大的一些数据作为特征提取出来参与训练。这一过程叫做特征工程。

其次,模型的选取与问题是否匹配,参数如何调整等等,还有过拟合欠拟合等等,所以机器学习其实不太好弄的。

好了,这个坑已经挖的差不多了,深度学习还没有出来。太棒了,我们下篇文章再讲。如果你还感兴趣的话,请关注公众号。哈哈!

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180624G0VJ1500?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券