首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

不!机器学习才不只是统计学的美化!

在地图上疯狂地传播到社交媒体上的恶搞漫画赢得了很多转发,这似乎意味着机器学习的炒作已经开始消退。然而,机器学习真的只是美化统计吗?哈佛大学数据科学硕士和机器学习从业者JoeDavison认为,远不止于此。他从统计学和机器学习中分别开始,比较两者之间的差异,并希望人们能够正确理解机器学习和人工智能。该博客在海外技术网站Medium上获得了超过7.4万的认可。

此外,许多模型近似于统计函数:由逻辑组成的分类模型的softmax输出;训练图像分类器的过程被视为逻辑回归。虽然从技术角度来看这个概念是正确的,但是将整个机器学习简单地概括为统计的附属物太过笼统。统计学涉及数学领域,涉及理解和解释数据。机器学习只是一种计算算法(因此,它实际上诞生于计算机科学)。

在这里,我想说的是,在我学习机器学习期间,我有幸参加了深度学习技术的精彩课程,作为我本科计算机科学课程的一部分。我们指定的项目之一是在TensorFlow中执行和训练WassersteinGAN。那时,我只参加了一门关于统计学介绍的选修课程,而且我忘记了大部分内容。这一次,我的统计技能不是很强。

还应该承认,许多机器学习算法需要比大多数神经网络技术更强的统计和概率背景,但是这些方法通常被称为统计机器学习或统计学习以减少统计学。颜色,区别于常规统计。同时,近年来大多数用于机器学习的创新技术都属于神经网络领域,因此可以说机器学习不是统计学的。当然,机器学习并不孤单。

机器学习是一类计算算法,它采用迭代“学习”的方法向某个函数逼近。华盛顿大学计算机科学教授PedroDomingos提出了构成机器学习算法的三个组成部分:映射、评估和优化。在训练图像分类器时,除了需要注意定义合适的损失函数之外,映射函数输出值是逻辑值并不会有太大的影响。逻辑回归等这些统计术语为我们讨论模型空间提供了有用的词汇,但是它们并没有将优化问题重新定义为数据理解问题。

深度神经网络进一步忽略了统计学的概念,这是最好的。完全连接的节点由权重和偏差组成,看起来很好,但卷积层的原理是什么?调整激活功能?块的标准化?剩余层?随机忽略?记忆和注意机制?这些创新对于高性能深度学习网络至关重要,但它们远远不能与传统的统计技术相媲美(因为它们可能根本不是统计技术)。我还想指出,深度学习网络和传统统计模型之间的一个区别是它们的大小。深度神经网络的规模是巨大的。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180901A1CL9B00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券