首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

给神经网络加一个按钮,AI将适用于所有人

为什么要降维

首先,我们需要介绍几个神经网络理想的数据状态与训练状态:

样本特征的每个维度满足独立同分布

训练集与测试集满足独立同分布

神经网络每层输出满足独立同分布

理想很丰满,现实很骨感。在一般情况下,这三个条件很难满足。我们先说说第一种情况,比如我们需要训练一个二分类神经网络来预测植物是否能在某些房间里生长良好,下面表格展示了训练的部分数据集,数据集中每个维度的取值范围在[-1,1]:

数据集里的每个维度独立么?答案当然是否定的,一眼就能看出,温度与阳光成正相关(线性相关),湿度相对独立,而房间大小这个属性用处不大。这样会带来什么后果,很简单,学习到了很多非相关和噪音特征从而导致过拟合。因为神经网络不像人脑可以立刻识别出哪些是有用的,哪些是无用的。从本质上来说,神经网络是以平等的方式来对待样本的不同维度。过多无用的维度和线性相关的维度可能会使得神经网络产生混乱,并纠结其中,从而导致整个结果不可控。为什么? 阅读过之前文章的同学,应该都了解了神经网络学习数据特征的本质 -- 权重调整。而权重调整的过程中,很有可能将线性相关的维度调整成为线性不相关,或者增大无关数据(噪音)的权重,导致网络学习了错误的特征。怎么解决这个问题?很简单,对原始数据进行降维,选择对结果相对重要的维度,将多维数据映射到低维空间里,并使得维度之间保持独立。为了形象地展示降维的作用,我们对上表进行简单的降维处理。

爆发式的数据让科学家不得不求助AI。在人类输入最少的情况下,AI系统(比如人工神经网络,模仿大脑功能的计算机模拟神经元网络)可以挖掘海量数据、突出异常现象,并检测出人力永远无法发现的东西。

计算机应用于科学研究已经有75年历史,人类对自然数据的观察研究更是伴随着人类的发展史。但是,随着机器学习和AI的发展,科学研究的方法已经发生彻底的革新。其中一种方法称为生成模型(Generative Modeling),对于观测数据的不同解释,它可以仅仅基于数据就辨别出最可信的理论。更重要的是,它不需要关于物理过程的预编程知识。生成模型的支持者认为它非常新颖,可以被视作研究宇宙的“第三类方式”。

传统上,人类通过观察来了解自然。想想十六世纪天文学家约翰尼斯·开普勒正在仔细研究另一位同时期天文学家第谷·布拉赫的行星位置图,开普勒最终推断出行星在椭圆轨道上运动。科学通过模拟而进步。天文学家模拟银河系及其邻近星系仙女座的运动,并预测它们将在几十亿年后发生碰撞。观察和模拟都有助于科学家产生假说,再通过进一步的观察来验证这些假说。但是,生成模型既不是观察也不是模拟。

从神经网络到天体物理,还有什么是AI做不到的?

天体物理学家Kevin Schawinski(供职于苏黎世联邦理工学院)是生成模型的积极倡导者,他说:“这是介于观察和模拟之间的第三类方法,是解决问题的另一种方式。”

虽然一些科学家仍然把生成模型和其它新技术简单地看作是传统科学的补充工具。但大多数人都同意AI正在产生巨大的影响,它在科学研究中的作用必然会越来越大。费米实验室的天体物理学家Brian Nord使用人工神经网络研究宇宙,他担心人类科学家所做的任何事情都可能实现计算机自动化——这有点让人不寒而栗。

生成模型带来的发现

研究生时代,Schawinski就因数据驱动领域的成就而闻名。攻读博士期间,他需要根据星系的外观对它们进行分类。由于没有现成的软件可用,所以Galaxy Zoo众包科学项目诞生了。从2007年开始,普通计算机用户通过猜测记录星系分类来帮助天文学家,服从多数原则一般可以得出正确的分类结果。这个项目无疑是成功的,只不过今时今日的AI技术使它显得过时了。现在,一个有机器学习和云计算背景的优秀科学家可以在一个下午就完成以上任务。

Schawinski在2016年转向强大的生成模型工具。本质上,在给定条件X的情况下,生成模型会询问观察到结果Y的可能性有多大。这种方法已被证明是非常有效且具有通用性。举个例子,假设你提供一组人脸图像给生成模型,并逐一标注年龄。当计算机程序梳理这些训练数据时,会把年长者面部和皱纹增加联系起来。最终,计算机可以根据面部判断年龄,也就是说,它可以通过给定的面部预测其经历的物理变化。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190627A0AD2I00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券