适合初学者学习的神经网络:流行类型和应用

目前,神经网络被用于解决许多商业问题,如销售预测、客户研究、数据验证和风险管理。更进一步讲,我们能够使用神经网络进行时间序列预测、数据中的异常检测和自然语言理解。

在这篇文章中,我们将对初学者解释神经网络是什么,神经网络的流行类型,以及他们的应用。我们还将介绍如何在不同的行业和部门中应用神经网络。

神经网络是如何工作的?

最近,在计算机科学领域,“神经网络”这个词引起了广泛的关注,引起了许多人的注意。但这到底是什么,它们是如何起作用的,而且它们真的是有益的吗?

从本质上说,神经网络是由一层叫做神经元的计算单元组成的,在不同的层之间有连接。这些网络转换数据,直到它们可以将其归类为输出。每一个神经元都通过一些权重来增加一个初始值,并将总数结果与其他的值传入同一个神经元,根据神经元的偏差调整产生的数量,然后用激活函数使输出恢复正常。

迭代学习过程

神经网络的一个关键特征是一个记录每次提供给网络的(行“hang”)的迭代学习过程,并且每次都调整与输入值相关的权重。在所有的情况出现之后,这个过程常常被重复。在这个学习阶段,网络通过调整权重来预测输入样本的正确的类标签。

神经网络的优势包括它们对噪声数据的高耐受性,以及它们对未经过训练的模式进行分类的能力。最受欢迎的神经网络算法是反向传播算法(backpropagation algorithm)。

一旦为某个特定的应用程序构建了一个网络,那么这个网络就准备好接受训练了。为了启动这个过程,初始权重(在下一节中描述)是随机选择的。然后训练(学习)就可以开始了。

网络使用隐藏层中的权重和函数在“训练集”中处理记录,然后将结果输出与所期望的输出进行比较。然后,错误会通过系统传播,导致系统将应用程序的权重调整到下一个记录中。当权重被调整时,这个过程会重复发生。在网络的训练过程中,当连接权重不断被细化(refine)时,相同的数据集会被多次处理。

那么它包含什么困难呢?

对于初学者来说,学习神经网络的一个挑战就是了解每一层的具体情况。我们知道,在训练之后,每一层都提取数据集(输入)的更高级的特性,直到最后一层对输入特性所涉及的内容来作出决定。那么该怎样做呢?

我们可以让网络做出这个决定,而不是确切地规定我们希望网络来放大特征。假设我们只是给网络一个任意的图像或照片,让网络来分析图片。然后我们选择一个层,让网络加强它检测到的任何东西。网络的每一层都处理不同抽象级别的特征,因此我们所生成的特征的复杂性取决于我们选择哪一层来加强。

受欢迎的神经网络及其用法

在这篇针对初学者学习神经网络的文章中,我们将研究自动编码器(autoencoder),卷积神经网络(convolutional neural network),以及递归神经网络(recurrent neural network)。

自动编码器 这种方法是基于这样的观察:随机初始化是一个坏的想法,并且预先训练每一层使用无监督学习算法可以获得更好的初始权重。这种无监督算法的例子是深度信念网络(Deep Belief Network)。最近有几项研究试图复活这一领域,例如,为基于概率的自动编码器使用变分的方法。

它们很少在实际应用中使用。最近,批量标准化开始允许更深层的网络,我们可以利用残差学习来从头开始任意训练深度网络。在适当的维度和稀疏约束的条件下,自动编码器可以学习比PCA或其它基本技术更有趣的数据投影。

让我们来看看自动编码器的两个有趣的实际应用:

  • 在数据降噪中,利用卷积层来表示一个降噪的自动编码器,有效地用于降噪医学图像。

一个崩溃过程随机地将一些输入设置为零,迫使降噪的自动编码器为随机选择的丢失模式的子集预测丢失的(损坏的)值。

  • 数据可视化试图利用主成分分析(PCA)和t-SNE算法等方法来进行降维。它们与神经网络训练相结合,提高了模型预测的准确性。同时,MLP神经网络预测的准确性在很大程度上依赖于神经网络的结构、数据的预处理以及网络开发的问题类型。

卷积神经网络 卷积的主要目的是为了从输入图像中提取特征。卷积通过使用小的输入数据来学习图像特征,从而保持了像素之间的空间关系。在以下域,卷积神经网络已经取得了成功:

  • 面部识别

在面部识别的工作中,他们使用了卷积神经网络级联(cascade)来快速地进行人脸检测。该检测器以低分辨率对输入图像进行评估,以快速拒绝非人脸区域,并仔细处理具有较高分辨率的区域,以便进行准确的检测。

在级联中也引入了Calibration net,以加速检测和改善包围盒(bounding box)的质量。

  • 自动驾驶汽车

在自动驾驶汽车项目中,深度图估计(depth estimation)是自动驾驶的一个重要考虑因素,因为它能对乘客和其他车辆的安全做出保障。卷积神经网络使用的这些方面已经被应用于英伟达的自动驾驶汽车项目中。

卷积神经网络的层通用性极强,因为它们可以通过多个参数处理输入。这些网络的子类型(subtype)还包括深度信念网络。卷积神经网络传统上用于图像分析和对象识别。

递归神经网络 递归神经网络可以通过对实际数据序列的处理来进行序列生成,并预测接下来会发生什么。

假设这些预测是有概率的,那么通过从网络的输出分布中重复地采样,就可以从一个经过训练的网络中生成新的序列,然后在接下来的步骤中输入样本作为输入。

  • 语言驱动的图像生成

我们能学会将指定的文本变成手写的吗?为了完成这一挑战,窗口与文本字符串进行了卷积,并将其作为预测网络的额外输入。窗口的参数是由网络在进行预测时同时输出的,因此它动态地确定文本和笔的位置之间的对齐。简单地说,它学会了决定接下来要写哪个字符。

  • 预测

在给定一个特定的输入的情况下,一个神经网络可以被训练来产生预期的输出。如果我们的网络能够很好地模拟已知的值的序列,那么就可以使用它来预测未来的结果。一个很明显的例子就是股市预测。

将神经网络应用于不同的行业

神经网络广泛用于当前社会的业务问题上,如销售预测、客户研究、数据验证和风险管理。

市场营销 目标市场营销涉及到市场细分,我们将市场划分为不同的消费者群体。

神经网络可以根据用户的基本特征,包括人口、经济状况、地点、购买模式和对产品的态度来进行细分。无监督的神经网络可以根据其特征的相似性自动对客户进行分组和分类,而受监督的神经网络可以根据一组客户的需求来学习不同的客户段之间的边界。

零售&销售 神经网络有能力同时考虑多种因素,比如产品的市场需求、客户的收入、人口和产品价格。超市销售的预测在这里有很大的优势。

如果两种产品之间存在一段时间的关系,比如在购买打印机的3-4个月之内,客户会打算买一个新的墨盒,那么零售商就可以使用这些信息联系客户,从而降低客户从竞争对手那里购买产品的可能性。

银行与金融 神经网络已成功应用于衍生证券定价和对冲、期货价格预测、汇率预测和股票表现等问题。传统上来说,统计技术推动了软件的开发。然而,神经网络是推动决策的根本技术。

医学 神经网络在医学领域是一项趋势研究,并且在未来的几年里,它们将会广泛应用于生物医学系统。目前,这项研究主要集中在人体的建模部分,并从各种扫描中识别疾病。

总而言之,神经网络使计算机系统变得更有用,使它们更人性化。

原文发布于微信公众号 - ATYUN订阅号(atyun_com)

原文发表时间:2018-01-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

深度强化学习首次在无监督视频摘要生成问题中的应用:实现state-of-the-art效果

【导读】近日,针对视频摘要自动生成中大多数方法均为多阶段建模的问题,来自中国科学院、伦敦大学玛丽皇后学院的学者发表论文提出基于深度强化学习的无监督视频摘要方法。...

6755
来自专栏新智元

以色列神秘AI研究力量:深度学习的四大失败

【新智元导读】深度学习力量强大,但无论是理论研究者还是实际从业者,了解深度学习的局限也是十分重要的。耶路撒冷希伯来大学的一组研究人员,其中有两位任职于 Mobi...

4398
来自专栏AI传送门

股票预测,自动翻译,你想要的它都能做——RNN算法探索之旅(2)

1534
来自专栏大数据和云计算技术

理解深度学习

image.png 1、现状: 深度学习现在非常热,各种会议都要和这个沾点边。百度大脑,谷歌大脑计划搞的都是这个。在一些领域取得了非常不错的效果,如图片识别,...

35910
来自专栏AI科技评论

干货 | 阿里巴巴Poster论文:处理多种退化类型的卷积超分辨率

阿里巴巴提出的卷积超分辨率网络可以快速、有效的处理多种图像退化类型,为 SISR 实际应用提供了一种高效、可扩展的解决方案。

1293
来自专栏机器之心

业界 | Petuum提出对偶运动生成对抗网络:可合成逼真的视频未来帧和流

2916
来自专栏云时之间

极大似然公式证明

通过经验风险最小化推导极大似然估计,证明模型是条件概率分布,当损失函数是对数损失函数时,经验风险最小化等价于极大似然估计 ? 字有点丑,多多担待啦(∩ơ ㅅ ơ...

36410
来自专栏机器之心

深度 | 学习如何学习的算法:简述元学习研究方向现状

选自TowardsDataScience 作者:Cody Marie Wild 机器之心编译 参与:李诗萌、李泽南 要想实现足够聪明的人工智能,算法必须学会如何...

3745
来自专栏CVer

[计算机视觉论文速递] 2018-06-29 人脸专场

这篇文章有4篇论文速递,都是人脸方向,包括人脸识别、人脸表情识别、人脸情绪分类和人脸属性预测。其中一篇是CVPR 2018 workshop。

3194
来自专栏数据派THU

谷歌与CMU联合发文:审视数据对深度学习的重要性(附论文)

来源:机器人圈 作者:Chen Sun、Abhinav Shrivastava、Saurabh Singh、Abhinav Gupta 本文长度为1800字,建...

21610

扫码关注云+社区

领取腾讯云代金券