干货 | 一文看懂系列之理解神经网络

【新智元导读】无数文章都在大谈人工智能之热门,人工智能将带来下一场革命,人人都为此兴奋。但对开发者来说,人工智能热意味着什么呢?意味着新的机会、新的挑战,以及学习新事物的激动人心的新旅程。这篇文章适合任何想要开始了解 ANN 以及TensorFlow之类的框架的人。

我们的大脑由数十亿个神经元组成,它们彼此相连接,是控制我们的思维和所有日常行为的重要部分。你可能会注意到神经元细胞的主要部分是细胞体,然后还有一个部分叫轴突(axon),样子有点像一根电线,但它连接着与细胞体相隔有一段距离的一组突触(synapses)。当神经元被激发时,它会将一个峰形的电脉冲沿着轴突传至它的突触,信息在这里发生传递。所以它们很像某种计算单元,非常的复杂。

所以人工神经网络很像一种卡通版本的神经元以及神经元网络,我们实际上是把它们放在一次来计算各种东西。它们的设计方式有一个好处是,它们可以被调整或改变,以在不同的条件下计算不同的东西,并且可以通过学习过程来训练。

这是人工神经网络的示意图。

我们把X1,X2 ... Xn作为神经元的输入,实际上相当于激发的强度或速率。

W1,W2 ... Wn是权重,相当于对触发的敏感性(sensitivity)。

Y是输出。

Xi·Wi的求和被称为激活(activation)。然后我们看这个值是否大于或等于触发阈值(θ),如果是,那么输出为1,如果不是,输出为0。这种网络称为感知机(Perceptron)。它们是单层的,输出是二进制的。

那么怎么用二进制输出表示空间?我们需要获得输出为0的区域和输出为1的区域。

举个例子:

令 W1 = 1/2 ; W2 = 1/2 ; θ = 3/4

当 X1 = 0 时,

X2 * 1/2 = 3/4

X2 = 3/2,即1.5

这意味着,如果X1为零,那么X2需要有一个值,以便打破3/4的阈值。

在1.5这个分割点以上的任何值,都将打破阈值并返回到1。也就是说,上图绿色点以上的任何值将返回1,绿色点以下的任何值将返回0。

类似地:

当 X2 = 0 时,

X1 * 1/2 = 3/4

X1 = 3/2,即1.5

现在,我们应该能注意到这里的关系。它是线性的。

感知机的计算机制与这个完全相同,这被称为半平面(half plane)。线上方的平面是1的答案,线下方平面是0的答案。

有趣的地方是,因为值是0和1,可以有多种可能性。可能性包括:AND、OR、NOT和XOR。

AND

得到线上面的结果的情况只有当X1和X2都为真值(True)时,这是AND的情况。

OR

当X1或X2为1时,输出为1,否则为0。

NOT

这是简单地翻转输出值的情况,当输入为1,则输出变为0,反之亦然。

XOR

XOR的情况不是线性可分的,所以不能用单感知机来表示这个函数(如在NOT中)。但是在网络中添加一个层可以表达XOR。

本文中,我们讨论了最基本的ANN类型(即感知机)及其可执行的运算。我们手动设置权重,然后计算输出,但这不是一个真正的神经网络的工作方式。它们通过训练自己计算权重,这些将在后面的文章讨论。

原文链接:https://blog.dcrucs.co/understanding-artificial-neural-networks-df9d25941793#.abm5seevy

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2016-12-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏算法channel

铁粉巨献:某独角兽公司数据挖掘工程师岗位 2000字面试总结

感谢铁粉:地球球长,奉献出自己的面试经验,面经总结的非常认真、详细、用心。这是球长同学第二次无私地奉献他的面经了,上一篇面经 ( @all: 新浪 机器学习算...

11900
来自专栏杨熹的专栏

用 TensorFlow 做个聊天机器人

上一次提到了不错的学习聊天机器人的资源,不知道小伙伴们有没有去学习呢。 自己动手做聊天机器人教程 我最近每天都会学一点,拿出解读来和大家分享一下。 本文结构...

38660
来自专栏大数据

数据挖掘干货总结(一)-NLP基础

本文共计1463字,预计阅读时长八分钟 NLP-基础和中文分词 一、本质 NLP (Natural Language Processing)自然语言处理是一门研...

31780
来自专栏机器学习与自然语言处理

中文分词研究入门

导读 本文首先简单介绍了自然语言处理和科研过程中重要的四部曲——调研、思考、编程和写作,然后对中文分词问题进行了说明,介绍了中文分词存在的难点如消歧、颗粒度问题...

41060
来自专栏AI科技大本营的专栏

AI技术讲座精选:用端到端训练模型进行语法智能纠错

现有的拼写检查系统可以识别拼写错误,但无法识别出语法错误,本文的亮点在于使用流行的 seq2seq + attention 模型,在大规模拼写检查数据集上进行训...

71790
来自专栏WOLFRAM

Wolfram 语言的新功能:增强的求导功能

23680
来自专栏AI研习社

博客 | Word2Vec 学习心得

好嘛博主食言了。不过本文没什么干货,主要是前后看了大概一个星期,反复去读源码和解读文章,终于感觉这东西不那么云山雾罩了。同时也发现网上很多材料有点扯淡,99% ...

17820
来自专栏张俊红

python数据科学-多变量数据分析

总第87篇 01|写在前面: 在前面我们研究了单列(变量)数据情况,现实中的案例大多都是多列(变量)的,即影响一件事情的因素有多个,我们除了要看单列数据以外还需...

47660
来自专栏PPV课数据科学社区

【学习】数据可视化基础学习摘要

数据可视化参考流程 科学可视化的早期可视化流水线,描述了从数据空间到可视空间的映射,包含串行处理数据的各个阶段: 原始数据->数据分析->预处理数据->过滤->...

37360
来自专栏Crossin的编程教室

一个略奇葩的计算圆周率的程序

某天早上,在去上班的地铁上,突然莫名地想起有个“投针实验”,于是就心血来潮想写个小程序试验一下。 关于具体描述,可以去搜索“布丰投针实验”。简单来说,就是: 假...

34590

扫码关注云+社区

领取腾讯云代金券