正文共:3071 字 7 图
预计阅读时间: 8 分钟
大家都知道人工智能,什么是人工智能?通俗来讲,就是让机器能像人一样思考。
(小白都知道这个好吧,还需要你来解释?)
(呃~)
那为什么要像人一样思考呢?
(因为愚蠢的人类觉得自己是已知的智力水平最高的。如果狗的智能最高,那么就叫狗工智能了)
这也是生物仿生学上研究的问题,人脑大约包含10的12 次方(1加12个0)个神经元,分成约1000 种类型,每个生物神经元大约与102至104个其它生物神经元相连接,形成极为错综复杂而又灵活多变的生物神经网络。每个生物神经元虽然其结构都十分简单,但是如此大量的生物神经元之间、如此复杂的连接却可以演化出丰富多彩的行为方式。同时,如此大量的生物神经元与外部感受器之间的多种多样的连接方式也蕴含了变化莫测的反应方式。
人体神经系统各部分的功能概括如下:
(这个图只是告诉大家,神经系统也是分布式的,典型的区块链原理)
如果要机器向人一样思考,那么机器就要达成这样的程度。目前来看是不现实的,所以我们将复杂的系统进行拆分最小颗粒度——神经元。
(神经元)
通常是由一个神经细胞都有树突、轴突、细胞核等等。树突可以接受其他神经元传来的信号,然后对这些信号进行一下处理传递给下一个神经元。
树突(Dendrite)之所以枝繁叶茂,是因为每个神经元都要与大量的同类进行交流。神经系统中没有微信朋友圈的功能,只能通过这种方式来发展“神”际关系。
轴突(Axon)因为要负责神经元内部的信号传递,就像古代斥候通风报信一样,信号传递的战线必须拉的很长;为了节省材料和空间,战线又必须很细。又细又长的战线就很容易被敌军切断,必须得有保护措施,而香肠状的髓鞘(Myelin sheath) 则正是起到了保护战线的作用。
(表骗我,我吃火锅脑花的时候,没有发现长长轴突,也没用香肠~)
其实你看到的是神经胶质细胞(Ganglia)。神经胶质细胞则是构成神经系统的另一种“根”,其数量甚至比神经元更为庞大。 实际上它是胶质的(果冻知道吧,就类似那个,或者你可以把它想象成豆花)。
神经胶质细胞主要是支撑大脑结构、为神经元输送营养、清理受伤神经元和隔离不同神经元,胶质细胞还把不同轴突粘在了一块。
所以你吃到就是煮熟后像豆腐一样的神经胶质细胞。正是胶质细胞给予了脑花以豆腐般的柔嫩口感,否则脑花一旦下锅,全散做莲藕丝了。
神经脉冲
说远了,我们再来说说,传输的问题,神经元之间到底是怎样进行交流的呢?
(人工智能怎么实现信息的交流与传输的呢)
中学生物告诉我们,神经信号分为『电信号 』和『化学信号,两者各有所长。
电信号就像是家教,特点是快狠准,因材施教所以效率很高,例如肌肉的收缩就是有电信号主导;
化学信号则更像大班授课,影响范围广,作用力持久,但是每个“听众”理解力不同,而且需要花时间课后消化,所以化学信号准确度不及电信号,且反应时间较长。
正是两种信号的相辅相成,编码了我们的一颦一笑,喜怒哀乐。
电信号又称为神经脉冲,电线如果又长又细,电阻就会很大。如果像电线那样传递脉冲,怕是一个脉冲还没跋涉完成,轴突就因电阻过大而被脉冲的热情 (产生的电热) 给烧毁了。很显然,神经元需要想办法让脉冲“冷静”地走完全程。
(电脑CPU)
和电脑不同,神经脉冲不会产生多余的热量,牛x吧。
(那人体热不是热量么?)
(这位同学,人体发热是另外一回事,人体CPU超了只会饿)
神经元是怎样解决这一难题的呢?答案只有一句话:依靠神经元内外电势差 。形成神经脉冲进行信息的交流与传输。
(这图至上到下看)
神经元的功能:种经元受到刺激后能产生兴奋,并且能把兴奋传导到其他神经元。转化成计算机语言就是输入信息,树突感知到信息。
1、键入信息(上图的加减号)
2、神经脉冲的产生,靠的是细胞膜内外(钾和钠)离子的交替性出入。
内部:钾(黄色);
外部:钠(蓝色)。
3、钾离子和钠离子的内外不均,给予了神经元细胞膜一个-70毫伏的电势差 。当受到刺激后,神经元细胞膜的内外电势差发生了变化,从而一个脉冲开始了全新的征途。
(所以医学上很多的检查原理都是基于此)
计算神经科学
说到这个就不得不提著名的HH模型,用以描述神经脉冲的产生和传导,并因此获得了1963年的诺贝尔医学或生理学奖。由此,计算神经科学 (Computational Neuroscience) 这个新兴学科走上历史舞台,神经科学正式进入量化分析的时代。
一个数学模型也能获得诺贝尔生理学奖?听起来有些不可思议。事实上HH模型的伟大之处,正是在于把一个同物理学 (电势差变化和脉冲的产生) 、化学 (离子通道的闭合) 和生物学都有关的复杂生命现象,精确而简练地用一个数学方程组概括了起来:
(看不懂没关系,你只要知道这个公式很牛x就对了)
这个方程组囊括了脉冲产生的全过程。你现在的一举一动,都掌握在这个方程中。
(好怕怕,但是完全没有感觉到啊~)
(你不能我思故我在,不是你没感觉到,它就不厉害了)
红色曲线表示神经元受到刺激,蓝色曲线表示正常状态。电流单位是毫安。红色曲线是不是和我们平常看到的神经脉冲很相似?如果我们再加上一个更加复杂的周期性刺激,那么就能观察到更符合实际的脑电图了:
之所以HH模型能获得诺贝尔奖,还在于这个模型 对离子通道闭合过程对精确刻画 。著名的 动电位理论 (Action Potential Theory) 正是通过HH模型描述出来的。 从数学角度看来,HH模型只是千千万万非线性方程的一种,它产生的解是周期解 (神经脉冲具有周期性)。
智能来源于单一的算法(One Learning Algorithm),我们用流程来抽象这个过程:
通过一个数学模型来描述一下神经元:
+1代表偏移值(偏置项, Bias Units);来避免输出为零的情况,并且能够加速某些操作,这让解决某个问题所需要的神经元数量也有所减少。
X1,X2,X2代表初始特征;
w0,w1,w2,wi3代表权重(Weight),即参数,是特征的缩放倍数。特征经过缩放和偏移后全部累加起来,此后还要经过一次激活运算然后再输出。激活函数有很多种,后面将会详细说明。
这个数学模型有什么意义呢?我将每个元素进行简化处理:
这时我们把激活函数改为Purelin(45度直线),Purelin就是y=x,代表保持原来的值不变。这样输出值就成了 Y直线点 = b + X直线点*k,即y=kx+b。看到了吧,只是换了个马甲而已。
下一步,对于每个点都进行这种运算,利用Y直线点和Y样本点计算误差,把误差累加起来,不断地更新b、k的值,由此不断地移动和旋转直线,直到误差变得很小时停住(收敛)。这个过程完全就是前面讲过的梯度下降的线性回归。
一般直线拟合的精确度要比曲线差很多,那么使用神经网络我们将如何使用曲线拟合?答案是使用非线性的激活函数即可,最常见的激活函数是Sigmoid(S形曲线),还有一种S形曲线也很常见到,双曲正切函数(tanh)。
Sigmoid:逻辑回归(Logistic Regression),简称logsig。
双曲正切函数(tanh):或称tansig,可以替代logsig。
下面是它们的函数图形,从图中可以看出logsig的数值范围是0~1,而tansig的数值范围是-1~1。
e是什么?公式中的e叫自然常数,也叫欧拉数,e=2.71828…。e是个很神秘的数字,它是“自然律”的精髓,其中暗藏着自然增长的奥秘,它的图形表达是旋涡形的螺线。
e是怎么来的?e = 1 + 1/1! + 1/2! + 1/3! + 1/4! + 1/5! + 1/6! + 1/7! + … = 1 + 1 + 1/2 + 1/6 + 1/24 + 1/120+ … ≈ 2.71828 (!代表阶乘,3!=1*2*3=6)
(从前有个财主,他特别贪财,喜欢放债。放出去的债年利率为100%,也就是说借1块钱,一年后要还给他2块钱。有一天,他想了个坏主意,要一年算两次利息,上半年50%,下半年50%,这样上半年就有1块5了,下半年按1块5的50%来算,就有1.5/2=0.75元,加起来一年是:上半年1.5+下半年0.75=2.25元。用公式描述,就是(1+50%)(1+50%)=(1+1/2)^2=2.25元。可是他又想,如果按季度算,一年算4次,那岂不是更赚?那就是(1+1/4)^4=2.44141,果然更多了。他很高兴,于是又想,那干脆每天都算吧,这样一年下来就是(1+1/365)^365=2.71457。然后他还想每秒都算,结果他的管家把他拉住了,说要再算下去别人都会疯掉了。不过财主还是不死心,算了很多年终于算出来了,当x趋于无限大的时候,e=(1+1/x)^x≈ 2.71828,结果他成了数学家。)
好了,前面花了不少篇幅来介绍激活函数中那个暗藏玄机的e,下面可以正式介绍神经元的网络形式了:
神经网络及其连接方式因为新的架构正被源源不断地发明出来。以上只是一种代表而已。事实上,不论是那种网络,他们在实际应用中常常都混合着使用,比如CNN和在上层输出之前往往会接上全连接层,很难说某个网络到底属于哪个类别。不难想象随着深度学习热度的延续,更灵活的组合方式、更多的网络结构将被发展出来,后面详细说明。
拓展
前面我们只解释了神经脉冲,神经科学有无穷无尽的难题需要解决,比如:
大脑就算要处理最简单的任务,也要靠大量神经元协同完成。不同神经元之间是如何交流的?
神经元的“朋友圈”是如何建立起来的?怎么发展不同神经元间的“神脉”关系?
电信号和化学信号之间是如何相互影响的?
针灸为什么可以止痛?
意识是什么?
生物神经元特性
从生物控制论的观点来看,神经元作为控制和信息处理的基本单元,具有下列一些重要的功能与特性:
时空整合功能:生物神经元对于不同时间通过同一突触传入的神经冲动,具有时间整合功能;对于同一时间通过不同突触传人的神经冲动,具有空间整合功能。两种功能相互结合,具有时空整合的输入信息处理功能,所谓整合是指抑制和兴奋的受体电位或突触电位的代数和。
兴奋与抑制状态:生物神经元具有两种常规工作状态:兴奋--当传人冲动的时空整合结果,使细胞膜电位升高,超过被称为动作电位的阈值时,细胞进人兴奋状态,产生神经冲动,由轴突输出;抑制当传人冲动的时空整合结果,使膜电位下降至低于动作电位的阈值时,细胞进人抑制状态,无神经冲动输出,满足“0-1”律,即“兴奋、抑制”状态。
脉冲与电位转换:突触界面具有脉冲/电位信号转换功能。沿神经纤维传递的电脉冲为等幅、恒宽、编码的离散脉冲信号,而细胞膜电位变化为连续的电位信号。在突触接口处进行“数/模”转换,是通过神经介质以量子化学方式实现(电脉冲-神经化物质-膜电位)的变换过程。
神经纤维传导速度:神经冲动沿神经传导的速度在 1~150 m/s 之间。
突触延时和不应期:突触对神经冲动的传递具有延时和不应期。在相邻的两次冲动之间需要一个时间间隔,即为不应期,在此期间对激励不响应,不能传递神经冲动。
学习、遗忘和疲劳:由于结构可塑性,突触的传递作用可增强、减弱和饱和,所以细胞具有相应的学习功能,遗忘或疲劳效应(饱和效应)。
随着脑科学和生物控制论研究的进展,人们对神经元的结构和功能有了进一步的了解,神经元并不是一个简单的双稳态逻辑元件,而是超级的微型生物信息处理机或控制机单元。每个问题都非常复杂,不是光靠生物学这一个学科孤军奋战就能解决的。这些难题的解决,必然需要综合其他学科的思想, 去粗取精取长补短 。同理,人工智能也有很多地方需要研究。
我思故我在
end
领取专属 10元无门槛券
私享最新 技术干货