版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/github_39655029/article/details/99728482
机器学习的一个分支,指一类问题及解决这类问题的方法。采用模型较复杂,指样本的原始输入到输出目标之间的数据流经过多个线性或非线性组件(components);
Credit Assignment Problem,CAP,也叫做信用分配问题或功能分配问题,即深度学习中各组件为了得出最终结果所做贡献多少。十分关键,关系到如何学习每个组件中的参数。能较好解决这一问题的模型是人工神经网络(Artificial Neural Network,ANN);
简称神经网络,受人脑神经系统的工作方式启发而构造的一种数学模型,由人工神经元和神经元之间的连接构成,主要有两类特殊神经元:一是用于接收外部信息,二是用于输出信息;
让机器的行为看起来就像是人所表现出的智能行为;
一个人在不接触对方前提下,通过一种特殊方式与对方进行一系列问答。若在较长时间内,无法通过这些问题判断对方是人还是计算机,则认为这个计算机是智能的;
机器感知(计算机视觉、语音信息处理),学习(模式识别、机器学习、强化学习),语言(自然语言处理)、记忆(知识表示)、决策(规划、数据挖掘)等;
模拟人的感知能力,对外部刺激信息(视觉和语音等)进行感知与加工,主要研究领域包括语音信息处理和计算机视觉等;
模拟人的学习能力,主要研究如何从样例或环境交互中进行学习,主要研究包括监督学习、无监督学习和强化学习等;
模拟人的认知能力,主要研究领域包括知识表示、自然语言理解、推理、规划、决策等;
基于知识的系统,必须具备三要素:
又称逻辑主义、心里学派或计算机学派,通过分析人类智能的功能,然后通过计算机来实现这些功能,具有极强的可解释性。主要有两个基本假设:
又称仿生学派或生理学派,是认知科学领域中的一类信息处理的方法和理论。模型的主要结构是由大量简单的信息处理单元组成的互联网络,具有非线性、分布式、并行性、局部性计算以及适应性等特性;
指由很多人工神经元构成的网络结构模型,人工神经元间的连接强度是可学习的参数;
指从有限观测数据中学习(或“猜测”)出具有一般性的规律,并将其应用到未观测样本上的方法;
[外链图片转存失败(img-Ah9ZHGO7-1566198019735)(https://i.loli.net/2019/08/18/9QgqyRxwKDdvI5l.png)]
表示学习的关键,指输入数据的底层特征和高层语义信息之间的不一致性和差异性;
也叫离散表示或符号表示,通常表示为one-hot向量的形式,但主要有两个不足之处;
表示为低维的稠密向量,表示能力比局部表示强;
使用神经挽留过将高维的局部表示空间R∣V∣R^{|V|}R∣V∣映射到一个非常低维的分布式表示空间Rd,d<<∣V∣R^d,d<<|V|Rd,d<<∣V∣。指将一个度量空间中的一些对象映射到另一个地位的度量空间中,并尽可能保持不同对象间的拓扑关系,如NLP中词的分布式表示,叫做词嵌入;
## 深度学习
“深度”指原始数据进行非线性特征转换的次数,一种学习方法可以从数据中心学习一个“深度模型”,则为深度学习;
深度学习中的关键问题,即一个系统中不同组件或其参数对最终系统输出结果的贡献或影响;
指在学习过程中不进行分模块或分阶段进行训练,直接优化任务的总体目标;
## 全书组织架构