学习笔记DL001 : 数学符号、深度学习的概念

数学符号。

数和数组。𝑎,标量(整数或实数)。𝒂,向量。𝑨,矩阵。𝗔,张量。𝑰𝑛,𝑛行𝑛列单位矩阵。𝑰,维度蕴含上下文单位矩阵。𝑒⁽ⁿ⁾,标准基向量0,…,0,10,…,0,其中索引n处值为1。diag(𝒂),对象方阵,其中对象元素由𝒂给定。a,标量随机变量。𝐚,向量随机变量。𝐀,矩阵随机变量。

集合和图。𝔸,集合。ℝ,实数集。{0,1},包含0和1集合。{0,1,…,𝑛},包含0和𝑛之间所有整数的集合。𝑎,𝑏,包含𝑎和𝑏的实数区间。(𝑎,𝑏],不包含𝑎但包含𝑏的实数区间。𝔸\𝔹,差集,即其元素包含于𝔸但不包含于𝔹。𝒢,图。𝑃𝑎𝑔(𝑥𝑖),图𝒢中𝑥𝑖的父节点。

索引。𝑎𝑖,向量𝑎的第𝑖个元素,其中索引从1开始。𝑎₋𝑖,除了第𝑖个元素,𝑎的所有元素。𝐴𝑖,𝑗,矩阵𝐴的𝑖,𝑗元素。𝐴𝑖,:,矩阵𝐴的第𝑖行。𝐴:,𝑖,矩阵𝐴的第𝑖列。𝘼𝑖,𝑗,k,3维张量𝘼的(𝑖,𝑗,𝑘)元素。𝘼:,:,𝑖,3维张量𝘼的2维切片。a𝑖,随机向量𝑎的第𝑖个元素。

线性代数操作。𝐴⫟,矩阵𝐴的转置。𝐴⁺,𝐴的Moore-Penrose伪造。𝐴⨀𝐵,𝐴和𝐵的逐元素乘积(Hadamard乘积)。𝑑𝑒𝑡(𝐴),𝐴的行列式。

微积分。𝑑𝑦/𝑑𝑥,y关于x的导数。∂𝑦/∂𝑥,y关于x的偏导。∇𝑥𝑦,y关于x的梯度。∇𝑿𝑦,y关于𝑿的矩阵导数。∇𝐗𝑦,y关于𝐗求导后的张量。∂𝑓/∂𝑥,𝑓:ℝⁿ->ℝⁿⁿ的Jacobian矩阵𝑱∈ℝ⁽m*n⁾。∇⁽𝟸⁾₍x₎𝑓(x)or𝑯(𝑓)(x),𝑓在点𝑥处的Hessian矩阵。∫𝑓(𝑥)𝑑𝑥,𝑥整个域上的定积分。∫𝕤𝑓(𝑥)𝑑𝑥,集合𝕊上关于𝑥定积分。

概率和信息论。a⊥b,a和b相互独立的随机变量。a⊥b|c,给定c后条件独立。P(a),离散变量上的概率分布。p(a),连续变量(或变量类型未指定时)上的概率分布。a~P,具有分布P的随机变量a。Ex~p𝑓(𝑥)or𝔼𝑓(𝑥),𝑓(𝑥)关于P(𝑥)的期望。Var(𝑓(𝑥)),𝑓(𝑥)在分布P(𝑥)下的方差。Cov(𝑓(𝑥),𝑔(𝑥)),𝑓(𝑥)和𝑔(𝑥)在分布P(𝑥)下的协方差。𝐻(𝑥),随机变量𝑥的香浓熵。𝐷𝐾𝐿(𝑃||𝑄),𝑃和𝑄的𝐾𝐿散度。𝑁(𝑥;𝛍,∑),均值为𝛍,协方差为∑,𝑥上的高斯分布。𝑓:𝔸->𝔹,定义域为𝔸值域为𝔹的函数𝑓。𝑓∘𝑔,𝑓和𝑔的组合。𝑓(𝑥:θ),由θ参数化,关于𝑥的函数(有时为简化表示,忽略θ,记为𝑓(𝑥))。log𝑥,𝑥的自然对数。σ(𝑥),Logistic sigmoid,1/(1+exp(-𝑥))。𝜁(𝑥),Softplus,log(1+exp(𝑥))。||𝑥||p,𝑥的L⁽p⁾范数。||𝑥||,𝑥的L⁽2⁾范数。𝑥⁺,𝑥的正数部分,max(0,𝑥)。1condition,如果条件为真则为1,否则为0。用函数𝑓,参数是一个标量,应用到一个向量、矩阵或张量:𝑓(𝑥)、𝑓(𝑋)或𝑓(𝖷)。表示逐元素将𝑓应用于数组。𝑪=σ(𝗫),对于所有合法的i、j和k,𝗖i,j,k=σ(𝗫i,j,k)。

数据集和分布。𝑃data,数据生成分布。𝑃train,由训练集定义的经验分布。𝕏,训练样本的集合。𝑥⁽𝑖⁾,数据集的第𝑖个样本(输入)。𝒴⁽𝑖⁾或𝓨⁽𝑖⁾,监督学习中与𝑥⁽𝑖⁾关联的目标。𝑿,𝑚 x 𝑛的矩阵,行𝑿𝑖,:为输入样本𝑥⁽𝑖⁾。

古希腊时期,神话人物皮格马利翁(Pygmalion)、代达罗斯(Daedalus)和赫淮斯托斯(Hephaestus)传说发明家。加拉蒂亚(Galatea)、塔洛斯(Talos)和潘多拉(Pandora)人生生命(Ovid and Martin,2004;Sparkes,1996;Tandy,1997)。

人类第一次构思可编程计算机,思考变智能(离造出第一计算机一百年)(Lovelace,1842)。人工智能(artificial intelligence,AI)众多实际应用、活跃研究课题领域,蓬勃发展。智能软件自动处理常规劳动、理解语音图像、帮助医学论断、支持基础科学研究。

早期,计算机相对简单问题迅速解决,形式化数学规则描述问题。挑战,很难形式化描述任务,如人说话、图中脸。解决方案,计算机从经验学习,根据层次化概念体系理解世界。概念通过相对简单概念关系定义。计算从经验获取知识,避免人类给计算机形式化指定知识。层次化概念让计算机构建简单概念学习复杂概念。概念建立在彼此之上的图,一张深(多层次)图。AI深度学习(deep learning)。

参考资料:

《深度学习》

欢迎推荐上海机器学习工作机会,我的微信:qingxingfengzi

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏互联网大杂烩

Python 异常值分析

异常值分析是检验数据是否有录入错误以及含有不合常理的数据。忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会产生不良影响;重视...

1162
来自专栏ACM算法日常

丘比特的箭(点是否在面内)- HDU 1756

对于点A是否在多边形P内的判定, 一般有两种方法:射线法和转角法。 这里介绍一下射线法。

592
来自专栏懒人开发

(7.8)James Stewart Calculus 5th Edition:Improper Integrals

我们得到对应的面积是无穷大的, 就知道对应的 improper integral 反常积分, 不收敛

1182
来自专栏专知

【LeetCode 204】关关的刷题日记40 Number of Boomerangs

关关的刷题日记40 – Leetcode 447. Number of Boomerangs 题目 Given n points in the plane th...

3444
来自专栏新智元

【邓侃】哈佛大学机器翻译开源项目 OpenNMT的工作原理

【新智元导读】 2016年12月20日,哈佛大学自然语言处理研究组,宣布开源了他们研发的机器翻译系统 OpenNMT ,并声称该系统的质量已经达到商用水准。本文...

4475
来自专栏封碎

当今世界最为经典的十大算法 博客分类: 经典文章转载 算法数据结构网络应用数据挖掘J#

本文转载自July CSDN博客:http://blog.csdn.net/v_JULY_v/archive/2011/03/07/6228235.aspx

1282
来自专栏逍遥剑客的游戏开发

纹理投影测试

1847
来自专栏黄成甲

数据分析之数据处理

数据处理是根据数据分析目的,将收集到的数据,用适当的处理方法进行加工、整理,形成适合数据分析的要求样式,它是数据分析前必不可少的工作,并且在整个数据分析工作量中...

1532
来自专栏刘望舒

算法(一)时间复杂度

前言 算法很重要,但是一般情况下做移动开发并不经常用到,所以很多同学早就将算法打了个大礼包送还给了老师了,况且很多同学并没有学习过算法。这个系列就让对算法头疼的...

1868
来自专栏ATYUN订阅号

利用统计方法,辨别和处理数据中的异常值

在建模时,清理数据样本非常重要,这样做可以确保观察结果充分代表问题。有时,数据集可能包含超出预期范围之外的极端值。这通常被称为异常值,通过理解甚至去除这些异常值...

1223

扫码关注云+社区