首页
学习
活动
专区
工具
TVP
发布

数据娃嚼AI

专栏作者
10
文章
4206
阅读量
12
订阅数
流形学习的概念
那流形学习是什么呢?为了好懂,我尽可能应用少的数学概念来解释这个东西。所谓流形(manifold)就是一般的几何对象的总称。比如人,有中国人、美国人等等;流形就包括各种维数的曲线曲面等。和一般的降维分析一样,流形学习把一组在高维空间中的数据在低维空间中重新表示。和以往方法不同的是,在流形学习中有一个假设,就是所处理的数据采样于一个潜在的流形上,或是说对于这组数据存在一个潜在的流形。对于不同的方法,对于流形性质的要求各不相同,这也就产生了在流形假设下的各种不同性质的假设,比如在Laplacian Eigenmaps中要假设这个流形是紧致黎曼流形等。对于描述流形上的点,我们要用坐标,而流形上本身是没有坐标的,所以为了表示流形上的点,必须把流形放入外围空间(ambient space)中,那末流形上的点就可以用外围空间的坐标来表示。比如R^3中的球面是个2维的曲面,因为球面上只有两个自由度,但是球面上的点一般是用外围R^3空间中的坐标表示的,所以我们看到的R^3中球面上的点有3个数来表示的。当然球面还有柱坐标球坐标等表示。对于R^3中的球面来说,那么流形学习可以粗略的概括为给出R^3中的表示,在保持球面上点某些几何性质的条件下,找出找到一组对应的内蕴坐标(intrinsic coordinate)表示,显然这个表示应该是两维的,因为球面的维数是两维的。这个过程也叫参数化(parameterization)。直观上来说,就是把这个球面尽量好的展开在通过原点的平面上。在PAMI中,这样的低维表示也叫内蕴特征(intrinsic feature)。一般外围空间的维数也叫观察维数,其表示也叫自然坐标(外围空间是欧式空间)表示,在统计中一般叫observation。
towan
2022-09-22
3490
流形学习的基本方法
自从2000年以后,流形学习被认为属于非线性降维的一个分支。众所周知,引导这一领域迅速发展的是2000年Science杂志上的两篇文章: Isomap and LLE (Locally Linear Embedding)。
towan
2022-09-22
5790
流形学习基础
本篇是引言部分,后续章节主要介绍一下流形学习的概念和分类,争取下次在本篇基础上介绍一下流形学习的实践。
towan
2022-09-22
2720
康托三分集
Cantor三分集是由德国数学家康托(G.Cantor)于1883年引入的,下面以一道趣味题引入康托三分集,题目内容如下:
towan
2022-09-22
4880
机器学习和统计学习
曾经被问及机器学习和统计分析有什么区别——实际上我对统计分析并不是很了解,我想它应该主要就是用概率统计的方法去分析数据的一门学科吧,看起来确实和机器学习很像(特别是现在“机器学习”已经快要等价于“统计学习”了的时候),然而后来我渐渐地发现其实还是有一些差别的,或者说,干脆就是不一样吧。统计分析的主要目的应该是去分析或者解释存在的数据,例如,用某个概率模型,从数据去估计分布的参数,并计算置信度之类的。
towan
2022-09-22
1390
人工生命概念简述
近来关于生命科学研究甚为广泛,近期项目略涉及一点人工生命之概念,对此一片茫然,汪洋大海中拾起<<人工智能及其应用>>之宝书,以解人工生命之惑.
towan
2022-09-22
4490
测不准原理
不确定性原理(Uncertainty principle)由海森堡于1927年提出,德国物理学家海森堡1927年提出的不确定性原理是量子力学的产物.这个理论是说,你不可能同时知道一个粒子的位置和它的速度,粒子位置的不确定性,必然大于或等于普朗克斯常数除于4π(ΔxΔp≥h/4π),这表明微观世界的粒子行为与宏观物质很不一样。
towan
2022-09-22
4520
分形简单介绍
上次介绍了康托三分集后,算是给分形的开了一个引子,这次在此基础上介绍一下分形几何中分形的基本概念.俗话说的好,应该是物理学家惠勒曾经说过,“谁不知道熵概念就不能被认为是科学上的文化人,将来谁不知道分形概念,也不能称为有知识。”这不,未来要想要成为文化人还得去了解一下分形的概念.当然,你了解了分形的概念也不一定是"文化人",这只是一个必要条件.其实也不必灰心,"万丈高楼平地起,打好基础最重要".好吧,闲话就说这么多,下面就开始学习分形吧.
towan
2022-09-22
2230
数据增强效果不好?记一次数据排查的经历
在教育领域存在这样的一个场景,某个学生做错一个题目,学生希望系统出一些跟该题目相关的习题或者视频资料进行针对性的查漏补缺,提高学习的练习和复习的效率,这个在学术上称为FSE (finding similar exercise )问题。
towan
2022-08-25
7840
模型distill瘦身后效果不行?换个思路试一下
随着当代算力的加强,各种大模型如雨后春笋一发不可收拾,各家大厂都在拼算力,拼模型的大小,比如如下模型:
towan
2022-08-16
4710
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档