文章/答案/技术大牛

发布

首页视频第 3 章无监督学习与预处理：用 t-SNE 进行流形学习

第 3 章无监督学习与预处理：用 t-SNE 进行流形学习原创

2021-07-292021-07-29 09:11:19播放1.2K

点赞0 收藏 0

用 t-SNE 进行流形学习

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:01
3.4.3用TS进行流行学习。虽然PC通常是用于变换数据的首选方法，使你能够用散点图将其可视化，但这一方法的性质先旋转，然后减少方向，限制了其有效性，正如我们在wild的数据集label faces的散点图中所看到的那样。有一类用于可视化的算法叫做流行学习算法many for learning，它允许进行更加复杂的映射，通常也可以给出更好的可视化。其中特别有用的一个就是TSNE算法。流行学习算法主要用于可视化，因此很少用来生成两个以上的新特征。其中一些算法包括TSNE计算训练数据的一种新表示，但是它不允许变换新的数据。这意味着这些算法不能用于测试集，更确切的说，它只能用于变换。
01:04
训练数据流行学习对探索性数据分析是很有用的。但如果最终目标是监督学习的话。则很少会去使用T背后的思想是找到数据的一个二维表示，尽可能的保持数据点之间的距离。TS首先给出每个数据点的随机二维表示。然后尝试。让在原始空间中距离较近的点更加的靠近原始空间中相距较远的点。更加的远离。P重点关注距离较近的点，而不是保持距离较远的点之间的距离。换句话说，它试图保存那些表示哪些点比较靠近的信息。我们将对S论包含的一个手写数据集应用T流行学习算法。
02:08
注意不要与更大的M数据集弄混。在这个数据集中，每个数据点都是零到九之间手写数字的一张八乘八的灰度图像。
03:52
这一幅图对应数字零，这一幅图对应数字一，依此类推。
04:00
我们用PC。将数据降到二维。并进行可视化。我们对前两个主成分作图，并按照类别对数据点着色。首先，我们需要构建一个PC模型。
08:45
我们需要将数据实际绘制成文本。而不是简单的三点。
11:10
实际上，这里我们用每个类别对应的数字作为符号来显示每个类别的位置。利用前两个主成分。可以将数字。064。相对较好的分开，尽管仍然有重叠，大部分其他数字都大量重叠在了一起。我们将应用于同一个数据集，并对结果进行比较。由于TSNE不支持变换新数据，所以TS类没有transform方法，我们可以调用fit transform方法来代替。它会构建模型，并立刻返回变换之后的数据。
15:07
的结果非常的棒。所有类别都被明确的分开，数字一和九被分成几块，但大多数类别都形成一个密集的组。要记住这种方法，它并不知道类别的标签，它完全就是无监督的，但它能够找到数据的一种二维表示，仅根据原始空间中数据点之间的靠近程度，就能够将各个类别明确的分开。TS算法有一些调节参数，虽然默认参数的效果通常就很好，你可以尝试修改。To。和early exag这两个参数，但作用一般很小。

展开

我来说两句

0 条评论

登录后参与评论

作者

不可言诉的深渊

【合辑】《Python 机器学习基础教程》演示视频_已获出版社授权

（21/47）

24分48秒

第 1 章引言（1）

7.3K44

55分54秒

第 1 章引言（2）

6.1K9

6分12秒

第 1 章引言（3）

53分35秒

第 1 章引言（4）

3.4K8

28分33秒

第 2 章监督学习（1）

3K3

52分48秒

第 2 章监督学习：k 近邻

3.4K2

57分13秒

第 2 章监督学习：线性模型（1）

1时8分

第 2 章监督学习：线性模型（2）

37分11秒

第 2 章监督学习：朴素贝叶斯分类器

46分27秒

第 2 章监督学习：决策树

2.2K1

31分24秒

第 2 章监督学习：决策树集成

7171

36分15秒

第 2 章监督学习：核支持向量机（1）

50分55秒

第 2 章监督学习：核支持向量机（2）

1.2K0

30分16秒

第 2 章监督学习：神经网络（1）

1K0

42分38秒

第 2 章监督学习：神经网络（2）

1.1K0

1时1分

第 2 章监督学习（2）

42分12秒

第 3 章无监督学习与预处理（1）

45分52秒

第 3 章无监督学习与预处理：主成分分析（1）

8700

34分54秒

第 3 章无监督学习与预处理：主成分分析（2）

32分42秒

第 3 章无监督学习与预处理：非负矩阵分解

110

15分55秒

第 3 章无监督学习与预处理：用 t-SNE 进行流形学习

1.2K0

23分30秒

第 3 章无监督学习与预处理：k 均值聚类（1）

1.2K0

15分48秒

第 3 章无监督学习与预处理：k 均值聚类（2）

6600

23分14秒

第 3 章无监督学习与预处理：凝聚聚类

1.2K0

11分57秒

第 3 章无监督学习与预处理：DBSCAN

25分23秒

第 3 章无监督学习与预处理（2）

38分30秒

第 3 章无监督学习与预处理（3）

5分17秒

第 3 章无监督学习与预处理（4）

32分31秒

第 4 章数据表示与特征工程（1）

20分16秒

第 4 章数据表示与特征工程（2）

26分39秒

第 4 章数据表示与特征工程（3）

40分50秒

第 4 章数据表示与特征工程（4）

11分56秒

第 4 章数据表示与特征工程（5）

1.2K0

38分40秒

第 5 章模型评估与改进（1）

18分42秒

第 5 章模型评估与改进（2）

1.2K0

34分43秒

第 5 章模型评估与改进（3）

7分14秒

第 5 章模型评估与改进（4）

37分1秒

第 5 章模型评估与改进（5）

1.2K0

55分53秒

第 5 章模型评估与改进（6）

9660

29分27秒

第 5 章模型评估与改进（7）

29分14秒

第 6 章算法链与管道（1）

16分48秒

第 6 章算法链与管道（2）

27分3秒

第 7 章处理文本数据（1）

16分43秒

第 7 章处理文本数据（2）

7分45秒

第 7 章处理文本数据（3）

1.3K1

15分22秒

第 7 章处理文本数据（4）

26分7秒

第 8 章全书总结

第 3 章无监督学习与预处理：用 t-SNE 进行流形学习原创

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

第 3 章 无监督学习与预处理：用 t-SNE 进行流形学习原创

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

第 3 章无监督学习与预处理：用 t-SNE 进行流形学习原创