前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据|附代码数据

Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据|附代码数据

原创
作者头像
拓端
发布2023-05-12 21:55:21
6890
发布2023-05-12 21:55:21
举报
文章被收录于专栏:拓端tecdat

原文链接:http://tecdat.cn/?p=24002

最近我们被客户要求撰写关于非线性降维技术的研究报告,包括一些图形和统计输出。

T-distributed Stochastic Neighbor Embedding (T-SNE) 是一种可视化高维数据的工具。T-SNE 基于随机邻域嵌入,是一种非线性降维技术,用于在二维或三维空间中可视化数据

Python API 提供  T-SNE 方法可视化数据。在本教程中,我们将简要了解如何在 Python 中使用 TSNE 拟合和可视化数据。教程涵盖:

  • 鸢尾花数据集TSNE拟合与可视化
  • MNIST 数据集 TSNE 拟合和可视化

我们将从加载所需的库和函数开始。

代码语言:javascript
复制
import seaborn as sns
import pandas as pd

鸢尾花数据集TSNE拟合与可视化

加载 Iris 数据集后,我们将获取数据集的数据和标签部分。

代码语言:javascript
复制
x = iris.data
y = iris.target

然后,我们将使用 TSNE 类定义模型,这里的 n_components 参数定义了目标维度的数量。'verbose=1' 显示日志数据,因此我们可以检查它。

代码语言:javascript
复制
TSNE( verbose=1)

接下来,我们将在图中可视化结果。我们将在数据框中收集输出组件数据,然后使用“seaborn”库的 scatterplot() 绘制数据。在散点图的调色板中,我们设置 3,因为标签数据中有 3 种类型的类别。

代码语言:javascript
复制
df = p.Dtame()
df["] = y
df["cm"] =z[:,0]
df[cop"] = z[,]

plot(hue=dfytlst()
                patte=ns.cor_ptt("hls", 3),
                dat=df)

MNIST 数据集 TSNE 拟合和可视化

接下来,我们将把同样的方法应用于更大的数据集。MNIST手写数字数据集非常合适,我们可以使用Keras API的MNIST数据。我们只提取数据集的训练部分,因为这里用TSNE来测试数据就足够了。TSNE需要太多的时间来处理,因此,我将只使用3000行。

R语言高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

01

02

03

04

代码语言:javascript
复制
x_train= xtrin[:3000]
y_rin = ytrin[:3000]
print(x_train.shape)

MNIST 是一个三维数据,我们将其变形为二维数据。

代码语言:javascript
复制
print(xtishpe)
x_nit = rshap(_rin, [xran.shap[0],xtrn.shap[1]*xrin.shap[2])
print(x_mit.shape)

在这里,我们有 784 个特征数据。现在,我们将使用 TSNE 将其投影到二维中,并在图中将其可视化。

代码语言:javascript
复制
z = tsne.fit(x_mnist)
df["comp1"] = z[:,0]
df["comp2"] = z[:,1]

plot(huedf.tit(),
                ata=f)

该图显示了 MNIST 数据的二维可视化。颜色定义了目标数字及其在 2D 空间中的特征数据位置。

在本教程中,我们简要地学习了如何在 Python 中使用 TSNE 拟合和可视化数据。

本文选自《Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据》。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 原文链接:http://tecdat.cn/?p=24002
  • 鸢尾花数据集TSNE拟合与可视化
  • MNIST 数据集 TSNE 拟合和可视化
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档