在Pytorch中，我们可以有超过一维的输入(例如单词嵌入)吗？

在PyTorch中，是可以使用超过一维的输入的，例如单词嵌入。PyTorch是一个强大的深度学习框架，可以支持多维输入数据的处理。对于单词嵌入这样的任务，一般使用嵌入层来进行处理。

嵌入层是一种常用的神经网络层，它可以将离散的输入（例如单词）映射为连续的低维向量表示。在PyTorch中，可以使用torch.nn.Embedding类来实现嵌入层。这个类的初始化函数需要指定输入的维度和嵌入后的维度，例如：

embedding = torch.nn.Embedding(num_embeddings, embedding_dim)

其中num_embeddings表示输入的维度大小，即单词的数量，embedding_dim表示嵌入后的维度大小，即每个单词的向量表示的维度。

使用嵌入层后，可以将输入的多维数据传入嵌入层进行处理，例如：

input = torch.tensor([[1, 2, 3], [4, 5, 6]])  # 两个样本，每个样本有3个单词
embeddings = embedding(input)

上述代码中，input是一个大小为(2, 3)的Tensor，表示两个样本，每个样本有3个单词。embedding(input)将输入传入嵌入层，并返回嵌入后的结果embeddings，它的大小为(2, 3, embedding_dim)，即两个样本，每个样本有3个单词，每个单词的向量表示的维度为embedding_dim。

这样，我们就可以在PyTorch中使用超过一维的输入，例如单词嵌入，来进行深度学习任务的处理。

如果您对PyTorch的嵌入层和其他深度学习相关的内容感兴趣，可以参考腾讯云的深度学习平台产品AI Lab，链接地址为：https://cloud.tencent.com/product/ailab

在Pytorch中，我们可以有超过一维的输入(例如单词嵌入)吗？

、、、

假设我有一些文本，我想将它们分为三组food, sports, science。如果我有一个句子I dont like to each mushrooms，我们可以使用单词嵌入(比如说100维)来为这个特定的句子创建一个6x100矩阵。通常，在训练神经网络时，我们的数据是维数为n_obs x m_features的二维数组如果我想训练一个词嵌入句子的神经网络(我

浏览 40提问于2021-05-05得票数 0

回答已采纳

1回答

Pytorch:如何实现嵌套的变压器:字符级的文字转换器和句子的字级转换器？

、

为了处理自然语言问题，我想使用字符级嵌入(而不是传统的字级嵌入)，因为它们更健壮，因为它们可以很容易地适应单词中的形态变化(例如前缀、后缀、复数、动词接合、连字符等等)。一旦我们有了所有这些初始的字级嵌入，第二个字级转换器将细化这些嵌入，以丰富它们的上下文表示，从而获得上下文感知的字级嵌入。例如</em

浏览 2提问于2019-06-14得票数 5

1回答

单个词具有多个范畴特征的词嵌入

、、、

我正在寻找一种方法来实现在Pytorch中使用LSTM层实现word嵌入网络，这样nn.Embedding层的输入与单词I的向量具有不同的形式。在我的例子中，每个单词都有一个对应的向量，因此，我的语料库中的句子是一个向量向量。例如，我可能有"King“和向量500，3，18，其中500是单词<

浏览 3提问于2019-10-08得票数 0

回答已采纳

1回答

如何在不混合批次元素的情况下重塑pytorch矩阵

、

在我的神经网络模型中，我用一个8x256维嵌入矩阵表示一个8个单词的句子。我希望将其作为输入提供给LSTM，其中LSTM一次接受嵌入的单个单词作为输入并对其进行处理。根据pytorch ，输入应该是(seq_len, batch, input_size)的形状。将输入转换为所需形状的正确方法是什么？我不想把数字

浏览 1提问于2018-11-28得票数 2

1回答

如何在pytorch中处理LSTM模型中的多标签分类

、

我得到1000个文本，每个文本有50个单词和一个标签，每个单词嵌入100个维度，我使用pytorch。我有一个问题，每个文本都有不同的长度，例如十个单词，五个单词或八个单词。我首先将单词嵌入到100维中，我知道LSTM是序列长度无关的。所以我可以处理每一个txt成功，但是我如何同时处理多个txt呢？当我处理许多

浏览 24提问于2019-11-08得票数 0

2回答

pytorch中嵌入的加权求和

我有一个12个单词的序列，我使用一个12x256矩阵来表示(使用单词嵌入)。让我们将这些称为其中wi是标量(因此存在权重共享)。如何在pytorch中创建可训练的</e

浏览 3提问于2019-10-26得票数 3

1回答

火炬嵌入中的灵活字数

、

Pytorch中的类接受num_embedding作为参数。根据文档，num_embedding是“嵌入字典的大小”。在创建嵌入对象时，我对以下两种情况感到好奇： num_embedding，或称单词计数，是灵活的。例如，最初我使

浏览 2提问于2021-04-27得票数 0

1回答

如何在MLP的最后两个层之前向输入特性添加两个新的维度

、、、

最初，我们有一个多层的MLP。我们有一个200维的输入嵌入。现在，我们希望在原始嵌入中增加两个维度，以编码两个重要的特性。但由于原始维数较高，我们担心MLP忽略了两个新的维度，这两个维度是相当重要的。因此，我们希望在MLP的最后两层之前添加两个新的

浏览 3提问于2022-01-16得票数 -2

回答已采纳

4回答

卷积序列到序列学习模型中的位置嵌入是什么？

我不明白卷积序列到序列学习论文中的位置嵌入，有人能帮我吗？

浏览 3提问于2017-06-18得票数 8

1回答

文本分类:我的数据有多少个维度？

我是用文字袋模型分类的。我读了800个文本文件，每一个都包含一个句子。然后，这些句子的表述如下：这是最大向量中的条目数吗？或者是唯一的单词数量？还是别的什么？

浏览 1提问于2016-11-07得票数 0

回答已采纳

1回答

通过线性层的PyTorch高维张量

我在PyTorch中有一个大小的张量(32,128，50)。这些是50个字嵌入，批处理大小为32.也就是说，我大小中的三个索引对应于批数、最大序列长度(带有“pad”令牌)和每个嵌入的大小。现在，我想通过一个线性层来获得一个大小(32,128，1)的输出。也就是说，对于每一个嵌入在每个序列中的单词，我想把它变成一维的。我试着<e

浏览 12提问于2022-02-17得票数 0

回答已采纳

2回答

使用变压器位置嵌入

、

将位置嵌入引入到转换器中，以便将位置信息添加到单词嵌入中。现在，假设我们有一个现有的数据嵌入，可以用于任何数据域的word/图像。在编码之前，我们没有原始的文本/图像，而是最终的嵌入。是否可以从嵌入中提取位置嵌入，还是必须在原始输入(文本/图像

浏览 0提问于2023-01-06得票数 0

2回答

在火炬手的嵌入层里到底发生了什么？

、

从多个搜索和pytorch文档本身，我可以发现在嵌入层中有一个查找表，其中存储了嵌入向量。我无法理解的是：在这方面的任何帮助都将不胜感激。谢谢。

浏览 9提问于2019-11-05得票数 21

回答已采纳

1回答

如何在预训练的ELMO嵌入中获得相似的单词？

、、、、

如何在预训练的ELMO嵌入中获得给定单词的相似单词？例如:在Glove中，我们使用glove_model.most_similar()来查找最相似的单词及其对任何给定单词的嵌入。同样，我们在ELMO有什么东西吗？

浏览 13提问于2019-04-17得票数 4

1回答

Word2vec中软极大值层中权重的形状(跳跃图)

、、、、

我有一个关于Softmax层的重量形状的问题。假设我们的词汇量是10000个单词，我们的嵌入层将降到300个维度。因此，输入是长度为10000的一个热向量，嵌入层有300个神经元.这意味着，从输入层到嵌入层的权重矩阵的形状为10000*300(词汇中的<e

浏览 2提问于2019-12-03得票数 1

回答已采纳

1回答

如何反转PyTorch嵌入？

、、

我在PyTorch中有一个多任务编码器/解码器模型，在输入端有一个(可训练的) torch.nn.Embedding嵌入层。在一个特定的任务中，我希望预先训练模型自监督(以重新构造屏蔽输入数据)，并将其用于推理(以填补数据中的空白)。我想对于训练时间，我可以用输入嵌入和输出嵌入之间

浏览 16提问于2020-10-25得票数 6

回答已采纳

1回答

假设我们有一个类似于Today is a very bad day. Very bad day is today.I wont come to play.的文本我应该用什么样的技巧来总结类似的文本呢？从文章中，我发现到目前为止，我认为抽取摘要将重视前两句，因为在前两句中，文本的主要要点(根据单词的频率)是存在的。同样，抽象摘要技术也会对前两句进行总结。但是，在理想的情况下，第三句是必须的。考虑到我

浏览 0提问于2021-01-12得票数 1

1回答

我应该如何理解nn.Embeddings参数num_embeddings和embedding_dim？

我正在尝试适应PyTorch nn模块中的嵌入类。我不明白<em

浏览 7提问于2019-11-09得票数 1

回答已采纳

4回答

Keras嵌入层:它们是如何工作的？

、、、、

我有一个分类问题，其中的特征是离散的。为了管理这种情况，标准过程包括用一次热编码来转换二进制数组中的离散特性。然而，对于Keras来说，这一步似乎是不必要的，因为我们可以简单地使用嵌入层来创建这些离散特征的特征向量表示。如何执行这些？我的理解是，如果离散特性f可以假定k值，那么嵌入层就会创建带有k列的矩阵。每次我收到该特性的值

浏览 4提问于2017-03-13得票数 12

回答已采纳

1回答

为什么ELMo的单词嵌入比手套更能代表单词？

、、、、

我读过ELMo的代码。似乎我们丢失了B

浏览 0提问于2018-12-05得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在Pytorch中，我们可以有超过一维的输入(例如单词嵌入)吗？

相关·内容

在Pytorch中，我们可以有超过一维的输入(例如单词嵌入)吗？

Pytorch:如何实现嵌套的变压器:字符级的文字转换器和句子的字级转换器？

单个词具有多个范畴特征的词嵌入

如何在不混合批次元素的情况下重塑pytorch矩阵

如何在pytorch中处理LSTM模型中的多标签分类

pytorch中嵌入的加权求和

火炬嵌入中的灵活字数

如何在MLP的最后两个层之前向输入特性添加两个新的维度

卷积序列到序列学习模型中的位置嵌入是什么？

文本分类:我的数据有多少个维度？

通过线性层的PyTorch高维张量

使用变压器位置嵌入

在火炬手的嵌入层里到底发生了什么？

如何在预训练的ELMO嵌入中获得相似的单词？

Word2vec中软极大值层中权重的形状(跳跃图)

如何反转PyTorch嵌入？

如何处理文本摘要中类似意义的句子

我应该如何理解nn.Embeddings参数num_embeddings和embedding_dim？

Keras嵌入层:它们是如何工作的？

为什么ELMo的单词嵌入比手套更能代表单词？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐