首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用RNN学习词嵌入

用RNN学习词嵌入
EN

Data Science用户
提问于 2018-08-17 12:37:04
回答 1查看 2.9K关注 0票数 3

学习单词嵌入的常用方法是基于弓模型和跳格模型.

是否有可能训练一个基于RNN的体系结构,比如GRU或LSTM,从一个大语料库中随机的句子来学习单词嵌入?基本上,我们训练一个网络的正负样本,并反向传播到字向量。这种技术的缺点是什么?

任何对类似作品的引用都将受到高度赞赏。

EN

回答 1

Data Science用户

回答已采纳

发布于 2019-07-26 15:01:56

是的,有可能训练一个基于RNN的体系结构,比如GRU或LSTM,从一个大语料库中随机的句子来学习单词嵌入。

在训练神经网络时,可以学习语料库词的嵌入词,如情感分类。在提交给RNN之前,首先对每个单词进行编码,使其由唯一的整数表示,例如使用标记器。我们添加了一个填充标记,使所有的句子具有相同的长度。

这样做被称为在LSTM/RNN/GRU网络模型的前面构建一个嵌入层。对于嵌入层,您需要指定:

  1. 序列的最大长度
  2. 每个令牌的嵌入大小。

缺点是,使用这种技术,培训将花费更多的时间,因为你不仅要训练你的预测模型,而且你的词嵌入。这是因为与模型相比,可训练参数的总量将更大,在模型中,我们使用预先训练过的具有冻结参数的字嵌入。

最后,根据您的数据集大小,使用在一些较大的语料库上训练的预先训练的嵌入将导致更好的嵌入,而不是在您的较小的数据集中训练您自己的单词嵌入。

下面是使用这两种方法的一个实验:https://towardsdatascience.com/machine-learning-word-embedding-sentiment-classification-using-keras-b83c28087456

票数 3
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/37083

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档