首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >语言模型的输出维数

语言模型的输出维数
EN

Stack Overflow用户
提问于 2022-10-20 02:52:39
回答 1查看 47关注 0票数 0

我正在研究语言模型。在最后一层中,我使用的是输出大小等于声声大小的密集层,这一层为训练贡献了巨大的参数。

如何减少语言模型中最后一层的大小?最后一层的大小应该等于声标大小吗?如果是的话,如果我们有大的话,模型会不会是大的?

EN

回答 1

Stack Overflow用户

发布于 2022-10-20 09:36:33

是的,最后一层的大小应该等于词汇表的大小。下面是来自TF教程的解码器示例

代码语言:javascript
运行
复制
# This fully connected layer produces the logits for each output token.
self.output_layer = tf.keras.layers.Dense(self.vocab_size)

要修复模型的大小,可以在文本矢量化步骤上设置最大词汇表大小。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74133933

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档