腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如果
我
使用
嵌入
层
,
我
如何
解码
我
的
seq-to-seq
模型
的
输出
?
python-3.x
、
tensorflow
、
keras
、
word-embedding
、
sequence-to-sequence
我
有一个seq to seq
模型
,训练了一些聪明
的
机器人数据: justphrases_X是一个句子列表,justphrases_Y是对这些句子
的
响应列表。batch_size = 1, epochs=1) #, validation_data = (testX, testy) model.save("cleverbottheseq-uel.h5") 当我
使用
此
模型
进行预测时,由于我
使用
softmax,因此
输出
将介于0和1之间。然而
浏览 10
提问于2020-11-09
得票数 0
1
回答
如何
在将单词表示为
嵌入
的
同时,对整个语音预测建立LSTM自动编码
模型
tensorflow
、
keras
、
lstm
、
autoencoder
、
seq2seq
我
还创建了这个
模型
的
各种版本。 在第二个场景中,
我
在<
浏览 0
提问于2019-07-08
得票数 0
回答已采纳
1
回答
输入到“序列到序列”
模型
的
“
解码
器”应该是什么?
python
、
machine-learning
、
keras
、
keras-layer
、
rnn
我
正在开发一个用于文本生成
的
序列到序列
模型
() .在
解码
器端不
使用
“教师强制”,即将t0
的
解码
器
输出
输入到time t1
的
解码
器中。现在,在实际中,
解码
器
的
输出
(LSTM/GRU)通过一个密集
的
层
,在tern中生成字
的
索引,该索引被认为是
解码
器
的
输出</em
浏览 2
提问于2018-04-02
得票数 0
2
回答
是否有可能访问拥抱面板变压器
嵌入
层
?
python
、
machine-learning
、
nlp
、
huggingface-transformers
、
transformer-model
我
想
使用
一个预先训练
的
拥抱脸变压器语言
模型
作为编码器在一个序列序列
模型
。或者你还会推荐其他
的
方法?
浏览 6
提问于2022-04-01
得票数 0
回答已采纳
1
回答
Keras和Pytorch编
解码
模型
的
差异
keras
、
nlp
、
pytorch
、
lstm
在编码器-译码器
模型
的
构造之间,似乎存在着显著
的
、根本性
的
差异.这是,这是。 Pytorch
使用
在编码器中没有激活
的
嵌入
层
,但对
解码
器中
浏览 9
提问于2020-06-09
得票数 0
回答已采纳
3
回答
在单词
嵌入
后
输出
一个单词而不是一个向量?
python
、
nlp
、
rnn
、
word-embeddings
我
试着玩一个翻译或文字摘要
的
玩具实现。
我
现在明白了,大多数人在
使用
任何
模型
之前都会
使用
嵌入
层
,这会产生类似于300维向量
的
东西。但是
模型
输出
的
是什么呢?就像编
解码
模型
一样,它
的
输入是这些向量
的
序列。那么,
解码
器
的
最后一
层
是什么呢?不像事件抽取或类似的东西,我
浏览 0
提问于2016-11-15
得票数 4
回答已采纳
1
回答
GPT-2体系结构问题
machine-learning
、
neural-network
、
nlp
、
pytorch
、
gpt
我
目前正在研究一个NLP
模型
,它比较两个评论,并确定哪一个会更受欢迎。
我
已经提出了一个架构-它将基于GPT-2。但是现在
我
很难理解它
的
输出
的
一般格式。
我
检查了GPT-2
的
这 PyTorch实现,下面是
我
所理解
的
:区块只是一个具有注意
层
和卷积
层
<e
浏览 0
提问于2023-03-17
得票数 0
回答已采纳
1
回答
如何
反转PyTorch
嵌入
?
deep-learning
、
pytorch
、
autoencoder
我
在PyTorch中有一个多任务编码器/
解码
器
模型
,在输入端有一个(可训练
的
) torch.nn.Embedding
嵌入
层
。在一个特定
的
任务中,
我
希望预先训练
模型
自监督(以重新构造屏蔽输入数据),并将其用于推理(以填补数据中
的
空白)。
我
想对于训练时间,
我
可以用输入
嵌入
和
输出
嵌入
之间
的
距离来衡量损失。
浏览 16
提问于2020-10-25
得票数 6
回答已采纳
1
回答
基于Keras
的
基于译码器输入seq2seq
模型
的
注意
层
连接
python
、
tensorflow
、
keras
、
deep-learning
我
正在尝试
使用
Keras库来实现Sequence2序列
模型
。该
模型
的
框图如下
模型
将输入序列
嵌入
到三维张量中。然后,双向lstm创建编码
层
。接下来,将编码
的
序列发送到自定义注意
层
,该自定义注意
层
返回对每个隐藏节点具有注意力权重
的
2D张量。 将
解码
器输入作为一个热向量注入到
模型
中。现在,在
解码
器(另一个双lstm)中,将
浏览 0
提问于2018-07-25
得票数 6
回答已采纳
1
回答
在培训阶段,变压器
模型
中
的
第一个
解码
器
层
的
输入是什么?
deep-learning
、
transformer
我
正试图让
我
的
头脑了解变压器
的
架构是
如何
工作
的
。
我
认为
我
对编码器部分有一个很好
的
顶层理解,可以理解键、查询和值张量是
如何
在MultiHead注意
层
中工作
的
。
我
挣扎
的
是
解码
器部分,特别是对第一个
解码
器
层
的
输入。
我
知道有两件事。最后
的
编码器<
浏览 0
提问于2021-02-05
得票数 7
回答已采纳
2
回答
带有元数据
的
时间序列自动编码器
time-series
、
metadata
、
autoencoder
、
anomaly-detection
目前,
我
正在尝试构建一个自动编码器,用于检测时间序列数据中
的
异常。
我
的
方法基于本教程:
使用
普通
的
MLP网络,您可以有一个用于时间序列
的
网络和一个用于元数据
的
网络,并将它们合并到更高层。但是
如何
<
浏览 22
提问于2021-04-18
得票数 0
1
回答
无法理解图像分割研究论文中以下几行
的
含义
neural-network
、
deep-learning
、
computer-vision
、
convolution
我
正在执行一篇关于图像分割
的
论文。它基于对u-net体系结构
的
轻微修改. Layer . Output size . Filter Size Stride DropoutConv12Conv11Upsampling3Conv
浏览 0
提问于2019-07-25
得票数 6
回答已采纳
1
回答
当您提示GPT3时,输入数据会发生什么变化?
nlp
、
artificial-intelligence
例如,假设
我
打开操场,输入"Quack“。
模型
是
如何
处理这5个字符
的
,以确定下一步应该
使用
哪些字母或单词? (碰巧
的
是,GPT3用“庸医”填充了这个提示,然后对细胞治疗进行了长篇大论。奇怪)。
浏览 1
提问于2022-07-10
得票数 -1
1
回答
如何
创建一个输入形状变化但
输出
形状固定
的
解码
器?
python
、
tensorflow
、
keras
、
decoder
最近
我
在为mnist玩自动编码器,这个问题出现了。“是否有可能建立一个输入形状不同但
输出
形状固定
的
模型
?”示例:想象
使用
输
浏览 9
提问于2022-09-25
得票数 0
回答已采纳
1
回答
Keras :
如何
在损失函数中
使用
层
的
权重?
keras
、
embedding
、
tensor
、
loss
我
在keras中实现了一个自定义
的
损失函数。该
模型
是一个autoencoder。但是
嵌入
层
是可训练
的
,并且损失必须
使用
嵌入
层
的
权重(
我
必须对
我
的
词汇表
的
所有单词
嵌入
求和)。 例如,
如果
我
想训练玩具
的
例子:“猫”。
嵌入
层
的
<
浏览 1
提问于2017-11-17
得票数 6
1
回答
TensorBoard投影仪中
的
主成分分析
如何
连接到训练好
的
模型
?
tensorflow
、
pca
、
tensorboard
我
正在尝试用TensorFlow在结构化数据上实现一个多标签分类器。
我
使用
具有两个完全连接
的
层
的
神经网络,但我还集成了
嵌入
,如此中所述,因此
我
可以在TensorBoard投影仪中看到PCA图。
我
注意到,当我更改
模型
时,PCA图保持不变。那么,TensorBoard投影是
如何
连接到
模型
的
呢?
我
如何
使用
这个PCA<
浏览 5
提问于2018-02-11
得票数 0
回答已采纳
7
回答
为什么译码器不是伯特架构
的
一部分?
nlp
、
bert
、
machine-translation
、
attention-mechanism
我
看不出伯特是
如何
在不
使用
解码
器
的
情况下做出预测
的
,这是之前所有
模型
的
一部分,包括变压器和标准RNN。
如何
在不
使用
解码
器
的
情况下在BERT体系结构中进行
输出
预测?怎么才能完全消除
解码
器呢?换句话说,
我
可以用什么
解码
器和伯特一起生成
输出
文本?
如果
BERT只编码,
我</e
浏览 0
提问于2019-12-21
得票数 22
回答已采纳
1
回答
Keras中
的
VAE :
如何
定义端到端
模型
?
python
、
keras
、
autoencoder
我
在这里学习。
我
的
模型
部分是: paddingz_decoded) # vae = Model(input_img, x)vae.summary()
我
的
问题是我们应该计算input_img和z
浏览 2
提问于2018-11-11
得票数 1
1
回答
Keras ValueError:检查目标时出错:期望dense_15具有三维,但得到了形状为(301390,8)
的
数组
python
、
machine-learning
、
keras
、
deep-learning
、
nlp
我
有8个类,
我
想从输入文本预测。下面是
我
的
预处理数据
的
代码:tok = Tokenizer(num_words=num_max)mat_texts0 0 0 0 0 0 0 0 0 0下面是
我
的
模型
的
浏览 1
提问于2018-11-23
得票数 0
回答已采纳
1
回答
神经网络中
的
超长序列
deep-learning
、
lstm
、
sequence
、
sequence-to-sequence
初学者关于神经网络中序列
的
问题:假设
我
有分类问题,看起来如下: 类取决于整个序列--不可能在没有看到所有类
的
情况下确定类。NN是怎么处理这个
的
?
我
已经阅读过各种方法,例如截断序列(这是一个问题--序列
的
截短部分没有类,所以我不能标记它),
使用
编码器/
解码
器lstm (同样,不能完全理解它
如何
解决问题)等等。
浏览 0
提问于2018-05-03
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
seq2seq模型实例:用Keras实现机器翻译
【精读】Transformer模型深度解读
前端慌不慌?用深度学习自动生成HTML代码
这么多年,终于有人讲清楚 Transformer 了!
论嵌入在 OpenAI的5v5 DOTA2 AI 中的妙用
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券