腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为什么
函数
.
view
(
batch_size
,-
1
)
给出
相同
的
输出
?
、
、
、
我是神经网络
的
大一新生,我在每一批中构建了一个vgg16 network.But,所有的输入都通向
相同
的
outputs.So,我检查了每一层
的
输出
,最后发现x=x.
view
(
batch_size
,-
1
)
给出
了
相同
的
输出
!我不知道
为什么
会发生这种情况。(
batch_size
,-
1
)
浏览 239
提问于2021-03-23
得票数 0
1
回答
用torch7模型测试单个图像
、
、
我根据链接训练我
的
模型。当我训练它时,它几乎达到了90%
的
精度。我正在使用vgg_bn_drop.lua模型,您可以在链接中找到该模型。但问题是,我不知道如何测试它
的
单个图像。所以,我想做
的
是,拍一张照片。假设图像
的
维数为3x32x32。通
浏览 4
提问于2016-03-30
得票数 4
回答已采纳
2
回答
RuntimeError:张量a (133)
的
大小必须与非单个维度
1
处
的
张量b (10)
的
大小匹配
、
、
我在为我
的
模型进行训练迭代时遇到了问题。代码如下: super(Net, self).F.relu(x) #x = self.dropout(x) x = x.
view
(-
1
,512*5*5) x = self.dropout(x)
浏览 2
提问于2019-06-27
得票数 3
回答已采纳
1
回答
目标为同维向量时word2vec矢量训练
的
损耗
函数
的
选择
、
、
我有一个lstm,我用它作为序列发生器,训练word2vec向量.以前
的
实现为所有不同
的
标签产生了概率分布。词汇中
的
每个单词都有一个标签。这个实现使用了Pytorch
的
CrossEntropyLoss。我现在想改变这一点,以便lstm
输出
一个向量,其维数与用于训练
的
向量
相同
。通过这种方式,我可以使用euclydian距离度量来匹配词汇表中
的
附近向量。问题是,为了做到这一点,我必须使用不同
的
损失
函数
,因为CrossEn
浏览 1
提问于2019-09-25
得票数 0
回答已采纳
3
回答
在Python3中使用Keras时
的
ValueError
、
、
model.add(Dense(60, input_dim=60, kernel_initializer='normal', activation='relu')) 1155 147 ValueError: Error when checking target: expected dense_8 to hav
浏览 25
提问于2019-11-19
得票数 1
回答已采纳
1
回答
使用可训练
的
权重组合
相同
维度
的
两个张量,以获得最终
的
输出
张量
、
、
、
、
在处理与问答(MRC)相关
的
问题时,我实现了两种不同
的
架构,它们独立地
给出
了两个张量(令牌上
的
概率分布)。这两个张量都是维度(
batch_size
,512)。我希望获得表单(
batch_size
,512)
的
最终
输出
。如何使用可训练权重组合两个张量,然后根据最终预测训练模型?编辑(附加信息): 因此,在我
的
NN模型
的
前向
函数
中,我使用BERT模型对512个令牌进行编码。这些编码是768维
的</
浏览 5
提问于2020-06-21
得票数 0
2
回答
Theano.function中赋值变量
的
目的
我正在阅读
给出
的
逻辑
函数
的
代码。我对
函数
的
inputs和givens变量之间
的
区别感到困惑。计算小型批处理模型所犯错误
的
函数
是: outputs=classifier.errors(y), x: test_set_x[index *
batch_size
浏览 1
提问于2014-11-12
得票数 21
回答已采纳
1
回答
如何在Keras中设置合适
的
模型输入形状
、
、
、
、
我是凯拉斯
的
新手。我在凯拉斯周围玩,以获得一些直觉,并被困在这里。outputs = np.random.normal(size = (16,16,32))我只是想看看model.summary说
的
输出
形状一个是
输出
形状,另一个是我
的
代码不能工作
的
原因。我希望有人告诉我我错过了什么。谢谢~
浏览 1
提问于2020-07-31
得票数 4
回答已采纳
1
回答
如何在ndarray上创建一个带环绕
的
滑动窗口?
、
def get_batches(arr,
batch_size
, seq_length): Return arr data as batches of shape (
batch_size
)/ n_chars)) except IndexErr
浏览 3
提问于2020-07-15
得票数 1
回答已采纳
1
回答
Tensorflow整形张量
给出
无量纲
输出
得到一个无维!我所指
的
行是代码中
的
第134行:在对
输出
进行整形之后,我添加了这些行:这给了我这个:Model
batch_size
:
1</e
浏览 1
提问于2016-03-22
得票数 4
回答已采纳
2
回答
如何将四维PyTorch张量乘以一维张量?
、
、
我试着写些
函数
来做混淆训练。在这个上,我找到了一些代码,并适应了前面的代码。但在原始代码中,只为批处理(64)生成一个随机变量。但我想要每一张成批
的
照片
的
随机值。= x.size()[0] return mixed_x, m
浏览 4
提问于2020-05-10
得票数 0
回答已采纳
1
回答
sampled_softmax_loss在Tensorflow中
的
应用
、
、
、
、
我已经建立了简单
的
模型,但还没有尝试过类似于多层LSTM
的
东西,所以任何反馈都会受到极大
的
赞赏:)class Model(): def __init__(self,
batch_size
, seq_length, lstm_size, num_layer
浏览 3
提问于2016-11-12
得票数 1
回答已采纳
1
回答
注意力在神经机器翻译中
的
注意
、
、
我正在尝试使用以下教程来理解Bahdanaus
的
注意:self.attention_units = attention_units我有两个问题: 我不明白
为什么
tf.nn.tanh(self.W
1
(last_inp_dec) + self.W2(input_enc))
的
形状是(
batch_size
利用矩阵乘法
的
规则,我得到了以下结果:
浏览 3
提问于2020-08-05
得票数 1
回答已采纳
1
回答
自定义CNN
给出
了错误
的
输出
形状
、
、
、
、
我正在尝试做一个自定义
的
CNN,它应该接受一个通道
的
图像和做二进制分类。
1
), dilation=(
1
,
1
)) self.fc
1
= nn.Linear(x) x = self.conv2(x) x = x.
view</
浏览 16
提问于2020-08-29
得票数 0
2
回答
如何为Keras中
的
多
输出
回归设置目标(Y)数组
的
形状/格式?
、
、
、
、
这是我在运行下面的代码时所遇到
的
错误x = Dense(13, activation = 'relu')(inp)def imageLoader(files,
batch_size
= 16):
浏览 0
提问于2019-02-08
得票数 0
回答已采纳
1
回答
二进制分类- BCELoss和模型
输出
大小不对应
,因此我使用了一个二进制交叉熵损失:但是,我得到了一个错误: x = self.wave_block6(x) return x.squeeze() 我试着去掉挤压,但没有用我
的
批量是64。看起来我在做一些简单错误
的
事情。我
的
模型是否提供了
1
个
输出
浏览 885
提问于2021-05-20
得票数 0
6
回答
Keras致密层
输出
形状
、
、
、
、
我无法理解获得第一个隐藏层
的
输出
形状背后
的
逻辑。我列举了一些武断
的
例子如下;model.add(Dense(units=4,activation='linear',input_shape=(784,))) Non-trainable params: 0model.add(Dense(units=4,activation='linear',input_shape=(784,
1
浏览 0
提问于2020-05-02
得票数 6
回答已采纳
4
回答
model.predict和model.predict_proba
的
区别是什么?
、
、
、
我发现model.predict和model.predict_proba都
给出
了一个
相同
的
2D矩阵,表示每行每个类别的概率。 这两个
函数
的
区别是什么?
浏览 6
提问于2016-11-23
得票数 26
1
回答
当我使用CrossEntropyLoss
函数
时,如何修正目标批处理大小不匹配
的
错误?
、
、
、
、
这是培训
的
主要代码: x = x.
view
(-
1
, 18*16*16) x = self.fc2(x)在列车功能中,误差
浏览 7
提问于2022-04-06
得票数 0
回答已采纳
1
回答
model.evaluate()在Keras中
的
最佳
batch_size
?
训练准确率和验证准确率接近0.87,但在测试部分,根据
batch_size
参数值
的
不同,使用evaluate()
函数
给出
的
结果波动较大。测试精度在0.5到0.66之间变化。evaluate
的
最佳
batch_size
值必须与fit()中
的
值
相同
浏览 0
提问于2019-07-29
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
ChatGPT为什么用transformer算法?它有什么优势?
代码实现MNLM
PyTorch FlexAttention技术实践:基于BlockMask实现因果注意力与变长序列处理
用Keras和Python开发你的第一个神经网络
TensorFlow机器学习理论与实战 第一章 线性回归模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券