腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
从
保存
的
检查点
重建
训练
路径
、
、
、
我正在用batchnorm
训练
一个简单
的
完全卷积网络。我在初始化后
保存
了一个
检查点
。然后,我恢复它并再次运行
训练
(使用相同
的
超参数)。然而,我
从
两个
训练
过程中得到了不同
的
结果。在两次运行开始时,我
的
所有种子(python、numpy和tf)都被设置为相等。 不匹配
的
原因可能是什么?
浏览 26
提问于2020-04-18
得票数 0
1
回答
如何/在何处加载
检查点
文件
、
、
我正在运行tensorflow object_detection模型
的
model_main.py。我想知道哪个.py文件包含代码,模型在哪里检查'mode_dir‘中
的
现有
检查点
,以及模型如何知道
从
保存
的
最新
检查点
加载/启动。 我检查了model_lib.py,但还不能弄清楚。
浏览 13
提问于2019-06-15
得票数 0
1
回答
如何阻止估计器恢复每个
训练
的
权重和全局步骤
、
、
我正在尝试使用tensorflow高级API来开发一个模型,我在
训练
和可视化阶段发现了一个问题: 对于相同
的
model_fn(),每次我尝试调用estimator.train()方法时,global_step将从我上次
训练
的
步骤增加。例如,如果上次运行estimator.train()方法到global_step = 2000,那么这一次当我开始
训练
模型时,它将从2000,2001,2002开始累加。我
的
问题是:出于某种原因,我每次都想从头开始
训练
一个模型。也就是说,当
浏览 0
提问于2018-05-03
得票数 1
1
回答
如何在Tensorflow
检查点
中用常规relu替换relu6操作?
、
简单
的
问题真的,我需要将Tensorflow模型转换成不支持relu6
的
格式,只是常规
的
relu。我
的
模型是3个ckpt (
检查点
)文件(数据、索引和元文件)
的
形式。我需要能够在转换relu层后
训练
模型。谁能给我指个正确
的
方向,告诉我该怎么做。谢谢!
浏览 0
提问于2018-03-28
得票数 1
1
回答
在tensorflow中
保存
检查点
和恢复
训练
、
我在玩
保存
检查点
和
从
保存
的
检查点
恢复
训练
的
游戏。为了简单起见,我遵循了in - 中给出
的
例子,我没有使用任何“真正”
的
网络
训练
。我只是执行了一个简单
的
减法操作,每个
检查点
在相同
的
张量上一次又一次地
保存
相同
的
操作。下面的ipython notebook - 提供了一个最小
的
示例 在第一阶段,我将
浏览 2
提问于2016-04-20
得票数 3
1
回答
/model.ckpt-5 :不成功
的
TensorSliceReader构造函数未能找到任何匹配
的
TensorSliceReader文件
、
、
/model.ckpt-5 :不成功
的
TensorSliceReader构造函数:未能找到任何匹配
的
TensorSliceReader文件
从
检查点
或Tensorflow/workspace/models/model.ckpt-5:不成功
的
SavedModel构造函数还原时出错:未能找到任何匹配
的
Tensorflow/workspace/models/my_ssd_mobnet/./model.ck
浏览 25
提问于2022-12-04
得票数 0
2
回答
从
保存
的
检查点
恢复培训
的
TF2对象检测API问题
、
、
我面临着TF2对象检测API
的
一个问题,这个问题似乎是在一夜之间发生
的
。我正在尝试
从
保存
的
检查点
恢复
训练
,并且和往常一样,在恢复培训之前,我会将配置文件中
的
路径
更改为
检查点
所在
的
位置。由于某些原因,
检查点
dir和模型dir不能相同。现在,最大
的
问题是,如果我改变模型dir,它重新开始
训练
从
零,而不是从上一个时代,所以我被困住了。
浏览 6
提问于2021-05-07
得票数 3
1
回答
“此”函数与CNTK中
从
检查点
恢复
的
函数不等效(同构)
、
、
“此”函数与
从
检查点
恢复
的
函数不等效(同构)。 我
的
恢复代码如下。它们与创建
训练
器和通过trainer.dnn
保存
trainer.save_checkpoint("trainer.dnn")
的
结构相同,如所提到
的
。
浏览 0
提问于2017-01-21
得票数 1
1
回答
如何使用Node.js (tfjs-node)
从
Tensorflow.js中
的
检查点
重新启动模型
训练
?
、
、
、
、
我正在
训练
模型,需要创建
训练
模型
的
检查点
,并使用
检查点
从
保存
的
级别重新启动模型
训练
。tfjs-node可以做到这一点吗?如果有,请指点一下..
浏览 7
提问于2019-01-24
得票数 0
回答已采纳
2
回答
如何控制tensorflow估计器保留
的
检查点
数量?
、
我注意到,新
的
Estimator API在
训练
期间自动
保存
检查点
,并在
训练
中断时自动
从
最后一个
检查点
重新启动。不幸
的
是,它似乎只保留了最后5个
检查点
。 您知道如何控制培训期间保留
的
检查点
的
数量吗?
浏览 10
提问于2017-12-30
得票数 4
回答已采纳
1
回答
分批培训还是多次培训?
、
、
我有一个关于神经网络批量学习
的
问题。 神经网络在每一次迭代中分批学习并修改权值。问:如果我在一批之后
保存
检查点
,然后稍后装载重量,然后用新
的
一批进行
训练
,这与一次
训练
两批不同吗?如果我
的
批次大小为100,
训练
数据为1000分。那么,在输出
的
检查点
文件中,如果我一次
训练
9批(900个数据点) ->
保存
检查点
->负载
检查点
第二天->
浏览 0
提问于2019-04-26
得票数 0
1
回答
在我自己
的
数据集中运行Tensorflow对象检测
训练
作业
的
问题
、
、
我可能遗漏了一些显而易见
的
东西,但是在遵循自述
的
步骤之后,我无法成功地提交EC2 V100实例中
的
火车作业。到目前为止,我完成了以下步骤: 但是,我确实在模型目录中填充了这些文件(train和
浏览 0
提问于2019-05-06
得票数 1
1
回答
Tensorflow-GPU在
训练
期间遇到
保存
检查点
的
问题-也没有使用整个GPU,不确定原因
、
Python版本: 3.5CUDA: 10模型: Faster-RCNN-Inception-V2信息:tensorflow:全局步骤864:损失= 0.4430 (0.996秒
浏览 0
提问于2019-11-26
得票数 1
1
回答
“output_dir”在transformers.TrainingArguments中是什么意思?
、
、
、
在huggingface文档中,它写着“模型预测和
检查点
将被写入
的
输出目录”。我不太明白这是什么意思。我必须为此创建任何文件吗?
浏览 26
提问于2021-04-19
得票数 1
回答已采纳
1
回答
如何使用会话
的
权重来初始化新会话
的
权重?
、
、
我有一个关于tensorflow
的
问题;我
的
网络结构是固定
的
,但我想用许多不同
的
案例来
训练
它,因为每个案例
的
一些局部特征;由于输入(不同
的
案例)是“相似的”,我想使用前一个
的
训练
结果来初始化这个新
的
学习我尝试了以下(我简化了我
的
代码),有谁有更好
的
想法来实现它吗?
浏览 18
提问于2019-06-12
得票数 1
回答已采纳
2
回答
如何使用aws Sagemaker python SDK
保存
培训作业
的
未压缩输出?
、
、
我正在尝试以非压缩
的
方式将
训练
作业工件上传到S3。 我熟悉可以提供给sagemaker估计器
的
输出,然后将
保存
在/opt/ml/ output_dir下
的
所有内容压缩上载到S3输出目录。我希望可以选择访问特定
的
工件,而不必每次都解压缩输出。有没有一种干净利落
的
方法?如果脑海中没有任何变通方法?我感兴趣
的
工件是较小
的
元数据文件.txt或.csv,而在我
的
例子中,其余
的
工件
浏览 26
提问于2020-12-23
得票数 1
回答已采纳
1
回答
使用tensorflow对象检测api
的
迁移学习
、
我正在尝试使用预先
训练
好
的
faster_rcnn_inception_v2_coco来
训练
模型。
浏览 10
提问于2019-07-18
得票数 0
1
回答
我
的
检查点
艾伯特文件在
训练
时不会改变
、
、
、
、
我
训练
艾伯特回答问题
的
模型。我有20万对问答,我使用一个
保存
的
2gb
检查点
文件。我在我
的
GPU GeForce 2070 RTX上
训练
它,每次用1000步来
保存
检查点
,在
训练
检查点
时,model.ckpt-96000.data-00000-of-00001文件只是保持135MB
的
大小而不增加我不明白为什么在像1500个问答对这样
的
更小
的
数据集中,
浏览 1
提问于2020-10-07
得票数 0
回答已采纳
1
回答
Tensorflow 2x:在tensorflow.keras.save_model中,参数include_optimizer到底会影响什么
、
、
、
、
我一直在浏览tensorflow.keras.save_model()应用程序接口
的
文档,我遇到了参数include_optimizer,我想知道不包括优化器有什么好处,或者如果优化器不与模型一起
保存
会出现什么问题为了给我
的
特定用例提供更多
的
上下文,我想
保存
一个模型,然后将生成
的
.pb文件与Tensorflow一起使用。我是否需要
保存
优化器状态,而不是
保存
它会减少结果文件
的
整体大小?如果我不
保存
,模型会不会在TF服务
浏览 51
提问于2021-04-30
得票数 1
回答已采纳
1
回答
Huggingface Transformer - GPT2
从
保存
的
检查点
恢复
训练
、
、
、
、
恢复
从
run_clm.py实现
的
GPT2微调 GPT2 huggingface是否具有
从
保存
的
检查点
恢复
训练
的
参数,而不是从头开始再次
训练
?假设python笔记本在
训练
时崩溃,
检查点
将被
保存
,但当我再次
训练
模型时,它仍然从头开始
训练
。 来源:here 微调代码: !num_train_epochs=1 \ --block_size=200
浏览 98
提问于2021-01-01
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在 PyTorch 中使用梯度检查点在GPU 上训练更大的模型
TensorFlow 篇 | TensorFlow 2.x 基于 Keras 的模型保存及重建
修改我的文档路径方法,文档保存目录从硬盘c盘修改到d盘图文教程
岭回归房价预测训练模型的保存与加载
从0到1的路径1
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券