腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
有没有
一种
方法
可以
避免
在
SageMaker
上
下载
训练
数据
?
、
、
在
像ml.p3.2xlarge这样的
SageMaker
上
运行非本地实例时,我不能使用本地file:// URI,而必须使用s3://这是有意义的,因为它是一个新实例。但是,当将s3 URI用于100 10
数据
集tf_estimator.fit(s3://bucket/path/to/my/data)以便我
可以
使用更大的非本地
训练
实例时,我必须等待大约10分钟才能将
数据
从s
浏览 6
提问于2019-01-26
得票数 2
2
回答
用于列出超参数的
Sagemaker
API
、
、
、
我目前正在尝试将MLFlow跟踪实现到我的
训练
管道中,并希望记录每个
训练
作业的超参数调优的超参数。 有人知道如何获取
在
sagemaker
培训作业界面(
在
AWS控制台上)
上
可以
看到的超参数列表吗?
有没有
其他更聪明的
方法
来列出模型
在
Sagemaker
中的性能对比(并显示)? 我假设一定有
一种
简单的、Pythonic式的
方法
( boto3或
sagemaker</
浏览 14
提问于2020-06-11
得票数 0
回答已采纳
2
回答
AWS
Sagemaker
-使用交叉验证而不是专用验证集?
、
、
当我
在
本地
训练
我的模型时,我使用20%的测试集,然后进行交叉验证。Sagameker似乎需要一个专用的验证集(至少
在
我学习的教程中是这样)。目前我有20%的测试,10%的验证,剩下70%需要
训练
-所以与本地
训练
相比,我丢失了10%的
训练
数据
,因此会有一些性能损失。我
可以
只使用本地
训练
的模型并覆盖存储
在
s3中的
sagemaker
模型,但这似乎有点麻烦。
有没有
一种
<e
浏览 46
提问于2019-08-24
得票数 2
1
回答
MLflow允许记录像S3这样的远程位置的工件吗?
、
、
、
、
我的背景 我开发了一个ML实验环境,如下所示:
在
AWS云中使用
SageMaker
培训作业进行培训。经过
训练
的模型存储
在
/opt/ml/model目录中,作为.tar.gz存储
在
SageMaker
自己的S3桶中。
在
培训和测试期间计算了几个评估指标,并将其记录到由基于S3的工件存储组成的MLflow基础结构中(请参见)。请注意,这是一个不同于
SageMaker
的S3桶。MLflow的一个非常有用的特性是,任何模型工件都
浏览 2
提问于2022-01-12
得票数 0
1
回答
SageMaker
分布式
训练
能用于非深度学习模式的
训练
吗?
、
、
、
、
我正在跟踪这个页面,以了解
SageMaker
的分布式培训功能。上面写着:-
SageMaker
分布式培训库只能通过TensorFlow、PyTorch和HuggingFace框架的AWS深度学习容器
在
SageMaker
培训平台中使用。这是否意味着我们不能使用
SageMaker
分布式
训练
来使用传统的机器学习算法(如线性回归、随机森林或XGBoost )来
训练
机器学习模型?我有一个用例,其中
数据
集非常大,和分布式培训
可以
帮助模型并行和<
浏览 12
提问于2022-09-17
得票数 -1
3
回答
如何快速调试
SageMaker
培训脚本?
、
、
、
当在亚马逊
SageMaker
中运行ML
训练
作业时,
训练
脚本被“部署”并提供一个ML
训练
实例,这需要大约10分钟的时间来启动并获得所需的
数据
。我只能从
训练
任务中得到一条错误消息,然后它就会死掉,实例也会随之终止。
在
我更改了
训练
脚本以修复它之后,我需要部署和运行它,这需要大约10分钟的时间。 如何更快地完成此任务,或者让
训练
实例保持运行?
浏览 29
提问于2019-01-24
得票数 3
回答已采纳
1
回答
如何利用在AWS
SageMaker
上
训练
的模型,利用内置算法进行语义分割,
在
本地PC机上进行推理?
、
、
我用内置算法
SageMaker
训练
了一个AWS 模型.这个名为model.tar.gz的经过
训练
的模型存储
在
S3
上
。所以我想从S3
下载
这个文件,然后用它在我的本地PC上进行推理,而不再使用AWS
SageMaker
。由于内置算法的语义分割是用实现的,所以我尝试参考和的文档,
在
本地PC上进行推理。从S3
下载
这个文件很容易,然后我解压缩这个文件以获得三个文件: hyperparams.json:包括用于网络体系结构、
数据</e
浏览 2
提问于2020-02-26
得票数 0
回答已采纳
1
回答
AWS救世主多项培训工作
、
、
、
、
我们目前有一个运行在AWS
上
的系统,其中有几个单位有自己经过
训练
的机器学习模型工件(使用SKLearn
训练
脚本和SKLearn估计器)。我们面临的问题是,我们需要扩展这个系统,这样我们就
可以
为几十万个单元
训练
单个模型,然后
在
一个多模型端点上托管产生的模型工件。但是,
Sagemaker
对你
可以
并行
训练
的型号的数量有一个限制(我们的限制是30)。除了分批培训我们的模型之外,
有没有
人知道如何在AWS
Sagemak
浏览 1
提问于2020-10-26
得票数 0
回答已采纳
1
回答
AWS
Sagemaker
Pytorch无法正常运行
、
、
我目前正尝试
在
AWS
Sagemaker
上
使用pytorch
训练
一个模型,但无法让它正常运行。任何帮助都是非常感谢的。例如,我设法让代码
在
colab或本地机器
上
运行,但不能在
sagemaker
上
运行。 简而言之,该程序应该:建立pytorch模型,从文件系统加载
训练
数据
,并执行
训练
历元。为此,我尝试了以下
方法
:带有“入口点”的代码文件(dataloaders/help函数
浏览 3
提问于2021-11-12
得票数 0
1
回答
萨格梅克文件大小限制?
、
我想知道
在
sagemaker
工作室中存储文件夹是否有一定的大小限制?我将这个
数据
集存储
在
s3中,但是我想在我的
sagemaker
环境中
下载
该
数据
集来
训练
我的模型。我
可以
下载
的文件大小是否有某种限制?
浏览 3
提问于2021-12-04
得票数 1
回答已采纳
1
回答
使用OpenVino预
训练
模型与AWS
、
、
、
、
我希望部署一个预先
训练
的模型,用于实时行人和/或车辆检测,使用AWS的
Sagemaker
工作流,我特别希望使用
Sagemaker
编译模型并将其部署到边缘。我想使用OpenVino从他们的模型动物园预先构建的模型之一,但是当我
下载
模型时,它已经是他们自己的优化器的中间表示格式(IR)了。是否有
一种
方法
可以
得到一个OpenVino预
训练
的模型,而不是IR格式,以便我
可以
使用它在萨吉克?或者任何可能的
方法
来封装O
浏览 3
提问于2021-09-16
得票数 0
1
回答
恢复特定检查点以使用
Sagemaker
和TensorFlow进行部署
、
、
我正在使用
SageMaker
训练
一些我认识到的自定义TF模型。
在
训练
过程中,我自然会多次评估模型,以便了解神经网络何时真正开始过拟合。
训练
结束后,我想恢复工作最好的模型(即,表示最小验证损失的模型),并将其部署
在
端点
上
。然而,如果我使用经典的Tensorflow.attach(),恢复的模型对应于output/model.tar.gz中存储的模型,如果我没有弄错,它将是对应于
上
一次
训练
迭代的模型(因此它可能过拟合)。
浏览 2
提问于2018-10-23
得票数 3
2
回答
使用AWS
SageMaker
,是否有可能使用
sagemaker
部署经过预先培训的模型?
、
、
、
我试图
避免
将现有的模型培训过程迁移到
SageMaker
,并
避免
创建自定义的Docker容器来承载经过培训的模型。我的希望是将我们现有的、经过
训练
的模型注入到预建好的scikit学习容器中,这是AWS通过提供的。我发现的所有示例都需要首先对模型进行培训,这将在
SageMaker
中创建模型/模型配置。然后使用deploy
方法
进行部署。 是否有可能为deploy
方法
提供经过
训练
的模型,并将其托管
在
AWS提供的预构建的scikit学
浏览 1
提问于2019-02-28
得票数 8
1
回答
从AWS
SageMaker
访问Google BigQuery
、
、
` 我想在AWS
SageMaker
上
运行我的笔记本来测试一些东西。要使用BigQuery进行身份验证,似乎唯一的两种
方法
是使用GCP
上
的服务帐户(或本地的)或使用env将SDK指向凭据JSON (如这里所解释的:)。例如 export GOOGLE_APPLICATION_CREDENTIALS="/home/user/Download
浏览 0
提问于2019-04-05
得票数 4
回答已采纳
1
回答
对象检测--你能得到每个类的mAP吗?
在
Sagemaker
UI中,当您运行对象检测
训练
作业时,您
可以
看到随着时间的推移mAP的进度。
有没有
一种
方法
可以
分割这个值,以便您
可以
按类跟踪它?
浏览 0
提问于2019-01-31
得票数 2
1
回答
AWS
Sagemaker
自定义
训练
作业容器发射损失度量
、
、
、
、
,我从docker
SAGEMAKER
_PROGRAM运行一个自定义keras (使用TF后端)
训练
作业。我
可以
访问
训练
数据
ok (从EFS挂载),并
可以
在
/opt/ml/model中生成输出,该输出将同步回S3。所以输入和输出都很好:我缺少的是实时监控。
Sagemaker
训练
作业会发出cpu和gpu负载等系统指标,您
可以
在
Sagemaker
训
浏览 19
提问于2020-04-05
得票数 3
1
回答
更改
SageMaker
增量
训练
的num_classes超参数
、
我正在对一个已经
在
SageMaker
中
训练
过的模型进行增量
训练
。我希望将
数据
添加到现有类中,并创建新类。第一个模型有4个类(num_classes = 4),但我希望保留这些类并添加3个额外的类。文档中说,
在
进行增量
训练
时,num_classes超参数必须相同。但如果是这种情况,这意味着我不能向现有模型添加类,每次我想要更改类的数量时,我都必须从头开始。这是准确的吗?或者,
有没有
一种
方法
可以
更新现有
浏览 44
提问于2019-04-19
得票数 1
1
回答
如何使用亚马逊网络服务
SageMaker
和S3进行目标检测?
、
、
、
我正在寻找运行一个预先
训练
的目标检测模型到一个大约有400k图像的文件夹上,大约是1.5 to。当我尝试
在
本地运行时,估计需要大约8天才能完成(使用keras yolov3)。分配给我的笔记本的卷是5 5GB的EBS,我的jupyter笔记本空间中确实有其他大量的
数据
集,这可能会导致这个问题。为了解决这个问题,我正在寻找
一种
方法
,
可以
将我的
数据
上传到S3并运行
SageMaker
来读取托管的图像并运行对象检测模型。然而,看起来没有
一种
<
浏览 18
提问于2020-11-06
得票数 0
回答已采纳
1
回答
使用
SageMaker
时使用Keras提前停止和回调
、
我正在使用
sagemaker
来
训练
keras模型。
在
训练
模型时,我需要实现早期停止
方法
。results = model.fit(train_x_trim, train_y_trim,,我们需要调用
SageMaker
的fit函数,该函数不支持回调
浏览 27
提问于2018-11-27
得票数 3
2
回答
如何使用aws
Sagemaker
python SDK保存培训作业的未压缩输出?
、
、
我正在尝试以非压缩的方式将
训练
作业工件上传到S3。 我熟悉
可以
提供给
sagemaker
估计器的输出,然后将保存在/opt/ml/ output_dir下的所有内容压缩上载到S3输出目录。我希望
可以
选择访问特定的工件,而不必每次都解压缩输出。
有没有
一种
干净利落的
方法
?如果脑海中没有任何变通
方法
?我感兴趣的工件是较小的元
数据
文件.txt或.csv,而在我的例子中,其余的工件可能只有1 1GB左右,所以
浏览 26
提问于2020-12-23
得票数 1
回答已采纳
点击加载更多
相关
资讯
在MySql中,这四种方法可以避免重复插入数据!
轻松构建 PyTorch 生成对抗网络(GAN)
对 PyTorch BERT 模型进行微调,并将其部署到 Amazon SageMaker 上的 Amazon Elastic Inference
利用 AWS SageMaker BlazingText 对不均衡文本进行多分类
AWS将Amazon SageMaker Opeartors正式引入Kubernetes,开发者可轻松训练模型
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券