腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
CloudWatch
的
SageMaker
上
定义
度量
python
、
pytorch
、
amazon-cloudwatch
、
amazon-sagemaker
从AWS
Sagemaker
文档中,为了
在
cloudwatch
中跟踪自
定义
ml算法(非内置)
的
指标,我读到我必须
定义
我
的
estimaotr如下。但我不确定如何更改我
的
训练脚本,以便在我
的
估计器中声明
的
度量
定义
可以获得这些值。instance_count=1,
浏览 2
提问于2021-07-21
得票数 0
2
回答
如何跟踪模型进度/状态时,萨吉梅克内核是死
的
?
amazon-web-services
、
deep-learning
、
amazon-sagemaker
当在AWS
上
训练一个模型
的
时候(让我们假设训练需要15个小时或更长时间)。如果我们
的
笔记本电脑
在
两者之间失去了互联网连接,它正在接受训练
的
核心就会死去。我想知道是否有一种方法,跟踪我们
的
模型培训
的
状态/进展时,内核
在
萨吉梅克环境死亡。 注:我知道我们可以
在
培训下创造一个培训岗位--培训工作--创造培训工作。我只是想知道是否有任何其他
的
方法来跟踪,如果我们没有创造培训工作。
浏览 8
提问于2022-10-14
得票数 1
1
回答
是否有一种方法可以
在
ModelQualityMonitor中包含自
定义
回归
度量
?
python
、
amazon-web-services
、
boto3
、
monitoring
、
amazon-sagemaker
在后台,
sagemaker
运行两个处理作业,将地面真实数据与所收集
的
端点数据合并,然后分析并创建预
定义
的
回归
度量
:。不幸
的
是,我错过了指标中
的
MAPE (平均绝对百分比错误),并且希望
在
将来(也是
在
CloudWatch
中)创建这个值。携带您自己
的
容器
的
CloudWatch
度量
我怎样才能达到
浏览 11
提问于2022-04-28
得票数 1
回答已采纳
2
回答
我得到了这个错误->>模块'
sagemaker
‘没有属性'describe_training_job’
amazon-web-services
我正在使用AWS,但是在这段代码中我得到了以下错误:这是代码:status = training_info['TrainingJobStatus'] print("Training job ended
浏览 0
提问于2019-05-23
得票数 1
回答已采纳
1
回答
使用
SageMaker
处理
的
等效Glue火花配置是什么?
aws-glue
、
amazon-sagemaker
我正在尝试将Glue自
定义
PySpark作业迁移到
SageMaker
处理,以便从
SageMaker
管道提供
的
MLOps中获益。
在
Glue中,我
的
工作使用10个G.1X (4个CPU,16G内存)实例,并在10分钟内完成。我尝试使用类似的
SageMaker
处理实例(10个ml.m5.x大型实例,每个实例有4个CPU,16G内存),但是失败了,因为OOM "OutOfMemoryError:请使用具有更多内存
的
实例类型,或者确保处理容器使用<em
浏览 5
提问于2022-10-25
得票数 1
1
回答
亚马逊
SageMaker
: TrainingJobAnalytics只返回一个内置xgboost
的
时间戳
python
、
amazon-cloudwatch
、
xgboost
、
amazon-sagemaker
我正在尝试使用TrainingJobAnalytics
在
SageMaker
上
使用XGBoost绘制训练作业
的
训练和验证损失曲线。训练作业成功完成,我可以
在
CloudWatch
日志中看到训练和验证RMSE值。然而,当我尝试使用TrainingJobAnalytics
在
我
的
笔记本中获取它们时,我只获得了单个时间戳
的
度量
,而不是所有的
度量
。我
的
代码如下: metrics_datafram
浏览 2
提问于2019-12-06
得票数 0
1
回答
AWS
Sagemaker
推理端点不适合自动标度
autoscaling
、
amazon-sagemaker
、
aws-auto-scaling
我有一个使用SageMakerVariantInvocationsPerInstance目标
度量
启用自动标号
的
AWS推理端点。当我向端点发送大量请求时,实例
的
数量将正确地缩小到最大
的
实例计数。但是,
在
我停止发送请求之后,实例
的
数量不会扩展到1,最小
的
实例数。我等了很多小时。这种行为有什么原因吗? 谢谢
浏览 1
提问于2020-12-16
得票数 2
回答已采纳
1
回答
AWS实时报警
python
、
amazon-web-services
在
SNS警报中,指标是预先
定义
的
,我无法自
定义
我
的
实时警报。
浏览 5
提问于2016-10-13
得票数 0
回答已采纳
1
回答
云表
的
输出模型
度量
amazon-ec2
、
amazon-cloudwatch
、
amazon-sagemaker
我正在遵循aws文档中
的
mnist-2指南来实现我自己
的
培训工作。我使用类似的结构编写了我
的
代码,但是我想在工作运行时可视化来自
Cloudwatch
的
培训和验证指标。我是否需要手动指定我要观察
的
指标?AWS指南指出:"
SageMaker
自动解析内置算法发出
的
度量
标准
的
日志,并将这些指标发送给
CloudWatch
。“我只使用Tensorflow
的
培训和验证准确性和损失<em
浏览 2
提问于2021-03-26
得票数 0
回答已采纳
1
回答
自
定义
度量
的
CloudWatch
集单元
amazon-web-services
、
amazon-cloudwatch
、
amazon-cloudwatchlogs
我有一个带有一组小部件
的
CloudWatch
仪表板。所有的小部件都有基于自
定义
度量
的
图表/线条图。我从
CloudWatch
日志组
上
定义
的
度量
过滤器中
定义
了这些自
定义
度量
。对于每个自
定义
度量
,我希望将单位设置为毫秒、秒、小时等。
CloudWatch
控制台以某种方式显示所有的
度量
单位仅为
浏览 2
提问于2017-11-22
得票数 3
3
回答
在
培训过程中未使用GPU
的
Sagemaker
实例
python-3.x
、
amazon-web-services
、
machine-learning
、
tensorflow2.0
、
amazon-sagemaker
在
ml.p3.2xlarge实例
上
,我正在Tensorflow
上
训练一个Seq2Seq模型。当我尝试
在
google
上
运行代码时,每个时代
的
时间大约是40分钟。然而,在这种情况下,大约是5个小时!这是我
的
训练代码 cp_callbackepochs=num,call
浏览 3
提问于2021-08-11
得票数 1
回答已采纳
1
回答
如何观察和控制
sagemaker
多模型服务器如何在内存中加载模型
amazon-web-services
、
amazon-sagemaker
、
mms
我正在评估
SageMaker
多模型服务器(MMS)作为宿主大量模型进行推理
的
一种选择。我已经按照指令成功地构建了容器。我可以调用推断,并且模型
在
SageMaker
上工作得很好。
在
我
的
实验中,彩信经常在8-10左右报告
CloudWatch
的
LoadedModelCount
度量
。即使我
在
更大
的
一组模型
上
运行推理。因此,我
的
猜测是,
SageMaker
浏览 5
提问于2021-01-20
得票数 0
1
回答
从
cloudwatch
中删除自
定义
度量
和自
定义
命名空间
amazon-web-services
、
amazon-cloudwatch
、
amazon-cloudwatchlogs
嗨,是否有任何方法可以将
定义
在
cloudwatch
日志组
上
的
自
定义
度量
与其命名空间一起删除。非常奇怪
的
是,我们可以使用API/Console创建自
定义
度量
/命名空间,但不能使用API或来自
cloudwatch
自
定义
度量
/命名空间
的
控制台删除它。
浏览 3
提问于2020-08-11
得票数 3
回答已采纳
2
回答
AWS
CloudWatch
自
定义
度量
最佳实践
amazon-web-services
、
boto3
、
amazon-cloudwatch
我正在EC2
上
运行我
的
Python应用程序,我希望它能够向
CloudWatch
报告一些自
定义
(应用级)指标。 我必须经过身份验证--与Lambda不同,我
在
EC2中运行
的
事实并不意味着我会自动通过身份验证。这里
的
最佳做法是什么?我
的
应用程序没有
在
EC2
上<
浏览 7
提问于2020-03-09
得票数 1
1
回答
从Android获得所有S3调用中
的
504错误
android
、
amazon-web-services
、
amazon-s3
在过去
的
几个小时里,每当我试图上传一些东西到S3时,我
的
应用程序就会出现这个错误。 我们使用它实例化和上传我们
的
文件
浏览 1
提问于2020-11-25
得票数 3
1
回答
SageMaker
超调
的
目标
度量
python
、
classification
、
amazon-sagemaker
、
multilabel-classification
我用
SageMaker
的
AWS内建算法训练了二元分类模型,并希望利用模糊矩阵对模型进行评价。然而,我看到
SageMaker
的
培训和HyperTuner工作只是接受准确性
度量
。是否有一种
在
SageMaker
中为内置图像分类算法添加自
定义
度量
的
方法?据我所知,对于二进制分类器来说是很好
的
度量
标准,为什么
在
AWS内置
的
图像分类算法中缺少这些
度量
浏览 1
提问于2020-09-13
得票数 1
1
回答
基于多告警
的
aws ecs业务
的
扩展
amazon-web-services
、
devops
、
autoscaling
、
aws-ecs
我们有一个运行在aws中
的
服务,我们希望根据2项指标来扩展和扩展。扩展时: cpu > 80%或connection_count > 9500我们可以访问云表中
的
cpu和连接计数指标以及警报但是,我们无法弄清楚如何在这两种方法
的
基础
上
设置这样
的
动态缩放策略。 使用标准
的
aws控制台接口来创建自动缩放规则,我看不到多个选项。任何关于这方面的教程或aws文档
的
链接都将不胜感
浏览 0
提问于2018-05-07
得票数 1
回答已采纳
2
回答
在
相同
的
有效负载下多次触发AWS事件(
Sagemaker
培训工作状态更改)
amazon-web-services
、
amazon-sagemaker
、
aws-event-bridge
我创建了一个事件规则,用于
在
cloudwatch
中更改
Sagemaker
培训作业状态,以监视我
的
培训工作。然后,我使用这些事件触发lambda函数,该函数以机器人
的
身份
在
电报组中发送消息。它可以工作,但有一个问题,事件,他们被激发了多次与相同
的
有效载荷,所以我收到了大量重复
的
消息。编辑 没有重复
的
规则/事件。我还注意到,启用
Sagemaker
(默认情况下)会导致相同规则调用
的
数量急剧增加
浏览 1
提问于2021-01-25
得票数 1
回答已采纳
2
回答
如何在亚马逊
CloudWatch
的
AWS/EC2命名空间中发布每个实例
的
度量
?
amazon-ec2
、
amazon-web-services
、
performance
我正在为
CloudWatch
发布几个自
定义
度量
标准。当
度量
在
我自己
的
名称空间
上
时,一切都进行得很好。现在,我想在CPUUtilization命名空间中发布一个与ImageId=i-XXXXXXXX相似的每个实例
度量
,其中包含维度ImageId=i-XXXXXXXX。不幸
的
是,
CloudWatch
不同意我
的
观点,并给出了一个错误:“参数名称空间
的
值AWS/ for是无效<e
浏览 1
提问于2011-09-08
得票数 3
回答已采纳
2
回答
使用
cloudwatch
来确定linux服务是否正在运行。
amazon-web-services
、
service
、
amazon-cloudwatch
假设我有一个带有内容
的
服务ec2实例 exec my_exec如何监视ec2实例,以便如果my_service停止运行,我就可以对其执行操作?
浏览 4
提问于2015-08-05
得票数 10
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在Splunk上安装自定义应用反弹Shell的方法
在Splunk上安装自定义应用反弹Shell的方法
Input Output推出用于在Cardano上开发自定义侧链的工具包
安猫区块链溯源商城在溯源的基础上,增加了防伪的定义,保证商品质量
AWS将Amazon SageMaker Opeartors正式引入Kubernetes,开发者可轻松训练模型
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券