首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >AWS SageMaker随机采伐林还是动态数据分析随机砍伐林?

AWS SageMaker随机采伐林还是动态数据分析随机砍伐林?
EN

Stack Overflow用户
提问于 2018-07-27 14:47:19
回答 1查看 812关注 0票数 0

我需要建立一个架构来检测web应用程序创建的日志中的异常。

随机切割森林算法经常出现在我的研究中,它被用于两个场景: SageMaker和。

我应该在架构中使用这两种服务中的哪一种?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-08-02 19:11:15

在核心方面,两者之间的数学方法几乎是相同的,但是在Kinesis和SageMaker中实现它们的方式有一些不同,这应该有助于您做出决定。

动态RandomCutForest:

  • 流媒体版本的算法,这是很好的近实时更新的模型.
  • 支持旧记录的时间衰减,输入数据的带状,如果您使用多维,异常属性可以帮助您理解每个维度的效果。
  • 因此,如果您的日志存储在CloudWatch中,通过使用订阅过滤器(如果需要的话使用Lambda ),您可以将它们进行预处理,并将其发送到Kinesis,而无需付出很大的努力。

SageMaker RandomCutForest:

  • 该算法的批处理版本,很适合大型数据集(通常存储在S3中)或不需要频繁更新模型的地方。
  • 类似于Kinesis,支持通过推断端点对输入数据点进行近乎实时的评分,但是新的数据点不会改变底层模型。
  • 支持超参数优化,它确定模型的最佳参数集(例如样本数、树数等)。
  • 扩展用于培训和评分的实例非常简单,可用的SageMaker笔记本可以帮助您对数据进行预处理并为培训做好准备。
  • 因此,如果您的数据集很大,并且不需要对模型进行动态更新,那么SageMaker解决方案应该是您的首选解决方案。

希望这能回答你的问题。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51560452

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档