我知道EC2比电子病历更灵活,但工作量更大。然而,在成本方面,如果使用EC2,它可能需要EBS卷连接到EC2实例,而AWS只需要从S3中流式输入数据。因此,在亚马逊网络服务计算器上计算数字,即使电子病历也必须支付EC2,电子病历变得比EC2更便宜??我说错了吗?当然,使用EBS的EC2可能会更快,但这样做值得吗?
谢谢,马特
发布于 2013-10-22 21:46:57
EMR为您做了许多在EC2上的标准Hadoop上找不到的事情。一些特别重要的问题包括
您还会发现,与Apache Hadoop打包的标准文件系统相比,EMR S3文件系统更快、更可靠。它支持分块上传,流直接写入S3,而不是先缓冲到磁盘。有关这方面的更多信息,请参阅Tip #5
此外,如果您决定直接使用EC2,我建议您的节点使用实例存储而不是EBS。确实没有理由为Hadoop支付额外的EBS成本;您会注意到EMR集群也都在实例存储节点上运行。
发布于 2013-10-08 20:05:57
您是正确的,电子病历使用实例存储支持的EC2实例,而不是EBS。但是,没有什么可以阻止您创建基于实例存储的实例,打包AMI并将其用于Hadoop集群。根据您的工作负载和频率,使用EBS也可能不会带来很多额外的成本。此外,当通过电子病历使用EC2实例时,会增加额外的成本。
我已经使用EMR两年了,我强烈推荐这项服务,因为你不需要花费时间来管理和更新你的发行版。如果您的工作负载与电子病历兼容(从DynamoDB或S3获取数据),我会选择电子病历,而不是EC2/Hadoop。
https://stackoverflow.com/questions/19129440
复制相似问题