我正在寻找弹出的云服务的细节(例如。Amazon/Azure),我想知道它们是否适合我的应用程序。
我的应用程序基本上只有一个表数据库,大约500 My。它以3-5 GB/天的速度增长。我需要从其中提取文本数据,一次大约一百万行,过滤大约5列。这些提取的数据通常约为1-5 GB,压缩到100-500MB,然后在web上可用。
这里有我现有实现的一些细节,One 400GB table, One query - Need Tuning Ideas (SQL2005)
那么,我的问题是:现有的云服务是否适合托管这种类型的应用程序?存储这么多数据和带宽的成本是多少(带宽使用量约为2 2GB/天)?
持久性系统是否适合存储像这样的大型扁平表,它们是否提供了在许多列上进行搜索的能力?
我目前的实现运行在10K美元以下的硬件上,所以如果成本远远高于5000美元/年,那么迁移是没有意义的。
发布于 2009-03-04 07:21:42
考虑到大量的数据和增长的速度,我认为亚马逊不是一个好的选择。我假设您希望将数据存储在持久存储上。但使用EC2时,您需要分配一定数量的存储空间,并将其作为磁盘附加。除非您想分配大量的空间(然后将为未使用的磁盘空间付费),否则您将不得不不断地添加更多的磁盘。我做了一个envalop计算的快速返回,我估计它将花费$2,500 - $10,000每年托管。我很难准确估计,因为amazon收取的所有费用都是可变的(实例正常运行时间、存储空间、带宽、光盘io等)这是EC2 pricing。
发布于 2012-04-30 10:46:31
假设这是非关系型数据(不能在单个表上处理关系型数据),您可以考虑使用Azure Table Storage,这是一种为非关系型结构化数据设计的存储机制。
你在这里会遇到的问题是Azure表只有一个主索引,因此不能像你所需要的那样通过5列来索引。除非您将数据存储5次,每次都按您希望筛选的列进行索引。不过,我不确定这会不会很划算。
Azure Table存储的成本从每月每G 8美分起,这取决于您存储的数据量。还有每笔交易的费用和出口数据的费用。有关定价的更多信息,请查看此处;http://www.windowsazure.com/en-us/pricing/calculator/advanced/
您需要从何处访问此数据?它是如何写入的?
基于此,可能还有其他选择需要考虑,比如Azure驱动器等。
https://stackoverflow.com/questions/442606
复制相似问题