我们有一个处理大量xml数据导入的rails应用程序。现在我们将这些大约5MB的xml文档存储在Postgres中。这并不理想,因为我们使用每个xml文档一次或两次进行解析。我们希望有一种智能的方式来存储和归档这些文档,但不要为了空间而使检索过程过于复杂。我们已经考虑过将文档迁移到Mongo (我们也在使用它),但是我们不是人为地提高了Mongo db服务器的内存需求吗?
我们处理这个问题的最好方法是什么?
发布于 2011-03-22 23:38:39
如果您只使用它解析一次或两次,然后从给定的链接加载文件,那么我只会在DB中存储一个指向该文件的链接。另一种方法是使用XML,例如eXist。
发布于 2011-03-22 23:37:45
您可以尝试eXist,这是一个XML数据库。但是,如果您只是将它们归档,为什么不直接将它们存储在目录树中呢?
发布于 2011-03-22 23:46:13
您可能希望研究一下db2的PureXML功能。要玩它,你可以下载免费的DB2 Express-C version here。根据记录,IBM也是唯一正式支持Ruby驱动程序和Rails适配器的数据库提供商,因此您不会孤军奋战。
https://stackoverflow.com/questions/5393670
复制相似问题