我发现自己有一个项目(非常轻松,失败后几乎没有任何后果),我认为需要某种数据库来解决。问题是,虽然我总体上仍然相当缺乏经验,但除了我可以用Google挖掘的教程和设置普通的家庭云之外,我从来没有接触过任何数据库。我把自己困在不知道我不知道的事情上。
这就是情况:
数百个不同的自动化测试系统将通过缓慢的网络频繁地将少量数据写入数据库。然后,很少有用户会通过慢速网络从数据库中获取大量数据子集。然后将处理数据,这将需要大量读取,此时需要非常高的性能。
这将是数据(按大小的顺序):
它基本上是一个带有标签的B-树,将测试步骤作为叶节点(因为它们的格式已经标准化)。
一个批次将始终属于一个变体,一个对象将始终属于同一个变体(但可能是多个批次),而一个变体将始终属于一个产品。有成千上万个不同的测试步骤。
可能的查询将尝试获取(例如):
批处理中的所有内容(可选:以及range)
的测试系统中类型X和Y的所有测试步骤
据我所知,数十万列的宽度(包括上述所有内容)似乎不是一个好主意,大约1万亿行也不是一个好主意(两者之间的中间地带似乎仍然相当极端)。
我真的很想利用数据的层次化性质,但我在嵌套数据库之类的东西上找到的东西就是,它们根本不是一件东西。
如果你能帮我的话就太好了:
的好方法/最佳实践<代码>G233
谢谢,祝你有愉快的一天
安德烈亚斯
https://stackoverflow.com/questions/56468327
复制相似问题