我是一名经验丰富的RDBMS程序员。我正在研究一个涉及基因组数据的科学研究问题。我被指派探索Cassandra,因为我们需要一个大数据、可扩展和廉价(免费)的解决方案。设置Cassandra并为其加载数据非常简单,与我使用传统数据库(如Oracle和MySQL )时的体验相似。我的问题是找到一种简单的策略来查询数据,因为这是所有数据存储库的基本要求。我正在处理的数据是突变数据集,其中包含位置信息以及关于数据的计算数值度量。我设置了一个初始静态列族,如下所示:chrom text,ref text,aa t