我是新的大数据技术和设计,所以寻求帮助,从java世界。
我有标签和标签组合的概念。例如,U.S.A和Pen是两个标记,如果它们在某种定义中结合在一起,那么注册一个标签组合(U.S.A-Pen)。
标签(美国,铅笔,铅笔,印度,洗发精)标签组合(美国钢笔,印度-铅笔,美国铅笔,印度-铅笔,印度-洗发精)
查询需要支持:一个标签或一组标签出现在多少个标签组合?如果我查询钢笔,印度,那么它应该返回两个组合(印度-钢笔,印度-钢笔-洗发精)..Query将由应用程序实时触发。
请建议一种与java客户端一起分发的解决方案,它可以处理我正在寻找的数据规模。
已经在卡桑德拉身上试过了,但无法得出与我的问题相匹配的结论。
谢谢Naresh
发布于 2014-01-29 00:58:16
我建议您查看Apache Lucene项目:
您将无法直接使用Cassandra,但是如果您将数据存储在Cassandra中,则可以使用Solr在数据的基础上添加额外的索引。DataStax有一个名为DataStax Enterprise的捆绑解决方案,它将Cassandra/Solr放在一起:
http://www.datastax.com/what-we-offer/products-services/datastax-enterprise
https://stackoverflow.com/questions/21402182
复制相似问题