首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >本BIGDATA应用程序的建议技术/设计

本BIGDATA应用程序的建议技术/设计
EN

Stack Overflow用户
提问于 2014-01-28 09:53:57
回答 1查看 112关注 0票数 0

我是新的大数据技术和设计,所以寻求帮助,从java世界。

我有标签和标签组合的概念。例如,U.S.A和Pen是两个标记,如果它们在某种定义中结合在一起,那么注册一个标签组合(U.S.A-Pen)。

标签(美国,铅笔,铅笔,印度,洗发精)标签组合(美国钢笔,印度-铅笔,美国铅笔,印度-铅笔,印度-洗发精)

  • 数百万标签
  • 数十亿标签组合
  • 一个标签组合通常有2-8个标签.
  • 每天我们都要写一些新的标签组合。
  • 按一组标记查找匹配组合的查询的每日字数

查询需要支持:一个标签或一组标签出现在多少个标签组合?如果我查询钢笔,印度,那么它应该返回两个组合(印度-钢笔,印度-钢笔-洗发精)..Query将由应用程序实时触发。

请建议一种与java客户端一起分发的解决方案,它可以处理我正在寻找的数据规模。

已经在卡桑德拉身上试过了,但无法得出与我的问题相匹配的结论。

谢谢Naresh

EN

回答 1

Stack Overflow用户

发布于 2014-01-29 00:58:16

我建议您查看Apache Lucene项目:

http://lucene.apache.org/

您将无法直接使用Cassandra,但是如果您将数据存储在Cassandra中,则可以使用Solr在数据的基础上添加额外的索引。DataStax有一个名为DataStax Enterprise的捆绑解决方案,它将Cassandra/Solr放在一起:

http://www.datastax.com/what-we-offer/products-services/datastax-enterprise

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/21402182

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档