首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >将大量数据从Cassandra导出到CSV

将大量数据从Cassandra导出到CSV
EN

Stack Overflow用户
提问于 2014-07-23 03:38:48
回答 3查看 15.4K关注 0票数 23

我使用Cassandra 2.0.9在一个列系列中存储相当大的数据量,比如说100‘s。我想以快速的方式将此数据导出到CSV。我试过了:

  • sstable2json -它生成了相当大的json文件,很难解析-因为工具将数据放在一行中,并使用复杂的模式(例如。300Mb数据文件=~2 2Gb),转储需要很长时间,而且Cassandra喜欢根据其内部mechanism
  • COPY更改源文件名-导致大量records
  • CAPTURE的相当快的EC2实例超时-如上所述,导致具有分页的timeouts
  • reads -我对其使用了timeuuid,但它每秒返回约1,5k记录

我使用亚马逊Ec2实例,存储速度快,内存15 Gb,内核4核

将千兆字节的数据从Cassandra导出到CSV还有更好的选择吗?

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24896336

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档