相关内容
4.2 创建RDD
当然,也可以通过parallelize方法的第二个参数进行手动设置(如sc.parallelize(data, 10))可以为集群中的每个cpu分配2~4个slices(也就是每个cpu分配2~4个task)。 4.2. 2 存储创建rddspark可以从本地文件创建,也可以由hadoop支持的文件系统(hdfs、kfs、amazon s3、hypertable、hbase等),以及hadoop支持的输入...

NoSQL教程:了解NoSQL的功能,类型,含义,优势
基于列的nosql数据库被广泛用于管理数据仓库,商业智能,crm,图书馆书籍目录,base,cassandra,hbase,hypertable是基于列的数据库。 面向文档:面向文档的nosql db将数据存储和检索为键值对,但值部分存储为文档。 该文档以json或xml格式存储。 db可以理解该值,并且可以查询该值。? 在上图中的左侧,我们溃疡看到...
coder看看应该有用
apache hadoop、apache casandra、mongodb、apachecouchdb、redis、bigtable、hbase、hypertable、voldemort、neo4j mapreduce相关:hive、pig、cascading、cascalog、mrjob、caffeine、s4、mapr、acunu、flume、kafka、azkaban、oozie、greenplum 数据处理:r、yahoo! pipes、mechanical turk、solrlucene...
今日分享: 常用工具集
apache hadoop、apache casandra、mongodb、apachecouchdb、redis、bigtable、hbase、hypertable、voldemort、 neo4jmapreduce相关:hive、pig、cascading、cascalog、mrjob、caffeine、s4、mapr、acunu、flume、kafka、azkaban、oozie、 greenplum数据处理:r、yahoo! pipes、mechanical turk、solrlucene...
整理的程序员使用利器(工具)
apache hadoop、apache casandra、mongodb、apachecouchdb、redis、bigtable、hbase、hypertable、voldemort、neo4jmapreduce相关:hive、pig、cascading、cascalog、mrjob、caffeine、s4、mapr、acunu、flume、kafka、azkaban、oozie、greenplum数据处理:r、yahoo! pipes、mechanical turk、solrlucene...