首页标签MapReduce

#MapReduce

Google 提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算

Spark完全可以取代mapreduce吗?

mapreduce计算引擎任务资源规划?

mapreduce计算引擎任务分配?

如何决定一个job的map和reduce的数量?

请描述mapReduce有几种排序及排序发生的阶段?

EatRice

腾云先锋 · 腾云先锋(TDP)成员 (已认证)

1)排序的分类: (1)部分排序: MapReduce根据输入记录的键对数据集排序。保证输出的每个文件内部排序。 (2)全排序: 如何用Hadoop产生一个全局排序的文件?最简单的方法是使用一个分区。...... 展开详请

ReduceTask工作机制?

请描述mapReduce中shuffle阶段的工作流程,如何优化shuffle阶段?

C++新手问题?

使用TBDS,出现NoClassDefFoundError?

hive mapreduce查询假死.?

如何搭建Hadoop处理环境?

asioc一个程序员
软件环境: 虚拟机:VMware Pro14 Linux:CentOS-6.4(下载地址,下载DVD版本即可) JDK:OpenJDK1.8.0 (强力建议不要使用 Oracle 公司的 Linux ...... 展开详请

使用mapreduce命令提示没有命令?

.这里拉拉人一枚!!!

hadoop的实验貌似挂了?

小Q

腾讯云 · 产品运营 (已认证)

让所有技术入门更容易
推荐

您好,我们重新 review 了 hadoop 实验教程的内容,这里的问题主要是因为 hadoop 2.7 版本要求 JDK 8 以上的版本,使用 JDK 7 就会有上述的 UnsupportedClassVersionError 异常,教程的内容我们已经修正,多谢您的反馈!

Hadoop是什么?怎么使用呢?

推荐
hadoop是分布式系统基础架构,MapReduce才是用于大规模数据集的并行运算,在说说云计算,云计算的这个概率太广泛了,100个人出来有一百种解释。再说说三种的区别,答案就是:这三个根本就不是同一...... 展开详请

扫码关注腾讯云开发者

领取腾讯云代金券