Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >使用hadoop mapreduce对数字进行排序

使用hadoop mapreduce对数字进行排序
EN

Stack Overflow用户
提问于 2014-01-07 07:19:06
回答 2查看 1.5K关注 0票数 1

数据如下所示,第一个字段是一个数字,11 20 11 78 20

我想根据第一个字段的数字对这些行进行排序,这意味着排序后应该是这样的,11 11 20 20 78

但hadoop给出了这样的结果: 11 20 78

EN

回答 2

Stack Overflow用户

发布于 2014-01-07 14:46:13

相同的键由相同的reducer处理。因此,11和11由相同的reducer处理。如果输出此缩减程序的关键字,则仅输出11一次。对于20也是如此。如果你只想输出11 11 20 20 78,那么执行以下操作:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
reduce(key, iterator values) {
    int counter = 0;
    while (values.hasNext()) {
        counter++;
        values.next();
    }
    for (int i =0; i < counter; ++i) {
        output.collect(key, <whatever>);
    }
}
票数 1
EN

Stack Overflow用户

发布于 2014-01-18 05:31:30

这是因为您没有迭代结果。缩减程序的输出将是一个键和一个值的list。要显示一个键的所有值,您需要遍历列表。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public void reducer(Text key ,Iterable<IntWritable> value, Context context) throws IOexception, InterruptedException{
    for(IntWritable number: value){
        context.write(key,number);
    }
}
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/20966057

复制
相关文章
Hadoop 使用 MapReduce 排序 思路
partition作用是将map的结果分发到多个Reduce上。当然多个reduce才能体现分布式的优势。
星哥玩云
2022/06/30
2120
Hadoop MapReduce 二次排序
package SecondarySort; import java.io.DataInput; import java.io.DataOutput; import java.io.IOException; import java.util.Set; import java.util.StringTokenizer; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.
小爷毛毛_卓寿杰
2019/02/13
4300
使用QCollat​​or对QStringList进行排序
  QCollator类根据排序规则算法比较字符串。以下例子是对QStringList进行数字优先且区分大小写比较排序。
Qt君
2023/03/17
2.9K0
使用QCollat​​or对QStringList进行排序
Hadoop - MapReduce
作者:tutorialspoint 译者:java达人 来源:https://www.tutorialspoint.com/hadoop/hadoop_mapreduce.htm(点击文末阅读原文前往
java达人
2018/01/31
9800
Hadoop - MapReduce
「  c语言使用起泡法对输入的10个数字进行排序  」
#include "stdio.h" main() { int a[10],min; printf("请输入10位数字:"); for (int i = 0; i <= 9; i++) { scanf("%d",&a[i]); } for (int j = 0; j < 9; j++) { for (int i = 0; i < 9-j ; i++) { if(a[i]<a[i+1]){ mi
青益
2023/01/03
1.7K0
Hadoop MapReduce 二次排序原理及其应用
关于二次排序主要涉及到这么几个东西: 在0.20.0 以前使用的是 setPartitionerClass setOutputkeyComparatorClass setOutputValueGroupingComparator  在0.20.0以后使用是 job.setPartitionerClass(Partitioner p); job.setSortComparatorClass(RawComparator c); job.setGroupingComparator
用户1177713
2018/02/24
1.2K0
Hadoop MapReduce 二次排序原理及其应用
Hadoop基础教程-第7章 MapReduce进阶(7.7 MapReduce 全排序)
MapReduce默认只是保证同一个分区内的Key是有序的,但是不保证全局有序。如果我们将所有的数据全部发送到一个Reduce,那么不就可以实现结果全局有序。所以前文7.6节二次排序已经实现了最终结果有序,也就是全排序。 MapReduce全排序的方法1: 每个map任务对自己的输入数据进行排序,但是无法做到全局排序,需要将数据传递到reduce,然后通过reduce进行一次总的排序,但是这样做的要求是只能有一个reduce任务来完成。
程裕强
2022/05/06
2300
Hadoop基础教程-第7章 MapReduce进阶(7.7 MapReduce 全排序)
python 使用pandas对csv文件进行排序
背景:使用jmeter的插件PerfMon生成的结果数据,需要获取到cpu的TOP 10.
小白will
2019/01/28
8K0
hadoop MapReduce编写一个分组统计并排序查询-排序
执行命令时注意参数位置,正确的执行命令应该是如下(假如打包的jar放在hadoop根目录下的mylib,jar名称为groutcount):
尚浩宇
2018/08/17
7750
hadoop MapReduce编写一个分组统计并排序查询-排序
python对字典进行排序
标准的python字典是无序的。即使对(键、值)对进行了排序,也无法以保留排序的方式将它们存储在dict中。
IT工作者
2022/07/07
1.9K0
使用hadoop进行大规模数据的全局排序
1. Hellow hadoop~~! Hadoop(某人儿子的一只虚拟大象的名字)是一个复杂到极致,又简单到极致的东西。 说它复杂,是因为一个hadoop集群往往有几十台甚至成百上千台low cost的计算机组成,你运行的每一个任务都要在这些计算机上做任务的分发,执行中间数据排序以及最后的汇总,期间还包含节点发现,任务的重试,故障节点替换等等等等的维护以及异常情况处理。谁叫hadoop集群往往都是由一些平民计算机组成,没事儿罢个工什么的,实在是再寻常不过的事情。 而说其简单,则是因为,上面说到的那些
CSDN技术头条
2018/02/09
1.6K0
使用hadoop进行大规模数据的全局排序
Delphi对TStrings进行排序
最近在做一个Delphi的对接第三方支付的接口,接口签名机制模仿微信的签名方式,把参数按ascii码进行排序后再加上key进行md5的加密,因为调用接口的的Post里面的参数是TStrings类型的,但是在TStrings类型里面没有Sorted排序这个方法。所以我自己重写了一个函数用于处理这个。
Vaccae
2019/07/25
1.4K0
MapReduce排序
MapReduce排序是一种常用的数据排序算法,它将数据划分为若干个分区,并将每个分区内的数据排序。最终,将每个分区内排好序的数据合并成一个有序的输出结果。在MapReduce中,排序通常用于数据预处理、数据统计和数据挖掘等领域。
堕落飞鸟
2023/05/12
4590
对map集合进行排序
今天做统计时需要对X轴的地区按照地区代码(areaCode)进行排序,由于在构建XMLData使用的map来进行数据统计的,所以在统计过程中就需要对map进行排序。
java思维导图
2018/11/30
1.8K0
对map集合进行排序
使用Python语言写Hadoop MapReduce程序
在了解到Hadoop的生态环境以及Hadoop单机模式和伪分布式模式安装配置之后,我们可以使用自己熟悉的语言来编写Hadoop MapReduce程序,进一步了解MapReduce编程模型。
职场亮哥
2020/10/10
4.6K0
直播案例 | 使用PageRank对全球机场进行排序
PageRank 是谷歌公司起家的算法,在数据科学领域具有重要的地位和作用。PageRank 算法最初提出来用于利用网页之间的链接关系来对网页进行排序,从而优化搜索引擎的效果。如今,我们可以将 PageRank 算法用作网络中节点排序的一般算法。
数据酷客
2020/05/18
2.6K0
直播案例 | 使用PageRank对全球机场进行排序
LUA对Map进行排序
Lua中最常见的数据结构就是Table, 用Table表示Map很容易, 但早期Lua没有提供一个针对Map数据结构的排序方法,下面用Moonscript实现了一个Map型数据结构排序函数方法。
糖果
2019/11/20
3.4K0
使用asort函数对PHP数组进行升序排序
PHP是一门功能强大的语言,数组是PHP中十分常用的数据结构之一。在实际开发中,经常需要对数组进行排序。PHP提供了多个函数用于对数组进行排序,其中asort函数可以实现对数组进行升序排序。
很酷的站长
2023/08/25
4800
使用asort函数对PHP数组进行升序排序
Hadoop(十六)之使用Combiner优化MapReduce
  前面的一篇给大家写了一些MapReduce的一些程序,像去重、词频统计、统计分数、共现次数等。这一篇给大家介绍的是关于Combiner优化操作。
大道七哥
2019/09/10
5010
Hadoop(十六)之使用Combiner优化MapReduce
Hadoop MapReduce简介
MapReduce作业(job)通常将输入数据集拆分为独立的块,这些块由map任务(map tasks)以完全并行的方式处理。框架对maps的输出(outputs)排序,然后输入到reduce 任务(reduce tasks)。通常,作业的输入和输出都存储在文件系统中。该框架负责调度任务,监控它们并重新执行失败的任务。
WindCoder
2020/01/21
7180

相似问题

使用MapReduce/Hadoop对大数据进行排序

60

使用Hadoop MapReduce进行排序字数统计

31

Hadoop MapReduce排序级别

13

如何使用MapReduce对键、值对进行排序?

121

使用Hadoop MapReduce进行图像处理

14
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文