首页
学习
活动
专区
工具
TVP
发布

LanceToBigData

本人从事爬虫、java后端以及大数据相关的工作!
专栏作者
173
文章
288898
阅读量
60
订阅数
Hadoop(十五)MapReduce程序实例
一、统计好友对数(去重) 1.1、数据准备 joe, jon joe , kia joe, bob joe ,ali kia, joe kia ,jim kia, dee dee ,kia dee, ali ali ,dee ali, jim ali ,bob ali, joe ali ,jon jon, joe jon ,ali bob, joe bob ,ali b
用户1195962
2018-01-18
1.2K0
Hadoop(十六)之使用Combiner优化MapReduce
前言   前面的一篇给大家写了一些MapReduce的一些程序,像去重、词频统计、统计分数、共现次数等。这一篇给大家介绍的是关于Combiner优化操作。 一、Combiner概述 1.1、为什么需要Combiner   我们map任务处理的结果是存放在运行map任务的节点上。 map处理的数据的结果在进入reduce的时候,reduce会通过远程的方式去获取数据。   在map处理完数据之后,数据量特别大的话。reduce再去处理数据它就要通过网络去获取很多的数据。   这样会导致一个问题是:大量的数据
用户1195962
2018-01-18
1.4K0
Hadoop(十七)之MapReduce作业配置与Mapper和Reducer类
前言   前面一篇博文写的是Combiner优化MapReduce执行,也就是使用Combiner在map端执行减少reduce端的计算量。 一、作业的默认配置   MapReduce程序的默认配置 
用户1195962
2018-01-18
7340
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档