腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
让技术和时代并行
专栏作者
举报
388
文章
433371
阅读量
30
订阅数
订阅专栏
申请加入专栏
全部文章(388)
kubernetes(102)
java(44)
api(37)
容器(31)
linux(29)
容器镜像服务(25)
编程算法(22)
prometheus(20)
http(15)
go(14)
nginx(14)
devops(14)
安全(13)
web(13)
数据(13)
系统(13)
存储(12)
ip(12)
sql(11)
集群(11)
监控(11)
node.js(10)
数据库(10)
grafana(10)
部署(10)
工作(10)
jvm(9)
io(9)
it(9)
最佳实践(9)
hadoop(8)
bug(8)
deployment(8)
server(8)
服务(8)
架构(8)
配置(8)
性能(8)
负载均衡(7)
缓存(7)
jdk(7)
微服务(7)
服务网格(7)
istio(7)
kubectl(7)
yaml(7)
服务器(7)
工具(7)
互联网(7)
xml(6)
jar(6)
自动化(6)
网络安全(6)
大数据(6)
cpu(6)
service(6)
程序员(6)
实践(6)
json(5)
打包(5)
tomcat(5)
负载均衡缓存(5)
人工智能(5)
tcp/ip(5)
windows(5)
etcd(5)
max(5)
proxy(5)
测试(5)
开发(5)
内存(5)
日志(5)
软件(5)
性能优化(5)
html(4)
maven(4)
运维(4)
dns(4)
数据结构(4)
架构设计(4)
bit(4)
container(4)
db(4)
error(4)
redis(4)
root(4)
编程语言(4)
程序(4)
分布式系统(4)
软件开发(4)
线程(4)
php(3)
python(3)
android(3)
云数据库 SQL Server(3)
oracle(3)
github(3)
文件存储(3)
mongodb(3)
日志数据(3)
开源(3)
分布式(3)
ssh(3)
grep(3)
https(3)
性能测试(3)
amd(3)
assembly(3)
cli(3)
core(3)
default(3)
goroutine(3)
guava(3)
key(3)
mysql(3)
native(3)
pid(3)
ping(3)
port(3)
string(3)
tls(3)
操作系统(3)
插件(3)
产品(3)
服务端(3)
工具类(3)
管理(3)
解决方案(3)
进程(3)
镜像(3)
流量(3)
漏洞(3)
模型(3)
设计(3)
同步(3)
统计(3)
对象存储(2)
javascript(2)
ruby(2)
lua(2)
servlet(2)
云数据库 Redis(2)
ide(2)
spring(2)
神经网络(2)
深度学习(2)
mapreduce(2)
腾讯云测试服务(2)
企业(2)
压力测试(2)
爬虫(2)
正则表达式(2)
rpc(2)
udp(2)
jenkins(2)
云计算(2)
ipv6(2)
rust(2)
amazon(2)
aws(2)
break(2)
case(2)
client(2)
config(2)
dashboard(2)
dockerfile(2)
email(2)
exists(2)
fluent(2)
fluentd(2)
for循环(2)
free(2)
google(2)
host(2)
influxdb(2)
kill(2)
ldap(2)
mesh(2)
meta(2)
mq(2)
properties(2)
protobuf(2)
ps(2)
release(2)
requests(2)
return(2)
runtime(2)
security(2)
size(2)
static(2)
storage(2)
time(2)
wait(2)
wireshark(2)
编码(2)
编译(2)
低代码(2)
高性能(2)
工程师(2)
行业(2)
基础(2)
集合(2)
计算机科学(2)
加密(2)
客户端(2)
垃圾回收(2)
量化(2)
浏览器(2)
面试(2)
权限(2)
软件工程(2)
软件架构(2)
算法(2)
网络(2)
虚拟机(2)
异步(2)
异常(2)
硬件(2)
优化(2)
源码(2)
指针(2)
中间件(2)
其他(1)
c++(1)
bash(1)
jquery(1)
postgresql(1)
access(1)
mvc(1)
eclipse(1)
svn(1)
lucene/solr(1)
ubuntu(1)
centos(1)
apache(1)
bash 指令(1)
批量计算(1)
访问管理(1)
云数据库 MongoDB(1)
数据库一体机 TData(1)
cci 持续集成(1)
网站(1)
混合云解决方案(1)
黑客(1)
shell(1)
面向对象编程(1)
hashmap(1)
zookeeper(1)
自动化测试(1)
aop(1)
单元测试(1)
dubbo(1)
ddos(1)
socket编程(1)
lamp(1)
物联网(1)
安全漏洞(1)
系统架构(1)
kafka(1)
迁移(1)
groovy(1)
功能测试(1)
负载测试(1)
raft(1)
es(1)
零信任安全(1)
activemq(1)
agent(1)
akka(1)
algorithm(1)
apex(1)
app(1)
apply(1)
async(1)
asynchronous(1)
atom(1)
average(1)
azure(1)
bandwidth(1)
bitmap(1)
boot(1)
buffer(1)
build(1)
builder(1)
byte(1)
channel(1)
class(1)
clock(1)
code(1)
com(1)
command(1)
compare(1)
consul(1)
controller(1)
copy(1)
correlation(1)
count(1)
cron(1)
crud(1)
curl(1)
database(1)
date(1)
decode(1)
device(1)
dos(1)
druid(1)
dst(1)
elasticsearch(1)
endpoint(1)
excel(1)
exception(1)
execute(1)
executorservice(1)
facebook(1)
fastjson(1)
fedora(1)
file(1)
filter(1)
final(1)
flags(1)
flatbuffers(1)
fork(1)
gc(1)
gin(1)
gpt(1)
gzip(1)
haproxy(1)
hash(1)
heap(1)
histogram(1)
history(1)
hook(1)
hostname(1)
image(1)
init(1)
input(1)
int(1)
iot(1)
iptables(1)
ipv4(1)
jetty(1)
jira(1)
kibana(1)
limit(1)
line(1)
linkedin(1)
live(1)
local(1)
match(1)
memory(1)
messaging(1)
metrics(1)
min(1)
minikube(1)
mock(1)
modbus(1)
nagios(1)
nfs(1)
object(1)
offset(1)
ole(1)
operators(1)
owasp(1)
packet(1)
partial(1)
patch(1)
pdb(1)
pdf(1)
plugin(1)
point(1)
private(1)
profiler(1)
project(1)
public(1)
puppet(1)
pusher(1)
quartz(1)
queue(1)
replace(1)
request(1)
response(1)
ribbon(1)
route(1)
saas(1)
scheduler(1)
scheduling(1)
sdl(1)
select(1)
semaphore(1)
session(1)
sh(1)
socket(1)
sql语句(1)
src(1)
stdin(1)
summary(1)
super(1)
swap(1)
synchronized(1)
tcp(1)
tcpdump(1)
telnet(1)
thread(1)
thrift(1)
timeout(1)
traefik(1)
tree(1)
txt(1)
uber(1)
ui(1)
union(1)
url(1)
vi(1)
volume(1)
web3(1)
weblogic(1)
word(1)
worker(1)
xss(1)
youtube(1)
zip(1)
备份(1)
编程(1)
编辑器(1)
并发(1)
测试工具(1)
测试开发(1)
磁盘(1)
定时器(1)
定时任务(1)
动画(1)
多线程(1)
二进制(1)
工业互联网(1)
公有云(1)
关系型数据库(1)
后端(1)
后台(1)
后台开发(1)
混合云(1)
计算机(1)
计算机网络(1)
监控工具(1)
兼容性(1)
脚本(1)
接口(1)
接口文档(1)
可视化(1)
框架(1)
内核(1)
软件测试(1)
设计模式(1)
生命周期(1)
事件(1)
手机(1)
数据库设计(1)
数据中心(1)
搜索(1)
文件系统(1)
系统设计(1)
线程池(1)
协议(1)
芯片(1)
性能分析(1)
序列化(1)
需求分析(1)
压缩(1)
用户体验(1)
语法(1)
原理(1)
原型(1)
云安全(1)
主机(1)
注解(1)
状态机(1)
搜索文章
搜索
搜索
关闭
通过矩阵乘法来搞懂MapReduce?
mapreduce
2. 因为矩阵相乘是指行*列,故可以把第一个矩阵第一行记作A1和另一个矩阵的第一列记作B1,以下类推.....分别推送到一台服务器上去执行行列乘积,(这就对应于MapReduce中Map)如果这个矩阵的大小为100行*100列,那么我们就需要100台机器去并行执行每行每列的计算乘积。如下图:
用户5166556
2019-11-26
949
0
在hadoop上进行编写mapreduce程序,统计关键词在text出现次数
mapreduce
mapreduce的处理过程分为2个阶段,map阶段,和reduce阶段。在要求统计指定文件中的所有单词的出现次数时, map阶段把每个关键词写到一行上以逗号进行分隔,并初始化数量为1(相同的单词hadoop中的map会自动放到一行中) reduce阶段是把每个单词出现的频率统计出来重新写回去。
用户5166556
2019-04-16
1.3K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档