腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
深度学习之tensorflow实战篇
专栏作者
举报
604
文章
1403564
阅读量
84
订阅数
订阅专栏
申请加入专栏
全部文章
python
编程算法
数据库
sql
r 语言
mongodb
云数据库 SQL Server
其他
http
机器学习
linux
人工智能
神经网络
html
深度学习
hive
https
java
大数据
numpy
云数据库 MongoDB
windows
NLP 服务
django
网络安全
hadoop
数据结构
tensorflow
github
决策树
ide
git
数据分析
数据处理
javascript
bash
json
开源
数据挖掘
node.js
ubuntu
线性回归
go
bash 指令
shell
anaconda
xml
windows server
mapreduce
爬虫
spark
正则表达式
云数据库 Redis
存储
text
c 语言
c++
oracle
nosql
ruby on rails
api
jar
中文分词
nginx
腾讯云测试服务
分布式
html5
ssh
sql server
监督学习
推荐系统
csv
data
label
list
sort
txt
博客
字符串
区块链
php
c#
css
access
打包
unix
apt-get
批量计算
文件存储
访问管理
云推荐引擎
网站
xslt & xpath
jdk
gui
ftp
grep
pytorch
db
dot
edge
file
graph
header
igraph
integer
key
max
min
plot
poi
sample
scale
size
stdout
sum
time
集合
开发
日志
调试
终端
费用中心
官方文档
ios
.net
jsp
scala
单片机
sqlalchemy
eclipse
matlab
搜索引擎
centos
日志服务
命令行工具
NAT 网关
数据加密服务
电商
企业
容器
缓存
运维
压力测试
数据迁移
jvm
yum
面向对象编程
hashmap
keras
二叉树
tcp/ip
单元测试
kernel
scikit-learn
socket编程
kerberos
系统架构
nat
kafka
特征工程
聚类算法
unicode
腾讯云图数据可视化
数据库管理
add
app
apple
apply
axis
bayesian
bi
bit
blob
boolean
break
browser
center
character
cmd
code
codec
configuration
copy
count
counter
criteria
database
default
desktop
distance
distribution
driver
encode
encoding
error
excel
exists
flags
flatten
frame
frequency
gaussian
ggplot2
global
handle
hash
input
instance
int
lapply
limit
line
map
median
multiprocessing
na
normalization
pandas
path
pool
predict
probability
proc
ps
pycharm
random
reduce
require
root
sampling
scanf
server
slice
static
sudo
table
tar
tensor
transpose
typeerror
union
vector
version
view
width
word
word2vec
xgboost
zip
笔记
编程
遍历
编码
程序
登录
递归
函数
加密
解决方案
快捷键
连接
数据
数据中心
数组
索引
虚拟机
压缩
优化
语法
原理
搜索文章
搜索
搜索
关闭
mongodb11天之屠龙宝刀(六)mapreduce:mongodb中mapreduce原理与操作案例
数据库
mongodb
sql
云数据库 MongoDB
mapreduce
mongodb11天之屠龙宝刀(六)mapreduce:mongodb中mapreduce原理与操作案例 原文连接:直通车
学到老
2019-02-14
911
0
python高阶函数:map(f,[list]),reduce(f,[list],可选初始值),
mapreduce
python
map,reduce和filter三个函数在python3和python2中发生了较大的差异。具体请看文章后面部分。 1. python的map()函数 2. python的reduce()函数 3. python的lambda()函数
学到老
2019-02-14
686
0
hive排序:distribute by 、sort by 、cluster by 、order by 区别
mapreduce
3 . 总结分析 1). order by 只有一个reduce负责对所有的数据进行排序,若大数据量,则需要较长的时间。建议在小的数据集中使用order by 进行排序。 2). order by 可以通过设置hive.mapred.mode参数控制执行方式,若选择strict,则order by 则需要指定limit(若有分区还有指定哪个分区) ;若为nostrict,则与关系型数据库差不多。 3). sort by 基本上不受hive.mapred.mode影响,可以通过mapred.reduce.task 指定reduce个数,查询后的数据被分发到相关的reduce中。 4). sort by 的数据在进入reduce前就完成排序,如果要使用sort by 是行排序,并且设置map.reduce.tasks>1,则sort by 才能保证每个reducer输出有序,不能保证全局数据有序。 5). distribute by 采集hash算法,在map端将查询的结果中hash值相同的结果分发到对应的reduce文件中。 6). distribute by 可以使用length方法会根据string类型的长度划分到不同的reduce中,最终输出到不同的文件中。 length 是内建函数,也可以指定其他的函数或这使用自定义函数。 7). cluster by 除了distribute by 的功能外,还会对该字段进行排序,所以cluster by = distribute by +sort by 。
学到老
2019-02-14
1.1K
0
pangrank算法--PageRank算法并行实现
编程算法
mapreduce
r 语言
存储
Google通过PageRank算法模型,实现了对全互联网网页的打分。但对于海量数据的处理,在单机下是不可能实现,所以如何将PageRank并行计算,将是本文的重点。
学到老
2019-02-13
1.2K
0
mongodb11天之屠龙宝刀(六)mapreduce:mongodb中mapreduce原理与操作案例
mongodb
mapreduce
java
mongodb11天之屠龙宝刀(六)mapreduce:mongodb中mapreduce原理与操作案例 一 Map/Reduce简介 MapReduce 是Google公司的核心模型,用于大规模数据集(大于1TB)的并行计算。“映射(Map)”与“化简(Reduce)”的概念是它们的主要思想。MapReduce使用JavaScript作为“查询语言”,能够在多台服务器之间并行执行。MapReduce将负责的运行于大规模集群上的并行计算过程高度地抽象为两个函数(Map和Reduce),利用一个输入<
学到老
2018-03-19
2K
0
没有更多了
社区活动
Python精品学习库
代码在线跑,知识轻松学
点击查看
热点技术征文第五期
新风口Sora来袭,普通人该如何把握机会?
立即参加
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档