深度学习之tensorflow实战篇-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

深度学习之tensorflow实战篇

专栏成员

604

文章

1478118

阅读量

84

订阅数

mongodb11天之屠龙宝刀（六）mapreduce：mongodb中mapreduce原理与操作案例

数据库 mongodb sql 云数据库 MongoDB mapreduce

mongodb11天之屠龙宝刀（六）mapreduce：mongodb中mapreduce原理与操作案例原文连接：直通车

2019-02-14

9400

python高阶函数：map(f,[list]),reduce(f,[list],可选初始值)，

mapreduce python

map，reduce和filter三个函数在python3和python2中发生了较大的差异。具体请看文章后面部分。 1. python的map()函数 2. python的reduce()函数 3. python的lambda()函数

2019-02-14

7100

hive排序：distribute by 、sort by 、cluster by 、order by 区别

3 . 总结分析 1). order by 只有一个reduce负责对所有的数据进行排序，若大数据量，则需要较长的时间。建议在小的数据集中使用order by 进行排序。 2). order by 可以通过设置hive.mapred.mode参数控制执行方式，若选择strict，则order by 则需要指定limit（若有分区还有指定哪个分区）；若为nostrict，则与关系型数据库差不多。 3). sort by 基本上不受hive.mapred.mode影响，可以通过mapred.reduce.task 指定reduce个数，查询后的数据被分发到相关的reduce中。 4). sort by 的数据在进入reduce前就完成排序，如果要使用sort by 是行排序，并且设置map.reduce.tasks>1,则sort by 才能保证每个reducer输出有序，不能保证全局数据有序。 5). distribute by 采集hash算法，在map端将查询的结果中hash值相同的结果分发到对应的reduce文件中。 6). distribute by 可以使用length方法会根据string类型的长度划分到不同的reduce中，最终输出到不同的文件中。 length 是内建函数，也可以指定其他的函数或这使用自定义函数。 7). cluster by 除了distribute by 的功能外，还会对该字段进行排序，所以cluster by = distribute by +sort by 。

2019-02-14

1.2K0

pangrank算法--PageRank算法并行实现

编程算法 mapreduce r 语言存储

Google通过PageRank算法模型，实现了对全互联网网页的打分。但对于海量数据的处理，在单机下是不可能实现，所以如何将PageRank并行计算，将是本文的重点。

2019-02-13

1.3K0

mongodb11天之屠龙宝刀（六）mapreduce：mongodb中mapreduce原理与操作案例

mongodb mapreduce java

mongodb11天之屠龙宝刀（六）mapreduce：mongodb中mapreduce原理与操作案例一 Map/Reduce简介 MapReduce 是Google公司的核心模型，用于大规模数据集(大于1TB）的并行计算。“映射（Map)”与“化简（Reduce)”的概念是它们的主要思想。MapReduce使用JavaScript作为“查询语言”，能够在多台服务器之间并行执行。MapReduce将负责的运行于大规模集群上的并行计算过程高度地抽象为两个函数(Map和Reduce),利用一个输入<

2018-03-19

2K0

没有更多了

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态