腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
机器学习与统计学
专栏作者
举报
792
文章
1086933
阅读量
96
订阅数
订阅专栏
申请加入专栏
全部文章
编程算法
机器学习
神经网络
python
深度学习
https
人工智能
网络安全
数据分析
r 语言
github
git
决策树
开源
numpy
模型
线性回归
matlab
tensorflow
数据
数据库
http
sql
大数据
云计算
pytorch
数据结构
scikit-learn
云数据库 SQL Server
监督学习
keras
windows
数据可视化
工作
函数
NLP 服务
c++
javascript
html
api
linux
网站
数据处理
数据挖掘
java
批量计算
腾讯云测试服务
gpt
论文
数学
性能
css
ide
文件存储
图像处理
缓存
爬虫
hadoop
卷积神经网络
markdown
kernel
anaconda
工具
统计
c 语言
php
bash
node.js
unix
mapreduce
容器
游戏
强化学习
正则表达式
机器人
学习方法
chatgpt
自动驾驶
go
bootstrap
命令行工具
yarn
shell
图像识别
scrapy
腾讯云开发者社区
plot
shift
测试
基础
技巧
数据科学
算法
优化
官方文档
actionscript
xml
json
云数据库 Redis
postgresql
打包
vba
搜索引擎
中文分词
apache
访问管理
视频处理
企业
serverless
存储
自动化
无人驾驶
hive
opencv
微信
fpga
特征工程
excel
jupyter
openai
precision
spss
变量
博客
部署
翻译
集合
教程
开发
设计
事件
视频
原理
字符串
云点播
对象存储
人脸识别
mac os
react
jquery
android
qt
单片机
oracle
nosql
flask
ubuntu
bash 指令
日志服务
TDSQL MySQL 版
数据库一体机 TData
音视频点播加速
SSL 证书
图片标签
机器翻译
大数据处理套件 TBDS
云推荐引擎
医疗
electron
分布式
运维
gui
面向对象编程
推荐系统
grep
tcp/ip
udp
无监督学习
安全
物联网
haskell
nest
sdn
聚类算法
jupyter notebook
ipv6
迁移
flink
程序人生
数据库管理
数据湖
汽车
alpha
altair
amp
app
axis
com
component
copy
correlation
csv
curve
data
difference
el
explorer
heatmap
int
kaggle
label
math
matrix
mean
meta
model
object
partial
pdf
pip
pivot
random
sample
scipy
self
solver
space
stack
subplot
subset
sum
table
title
txt
var
view
word
z3
遍历
编码
产品经理
程序员
对象
行业
互联网
计算机
脚本
开发者
可视化
框架
连接
命令行
入门
实践
手机
数组
搜索
索引
调试
图表
移动端
源码
语音助手
机器学习算法
玩转腾讯混元大模型
搜索文章
搜索
搜索
关闭
Python学习 Day 5 高阶函数 map/reduce filter sorter 返回函数 匿名函数 装饰器 偏函数
mapreduce
编程算法
python
>>> abs(-10) #把abs指向10后,无法通过abs(-10)调用该函数
统计学家
2019-04-10
316
0
将Hadoop作为基于云的托管服务的优劣势分析
hadoop
大数据
mapreduce
yarn
apache
Apache Hadoop是一种开源软件框架,能够对分布式集群上的大数据集进行高吞吐量处理。Apache模块包括Hadoop Common,这是一组常见的实用工具,可以通过模块来运行。这些模块还包括:Hadoop分布式文件系统(HDFS)、用于任务调度和集群资源管理的 Hadoop YARN以及Hadoop MapReduce,后者是一种基于YARN的系统,能够并行处理庞大的数据集。 Apache还提供了另外的开源软件,可以在Hadoop上运行,比如分析引擎Spark(它也能独立运行)和编程语言Pig。 Hadoop 之所以广受欢迎,就是因为它为使用大众化硬件处理大数据提供了一种几乎没有限制的环境。添加节点是个简单的过程,对这个框架没有任何负面影响。 Hadoop具有高扩展性,能够从单单一台服务器灵活扩展到成千上万台服务器,每个集群运行自己的计算和存储资源。Hadoop在应用程序层面提供了高可用性,所以集群硬件可以是现成的。 实际的使用场合包括:在线旅游(Hadoop声称它是80%的网上旅游预订业务的可靠的大数据平台)、批量分析、社交媒体应用程序提供和分析、供应链优化、移动数据管理、医疗保健及更多场合。 它有什么缺点吗? Hadoop很复杂,需要大量的员工时间和扎实的专业知识,这就阻碍了它在缺少专业IT人员的公司企业的采用速度。由于需要专家级管理员,加上广泛分布的集群方面需要庞大的成本支出,从中获得商业价值也可能是个挑战。I 集群管理也可能颇为棘手。虽然Hadoop统一了分布式计算,但是配备和管理另外的数据中心、更不用说与远程员工打交道,增添了复杂性和成本。结果就是,Hadoop集群可能显得过于孤立。
统计学家
2019-04-10
2K
0
【大数据名词4】yarn
hadoop
yarn
node.js
mapreduce
Yarn是Hadoop 自 0.23.0 版本后新的 map-reduce 框架(Yarn) 原理,优势,运作机制和配置方法等;着重介绍新的 yarn 框架相对于原框架的差异及改进;并通过 Demo 示例详细描述了在新的 yarn 框架下搭建和开发 hadoop 程序的方法。
统计学家
2019-04-10
271
0
【大数据名词3】MapReduce
mapreduce
数据处理
MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)",和它们的主要思想,都是从函数式编程语言里借来的,还有从矢量编程语言里借来的特性。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。 当前的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保证所有映射的键值对中的每一个共享相同的键组。
统计学家
2019-04-10
632
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档