腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
hadoop学习
专栏成员
举报
29
文章
31794
阅读量
15
订阅数
订阅专栏
申请加入专栏
全部文章(29)
hadoop(16)
大数据(13)
其他(5)
mapreduce(5)
开源(5)
分布式(5)
spark(5)
NLP 服务(4)
linux(4)
java(3)
编程算法(3)
sql(2)
神经网络(2)
深度学习(2)
云服务器(1)
.net(1)
node.js(1)
xml(1)
nosql(1)
jar(1)
tomcat(1)
搜索引擎(1)
ubuntu(1)
apache(1)
spring(1)
人工智能(1)
大数据解决方案(1)
http(1)
yarn(1)
存储(1)
自动化(1)
运维(1)
爬虫(1)
hive(1)
数据分析(1)
数据处理(1)
数据可视化(1)
云计算(1)
虚拟化(1)
搜索文章
搜索
搜索
关闭
学习Hadoop大数据基础框架
大数据
hadoop
开源
mapreduce
spark
什么是大数据?进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大约等于一百万字节)、GB(1024MB)、TB(1024GB),一直向上攀升,目前,PB(等于1024TB)级的数据系统已经很常见,随着移动个人数据、社交网站、科学计算、证券交易、网站日志、传感器网络数据量的不断加大,国内拥有的总数据量早已超出 ZB(1ZB=1024EB,1EB=1024PB)级别。
用户3392176
2018-11-14
574
0
什么是大数据技术架构
开源
大数据
分布式
数据分析
搜索引擎
大数据的应用开发过于偏向底层,具有学习难度大,涉及技术面广的问题,这制约了大数据的普及。现在需要一种技术,把大数据开发中一些通用的,重复使用的基础代码、算法封装为类库,降低大数据的学习门槛,降低开发难度,提高大数据项目的开发效率。
用户3392176
2018-11-14
1.5K
0
hadoop需要哪些技术支持
hadoop
mapreduce
spark
大数据
开源
hadoop是一个开源软件框架,可安装在一个商用机器集群中,使机器可彼此通信并协同工作,以高度分布式的方式共同存储和处理大量数据。最初,Hadoop 包含以下两个主要组件:Hadoop Distributed File System (HDFS) 和一个分布式计算引擎,该引擎支持以 MapReduce 作业的形式实现和运行程序。
用户3392176
2018-11-13
708
0
SQL与NoSQL数据库入门基础知识详解
大数据
开源
nosql
sql
hadoop
这几年的大数据热潮带动了一激活了一大批hadoop学习爱好者。有自学hadoop的,有报名培训班学习的。所有接触过hadoop的人都知道,单独搭建hadoop里每个组建都需要运行环境、修改配置文件测试等过程。对于我们这些入门级新手来说简直每个都是坑。国内的发行版hadoop那么多,似乎都没有来填这样的坑?不知道是没法解决,还是没有想到?
用户3392176
2018-10-23
595
0
hadoop发行版本之间的区别
apache
大数据
开源
hadoop
Hadoop是一个能够对大量数据进行分布式处理的软件框架。 Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。Hadoop的发行版除了有Apache hadoop外cloudera,hortonworks,mapR,华为,DKhadoop等都提供了自己的商业版本。商业发行版主要是提供了更为专业的技术支持,这对于大型企业更为重要,不同发行版都有自己的一些特点,本文就各发行版做简单对比介绍。
用户3392176
2018-09-18
1.4K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档