首页
学习
活动
专区
工具
TVP
发布

挖掘大数据

专栏作者
113
文章
192735
阅读量
71
订阅数
零基础学习大数据,搭建Hadoop处理环境
由于Hadoop需要运行在Linux环境中,而且是分布式的,因此个人学习只能装虚拟机,本文都以VMware Workstation为准,安装CentOS7,具体的安装此处不作过多介绍,只作需要用到的知识介绍。
挖掘大数据
2018-01-19
3.4K3
时代的需要:越来越多的Java工程师开始转向hadoop?
Hadoop是Apache软件基金会的顶级开源项目,是由原雅虎公司Doug Cutting根据Google发布的学术论文而创建的开源项目。Doug Cutting被称为Hadoop之父,他打造了目前在云计算和大数据领域里如日中天的Hadoop。
挖掘大数据
2018-01-19
5170
Apache NiFi 简介及Processor实战应用
Apache NiFi是什么?NiFi官网给出如下解释:“一个易用、强大、可靠的数据处理与分发系统”。通俗的来说,即Apache NiFi 是一个易于使用、功能强大而且可靠的数据处理和分发系统,其为数据流设计,它支持高度可配置的指示图的数据路由、转换和系统中介逻辑。 为了对NiFi能够表述的更为清楚,下面通过NiFi的架构来做简要介绍,如下图所示。
挖掘大数据
2018-01-17
7.2K0
浅析Hadoop大数据分析与应用
为了满足日益增长的业务变化,京东的京麦团队在京东大数据平台的基础上,采用了Hadoop等热门的开源大数据计算引擎,打造了一款为京东运营和产品提供决策性的数据类产品-北斗平台。
挖掘大数据
2018-01-16
1.1K0
Apache Spark 黑名单机制介绍
在使用 Apache Spark的时候,作业会以分布式的方式在不同的节点上运行;特别是当集群的规模很大时,集群的节点出现各种问题是很常见的,比如某个磁盘出现问题等。我们都知道 Apache Spark是一个高性能、容错的分布式计算框架,一旦它知道某个计算所在的机器出现问题(比如磁盘故障),它会依据之前生成的 lineage 重新调度这个 Task。
挖掘大数据
2018-01-09
3.4K0
Hadoop3.0分布式集群安装知识
挖掘大数据
2018-01-08
1.9K0
大数据分析平台 Apache Spark详解
本文介绍了Apache Spark的四个主要应用场景,包括大数据处理、机器学习、图计算和流处理。Spark可以处理批量数据和流数据,并且提供了简单易用的API。同时,Spark还支持多种编程语言,包括Python、Java和Scala等,使得开发人员可以更加便捷地开发复杂的数据处理应用。
挖掘大数据
2017-12-27
2.8K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档