加米谷大数据

加米谷大数据实战经验分享,大数据项目分享,大数据开发培训等
217 篇文章
52 人订阅

Apache

加米谷大数据

Hadoop的发家简史

说到大数据技术不得不提起Hadoop,今天加米谷大数据就来简单介绍一下Hadoop的简史。

913
加米谷大数据

大数据技术分享:Hadoop的相关工具

Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。

603
加米谷大数据

大数据技术分享:十大开源的大数据技术

大数据已然成为当今热门的技术之一,开源让越来越多的项目可以直接采用大数据技术,下面就来盘点受欢迎的十大开源的大数据技术。

1103
加米谷大数据

大数据处理必备的十大工具

Hive是一个建立在Hadoop上的开源数据仓库基础设施,通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和...

1893
加米谷大数据

大数据Hadoop入门需要填的坑

Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速...

1322
加米谷大数据

比拼生态和未来,Spark和Flink哪家强?

Spark 是最活跃的 Apache 项目之一。Spark 的开源社区一度达到上千的活跃贡献者。最主要推动者是 Databricks,由最初的 Spark 创...

882
加米谷大数据

容易搞混大数据分析学习的工具

大数据已成为当今企业不可分割的一部分,越来越多的企业纷纷寻找熟悉大数据分析工具的人。他们都期望员工在技术方面体现能力,并展示才华和思维过程。到目前为...

932
加米谷大数据

Impala介绍

Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一...

2173
加米谷大数据

Flume的高可靠,高性能和高扩展性

Flume 是Apache旗下的一款开源、高可靠、高扩展、容易管理、支持客户扩展的数据采集系统。 Flume使用JRuby来构建,所以依赖Java运行环境。

1012
加米谷大数据

什么是 Apache Spark?大数据分析平台详解

自从 Apache Spark 2009 年在 U.C. Berkeley 的 AMPLab 默默诞生以来,它已经成为这个世界上最重要的分布式大数据框架之一。S...

1503
加米谷大数据

【活动回顾】成都理工信科院大数据技术讲座

981
加米谷大数据

技术分享 | kafka的使用场景以及生态系统

kafka的使用场景 今天介绍一些关于Apache kafka 流行的使用场景。这些领域的概述 消息 kafka更好的替换传统的消息系统,消息系统被用于各种场景...

8958
加米谷大数据

技术分享 | spark之广播变量设计和实现

spark 广播的方式 spark 历史上采用了两种广播的方式 一种是通过 Http 协议传输数据 一种是通过 Torrent 协议来传输数据 但是最新的 sp...

3574
加米谷大数据

技术分享 | Apache Kafka下载与安装启动

壹 下载 注意:别下成源文件了! 带src的是源文件,如: Source download: kafka-0.10.1.0-src.tgz (asc, md5)...

3645
加米谷大数据

技术干货 | Hadoop3.0稳定版安装攻略来啦!

第一次安装Apache Hadoop3.0.0是不是状况百出?没关系安装攻略来啦! ? Apache Hadoop 3.0.0在前一个主要发行版本(hadoop...

4999
加米谷大数据

技术干货 | hadoop之hdfs安全模式

namenode启动时,首先将映像文件(fsimage)载入内存,并中兴编辑日志中的各项操作。一旦在内存中成功建立文件系统元数据的映像,则创建一个新的fsima...

3706

扫码关注云+社区

领取腾讯云代金券