加米谷大数据

加米谷大数据实战经验分享,大数据项目分享,大数据开发培训等
221 篇文章
52 人订阅

分布式

加米谷大数据

0基础大数据开发Hadoop要学习什么内容?

Hadoop是Apache开源组织的一个分布式基础框架,提供了一个分布式文件系统 (HDFS)、分布式计算(MapReduce)及统一资源管理框架(YARN)的...

832
加米谷大数据

Hadoop环境中管理大数据存储八大技巧

传统化集中式存储存在已有一段时间。但大数据并非真的适合集中式存储架构。Hadoop设计用于将计算更接近数据节点,同时采用了HDFS文件系统的大规模横向扩展功能。

1064
加米谷大数据

云计算的定义、类型及应用场景

通常来说,人们认可云计算作为一种计算方式,它允许通过互联网以“服务”的形式向外部用户交付灵活、可扩展的IT功能。其中有三个关键词:可扩展、服务和互联网,因此说...

1623
加米谷大数据

大数据开发的一些相关术语

一种项目对象模型,可以通过一小段描述信息来管理项目的各种依赖之间的关系,是一个项目管理工具软件。

671
加米谷大数据

Hadoop环境中管理大数据存储八大技巧

传统化集中式存储存在已有一段时间。但大数据并非真的适合集中式存储架构。Hadoop设计用于将计算更接近数据节点,同时采用了HDFS文件系统的大规模横向扩展功能。...

1923
加米谷大数据

java学习需要具备什么技能

很多人都想学习java编程技术,但是却不知道java学习需要具备什么技能,java本身就具备简单易学性和应用广泛性,下面一起看看java学习是需要具备什么技能。

872
加米谷大数据

大数据Hadoop入门需要填的坑

Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速...

1382
加米谷大数据

加米谷大数据携手成都商报财富沙龙第四期:区块链技术专题沙龙如期举行

6月28日下午,由成都商报主办、加米谷大数据机构和茂烨智能控股公司共同承办的大型全民公益活动——“商报财富沙龙”第四期如期顺利举行。

1262
加米谷大数据

Impala介绍

Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一...

2423
加米谷大数据

大数据基础之Spark

Spark 是 2010 年由 UC Berkeley AMPLab 开源的一款 基于内存的分布式计算框架,2013 年被Apache 基金会接管,是当前大数据...

992
加米谷大数据

什么是 Apache Spark?大数据分析平台详解

自从 Apache Spark 2009 年在 U.C. Berkeley 的 AMPLab 默默诞生以来,它已经成为这个世界上最重要的分布式大数据框架之一。S...

1523
加米谷大数据

Yarn的优点以及不足

将计算框架和底层存储调度分开,以支持更多的计算框架。在YARN中ApplicationMaster是一个可变更的部分,用户可以对不同的计算框架写自己的 AppM...

2701
加米谷大数据

ZooKeeper在HBase中的应用

2943
加米谷大数据

ZooKeeper在Hadoop中的应用

2152
加米谷大数据

大数据、人工智能与云计算的融合与应用

3547
加米谷大数据

技术分享 | Spark RDD详解

1、RDD是什么 RDD:Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这...

4355
加米谷大数据

加米谷:Kafka Connect如何运行管理

上节讲述了Kafka OffsetMonitor:监控消费者和延迟的队列,本节更详细的介绍如何配置,运行和管理Kafka Connect,有兴趣的请关注我们的公...

4207
加米谷大数据

Spark RDD详解 -加米谷大数据

1、RDD是什么 RDD:Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这...

4569

扫码关注云+社区

领取腾讯云代金券