加米谷大数据

加米谷大数据实战经验分享,大数据项目分享,大数据开发培训等
217 篇文章
52 人订阅

Hive

加米谷大数据

Spark和Hadoop对比有什么区别?

Spark主要用于大数据的计算,而Hadoop以后主要用于大数据的存储。Spark+Hadoop,是目前大数据领域最热门的组合。

1223
加米谷大数据

hdfs hbase hive hbase分别的适用场景

不想用程序语言开发MapReduce的朋友,熟悉SQL的朋友可以使用Hive开离线的进行数据处理与分析工作。

782
加米谷大数据

大数据技术分享:Hadoop的相关工具

Apache的Hadoop项目已几乎与大数据划上了等号。它不断壮大起来,已成为一个完整的生态系统,众多开源工具面向高度扩展的分布式计算。

623
加米谷大数据

大数据技术分享:十大开源的大数据技术

大数据已然成为当今热门的技术之一,开源让越来越多的项目可以直接采用大数据技术,下面就来盘点受欢迎的十大开源的大数据技术。

1153
加米谷大数据

大数据开发常用的编程语言有哪些

如果你的数据科学家不使用R,他们可能就会彻底了解Python。如果你有一个需要NLP处理的项目,就会面临数量多得让人眼花缭乱的选择,包括经典的NTLK、使用G...

1111
加米谷大数据

大数据处理必备的十大工具

Hive是一个建立在Hadoop上的开源数据仓库基础设施,通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和...

1933
加米谷大数据

hdfs hbase hive hbase分别的适用场景

不想用程序语言开发MapReduce的朋友,熟悉SQL的朋友可以使用Hive开离线的进行数据处理与分析工作。

1362
加米谷大数据

Python连接Hive操作数据库

客户端连接Hive需要使用HiveServer2。HiveServer2是HiveServer的重写版本,HiveServer不支持多个客户端的并发请求。当前H...

6312
加米谷大数据

大数据技术hive介绍

1.hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,可以将sql语句转换为MapReduce...

2821
加米谷大数据

Hive的数据类型

本文介绍hive的数据类型,数据模型以及文件存储格式。这些知识大家可以类比关系数据库的相关知识。

1342
加米谷大数据

ZooKeeper在Hadoop中的应用

2052
加米谷大数据

技术分享 | 提升Hadoop性能和利用率你知道有哪些吗?

时下流行的词汇是大数据和Hadoop。了解大数据的知道Hadoop有三个组件,即HDFS、MapReduce和Yarn。 HDFS代表Hadoop分布式文件系统...

3545
加米谷大数据

技术干货 | Hive模式设计

过多使用分区可能导致非必须的Hadoop文件和文件夹,最终会超出NameNode对系统云数据信息的处理能力。 默认,每个task都是一个新的JVM实例,都需要开...

2875

扫码关注云+社区

领取腾讯云代金券