加米谷大数据

加米谷大数据实战经验分享,大数据项目分享,大数据开发培训等
217 篇文章
52 人订阅

SQL

加米谷大数据

0基础大数据开发Spark要学习什么内容?

Spark 是专为大规模数据处理而设计的快速通用的计算引擎。用来构建大型的、低延迟的数据分析应用程序。可用它来完成各种各样的运算,包括 SQL 查询、文本处理、...

852
加米谷大数据

Spark和Hadoop对比有什么区别?

Spark主要用于大数据的计算,而Hadoop以后主要用于大数据的存储。Spark+Hadoop,是目前大数据领域最热门的组合。

1103
加米谷大数据

关于大数据技术主要具有以下四个方面的特点

大数据可以实时地为企业撷取、管理、处理、整理数据,生成企业所需要的数据资料,因此大数据也蕴含着很高的商业价值,被称为“数字生产力”。所以越来越多的企业开始重视大...

903
加米谷大数据

大数据技术分享:十大开源的大数据技术

大数据已然成为当今热门的技术之一,开源让越来越多的项目可以直接采用大数据技术,下面就来盘点受欢迎的十大开源的大数据技术。

1103
加米谷大数据

大数据相关的职业岗位及主要工作内容

大数据正在改变全球商业运作方式,随着对合格大数据人才需求的增加,大数据行业的发展空间和待遇也越来越好,很多想转行大数据的入门学习者,不太清楚大数据的...

792
加米谷大数据

数据科学家和数据工程师有什么区别?

  本文介绍了什么是数据工程师、什么是数据科学家,以及二者之间的差别以及其不同的工作角色。

813
加米谷大数据

数据科学家的必备技能有哪些?

国外作者Jeff Hale浏览了一些求职网站,想找出哪些技能是数据科学家最需要掌握的技能,并对普通数据科学技能以及特定的语言和工具的特殊技能分别做了...

643
加米谷大数据

30个MySQL千万级大数据查询优化技巧

本文总结了30个mysql千万级大数据SQL查询优化技巧,特别适合大数据技术学习者。

1322
加米谷大数据

大数据处理必备的十大工具

Hive是一个建立在Hadoop上的开源数据仓库基础设施,通过Hive可以很容易的进行数据的ETL,对数据进行结构化处理,并对Hadoop上大数据文件进行查询和...

1893
加米谷大数据

Impala介绍

Impala 是一个高性能分析数据库,可针对存储在 Apache Hadoop 集群中的 PB 级数据进行闪电般快速的分布式 SQL 查询。Impala 还是一...

2173
加米谷大数据

Spark核心谈

在大数据领域,Spark平台因计算模型涵盖MapReduce,Streaming,SQL,Machine Learning,Graph等,为大数据计算提供一栈式...

1451
加米谷大数据

技术分享 | mongodb和redis和memcache你怎么选?

不同的Nosql,其实应用的场景各有不同,所以我们应该先了解不同Nosql之间的差别,然后分析什么才是最适合我使用的Nosql。 Nosql介绍 Nosql的全...

3918

扫码关注云+社区

领取腾讯云代金券