用户6882390

文章/答案/技术大牛

发布

LV0

我关注的人

PySpark教程：使用Python学习Apache Spark

在以如此惊人的速度生成数据的世界中，在正确的时间对数据进行正确分析非常有用。实时处理大数据并执行分析的最令人惊奇的框架之一是Apache Spark，如果我们谈...

February 2018-11-262018-11-26 15:17:35

spark、apache、python、大数据

SparkSql读取hive表tblproperties异常

从报错来看，该hive表的tblproperites有问题，tblproperites中的json字段无法正常解析，导致SparkSql读取该表出错。Hive和...

Fayson 2020-03-102020-03-10 17:53:54

hive

0761-7.0.3-如何使用YARN Queue Manager UI配置集群资源

在CDP DC上，YARN资源的调度程序默认为Capacity Scheduler。我们可以通过YARN Queue Manager UI来界面化配置YARN的...

Fayson 2020-04-212020-04-21 11:36:55

访问管理、编程算法、yarn、node.js、网络安全

Hive架构及Hive On Spark

(1)Table:每个表都对应在HDFS中的目录下，数据是经过序列化后存储在该目录中。同时Hive也支持表中的数据存储在其他类型的文件系统中，如NFS或本地文件...

用户3003813 2018-09-062018-09-06 13:12:15

hive、spark、存储

如何使用Python Impyla客户端连接Hive和Impala

继上一章讲述如何在CDH集群安装Anaconda&搭建Python私有源后，本章节主要讲述如何使用Pyton Impyla客户端连接CDH集群的HiveServ...

Fayson 2018-04-012018-04-01 19:11:21

hive、编程算法、数据库、sql

Python书单：涉及 Python 基础、数据分析、机器学习、Web 开发等方向。

关注我的朋友可能很多都是学习 Python、爬虫、Web、数据分析、机器学习相关的。当然大家可能接触某个方向的时间不一样，可能有的同学已经对某个方向特别精通，有...

一墨编程学习 2019-08-082019-08-08 09:56:10

python、数据分析、爬虫、网站

Python 爬虫新手教程：12306抢票，开源代码！

今天就和大家一起来讨论一下python实现12306余票查询（pycharm+python3.7），一起来感受一下python爬虫的简单实践我们说先在浏览器...

一墨编程学习 2019-08-062019-08-06 15:05:32

爬虫、python、https、网络安全

聊Python小白如何系统自学成为Python大牛（上）

很多人在自学Python的时候，总是不知道如何学习，不知道该怎么学，今天看到框架，就想学flask或者其他框架，但是当学的时候又茫然了，不知道怎么学；想学Pyt...

一墨编程学习 2019-08-202019-08-20 10:48:29

python、ide、其他

最全面的Pandas的教程！没有之一!

Pandas 是基于 NumPy 的一个开源 Python 库，它被广泛用于快速分析数据，以及数据清洗和准备等工作。它的名字来源是由“ Panel data”（...

一墨编程学习 2019-04-272019-04-27 21:02:39

数据库、数据结构、sql

我的Python分析成长之路9

统计分析是数据分析的重要组成部分，它几乎贯穿整个数据分析的流程。运用统计方法，将定量与定性结合，进行的研究活动叫做统计分析。而pandas是统计分析的重要库。

py3study 2020-02-102020-02-10 23:02:34

编程算法、python、css、数据分析

Spark 伪分布式 & 全分布式安装指南

0、前言 3月31日是 Spark 五周年纪念日，从第一个公开发布的版本开始，Spark走过了不平凡的5年：从刚开始的默默无闻，到13年的鹊起，14年的大爆发...

用户1177713 2018-02-242018-02-24 17:01:48

spark、分布式

用户画像从入门到挖坑

背景用户流量从搜索引擎为入口的增量时代到移动互联网普及人口红利不再的存量时代，这个变化对每个公司的获客成本，运营思路都产生了很大的影响，在流量日益枯竭，获客成...

用户1177713 2018-02-242018-02-24 17:47:52

编程算法、大数据、数据挖掘、数据分析、聚类算法

【推荐收藏】倾心整理的Python量化资源大合集

随着Python编程语言的流行和普及，越来越多人对如何应用Python做金融数据分析和量化交易充满兴趣。但是不少人对量化投资本身存在一定的误解或认识不清，有的人...

量化小白 2020-02-242020-02-24 13:55:22

python、https、http、大数据

Hive 入门

Hive 的底层执行引擎有：MapReduce，Tez，Spark - Hive on MapReduce - Hive on Tez - Hive o...

Meet相识 2018-09-122018-09-12 16:37:27

其他

Hive高级优化

1，FetchTask 不执行mapreduce，提高速度设置的三种方式：方法一： set hive.fetch.task.conversion=mo...

Spark学习技巧 2018-01-312018-01-31 12:59:09

hive

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2020-01-08

个人成就

TA 很懒，什么都没有留下╮（╯＿╰）╭

关注了：17关注者：0

用户6882390

PySpark教程：使用Python学习Apache Spark

SparkSql读取hive表tblproperties异常

0761-7.0.3-如何使用YARN Queue Manager UI配置集群资源

Hive架构及Hive On Spark

如何使用Python Impyla客户端连接Hive和Impala

Python书单：涉及 Python 基础、数据分析、机器学习、Web 开发等方向。

Python 爬虫新手教程：12306抢票，开源代码！

聊Python小白如何系统自学成为Python大牛（上）

最全面的Pandas的教程！没有之一!

我的Python分析成长之路9

Spark 伪分布式 & 全分布式安装指南

用户画像从入门到挖坑

【推荐收藏】倾心整理的Python量化资源大合集

Hive 入门

Hive高级优化

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

用户6882390

PySpark教程：使用Python学习Apache Spark

SparkSql读取hive表tblproperties异常

0761-7.0.3-如何使用YARN Queue Manager UI配置集群资源

Hive架构及Hive On Spark

如何使用Python Impyla客户端连接Hive和Impala

Python书单：涉及 Python 基础、数据分析、机器学习、Web 开发等方向。

Python 爬虫新手教程：12306抢票，开源代码！

聊Python小白如何系统自学成为Python大牛（上）

最全面的Pandas的教程！没有之一!

我的Python分析成长之路9

Spark 伪分布式 & 全分布式 安装指南

用户画像从入门到挖坑

【推荐收藏】倾心整理的Python量化资源大合集

Hive 入门

Hive高级优化

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

Spark 伪分布式 & 全分布式安装指南