超哥的杂货铺

LV0
发表了文章

SQL中这些与NULL有关的细节,你知道吗?

NULL是SQL常见的关键字之一,表示“空,无”的意思。它在SQL中是一种独特的存在,今天来汇总一下与它相关的知识点,看看这些你都知道吗?

超哥的杂货铺
发表了文章

图解pandas模块21个常用操作

Pandas 是 Python 的核心数据分析支持库,提供了快速、灵活、明确的数据结构,旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Py...

超哥的杂货铺
数据结构Python数据分析
发表了文章

在一个机器学习项目中,你需要做哪些工作?

机器学习是通过对已有数据进行模型训练,再将训练好的模型应用于未知数据的过程。从这句话中我们可以看到几个关键要素:数据,模型,训练,应用。对于一个通常的机器学习项...

超哥的杂货铺
机器学习神经网络深度学习AI 人工智能特征工程
发表了文章

不再纠结,一文详解pandas中的map、apply、applymap、groupby、agg...

pandas提供了很多方便简洁的方法,用于对单列、多列数据进行批量运算或分组聚合运算,熟悉这些方法后可极大地提升数据分析的效率,也会使得你的代码更加地优雅简洁。...

超哥的杂货铺
数据处理
发表了文章

一场pandas与SQL的巅峰大战(七)

具体来讲,第一篇文章一场pandas与SQL的巅峰大战涉及到数据查看,去重计数,条件选择,合并连接,分组排序等操作。

超哥的杂货铺
SQLAlchemyMySQLPythonHive
发表了文章

RFM模型是什么?我用Tableau告诉你

本文来自于公众号读者投稿。作者Suke,数据爱好者,主攻方向:数据分析,数据产品化。

超哥的杂货铺
发表了文章

一场pandas与SQL的巅峰大战(六)

具体来讲,第一篇文章一场pandas与SQL的巅峰大战涉及到数据查看,去重计数,条件选择,合并连接,分组排序等操作。

超哥的杂货铺
MySQLSQL数据库
发表了文章

一场pandas与SQL的巅峰大战(五)

具体来讲,第一篇文章一场pandas与SQL的巅峰大战涉及到数据查看,去重计数,条件选择,合并连接,分组排序等操作。

超哥的杂货铺
HiveMySQLSQL数据库
发表了文章

一场pandas与SQL的巅峰大战(四)

具体来讲,第一篇文章一场pandas与SQL的巅峰大战涉及到数据查看,去重计数,条件选择,合并连接,分组排序等操作。

超哥的杂货铺
HiveMySQLSQL数据库
发表了文章

HDFS架构和基本操作学习

HDFS是hadoop实现的一个分布式文件系统。(Hadoop Distributed File System)来源于Google的GFS论文。它的设计目标有:

超哥的杂货铺
Hadoop
发表了文章

MacOS 下hive的安装与配置

之前的文章中我们提到了Hive是Hadoop生态系统中的重要的成员之一,允许用户使用类似SQL的方式,很方便地进行离线数据的统计分析。本节我们就在Hadoop集...

超哥的杂货铺
MySQLHive数据库SQL专用宿主机
发表了文章

hadoop中Yarn的配置与使用示例

前面我们学习了如何在Mac OS上进行hadoop的搭建,参考MAC OS搭建Hadoop伪分布式集群。hadoop2.0之后,出现了Yarn框架用于作业的调度...

超哥的杂货铺
YarnHadoop
发表了文章

分布式资源调度框架YARN

如图所示,1.x的架构也采用的是主从结构:即master-slaves架构,一个JobTracker带多个TaskTracker

超哥的杂货铺
Yarn
发表了文章

Hive安装配置的修正补充

在前面的文章MacOS 下hive的安装与配置中我们进行了Hive环境的配置。其中有一步是修改hive-env.sh,我们只修改了漏掉了该文件中的HADOOP_...

超哥的杂货铺
HiveNode.js
发表了文章

Hive基础学习

假设我们现在建立一张student表,它有两个字段,id(int)和name(string)。

超哥的杂货铺
敏感数据处理
发表了文章

Spark背景知识学习

这是来自Spark官网的描述(http://spark.apache.org/)。我们可以看到Spark是对大规模数据处理的一个统一分析引擎。有一种说法是:Sp...

超哥的杂货铺
sparkHadoopNoSQLSQL数据库
发表了文章

Jupyter notebook使用技巧大全

Jupyter Notebook是一款开源的web应用,它允许使用者创建和分享包含代码,公式,可视化图表和纯文本的文档,并支持多种编程语言的交互式计算,对于py...

超哥的杂货铺
Jupyter notebook开源MarkdownPython
发表了文章

你可能并不知道这样定制炫酷的jupyter主题

之前用多了mac,习惯了苹果“友好”的字体和界面,最近在windows上使用jupyter notebook的时候,总觉得界面不是很舒服,见下面的效果图,尤其是...

超哥的杂货铺
GitHubWindows开源GitJupyter notebook
发表了文章

MAC OS搭建Hadoop伪分布式集群

输出java版本 虽然默认已经将Java的路径配置到了系统环境变量中,但由于后续需要使用JAVA_HOME,我们最好将JAVA_HOME显式写入到系统的配置文件...

超哥的杂货铺
sshBashBash 指令Hadoop面向对象编程

个人简介

个人成就

  • 影响力总排行第 5194 名
  • 获得 52 次赞同
  • 文章被阅读 1.9K 次

扫码关注云+社区

领取腾讯云代金券