前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析师必备的数据提取技能

数据分析师必备的数据提取技能

作者头像
企鹅号小编
发布2018-02-07 16:44:40
1.7K1
发布2018-02-07 16:44:40
举报
文章被收录于专栏:企鹅号快讯企鹅号快讯

数据分析师必备技能SQL

在数据分析的整个流程中,数据获取是不可或缺的一环,那么作为数据分析师,我们不仅仅需要了解如何获取二手数据,还必须掌握如何从数据库中获取我们所需的一手数据。而事实上,在我面试过的数据分析师中,有部分分析师并没有掌握这项基本且重要的技能,以致于最终被淘汰,而这项基本且重要的技能就是会编写SQL。

SQL的基本概念和作用

SQL的基本概念:SQL是一种结构化查询语言(Structured Query Language),用于存取数据以及查询、更新和管理关系型数据库。对于专业的数据库管理员而言,需要掌握比较复杂的用法,但是对于数据分析师,掌握常用的SELECT查询命令即可。

SQL的作用:对于数据分析师而言,使用SQL的目的就是从数据库中获取所需要的源数据,便于后续的分析使用。

常用的SQL语法

常用语法有:

SELECT / FROM / WHERE / DISTINCT / AS / CASE WHEN / PARTITION BY/ROW_NUMBER / OVER / GROUP BY / ORDER BY / LEFT JOIN / RIGHT JOIN / INNER JOIN / ON / HAVING / IN / EXISTS / UNION / MAX / MIN / AVG / COUNT / SUM / SUBSTRING / CAST / SUB QUERY

举例:

SELECT

a.name,

b.sex,

b.age

FROM

table1 AS a

LEFT JOIN table2 AS b ON a.name = b.name

WHERE

b.sex = 0

AND b.age < 18

ORDER BY

a.name

SQL性能优化技巧

当我们用SQL获取想要的数据时,可能会遇到查询的速度比较慢的问题,这时我们需要考虑自己写的SQL脚本是否有优化的空间,常用的SQL性能优化技巧有:

尽量不要使用SELECT * , 想查哪个字段就写出哪个字段;

查询记录条数时,用COUNT(1)代替COUNT(字段名称);

WHERE后加限制条件时,将可以过滤较多数据记录的条件写在后面;

尽量不要使用全连接FULL JOIN;

LEFT JOIN时将大表作为主表;

避免在WHERE字句中使用IN、NOT IN 、OR、HAVING,可以使用EXISTS、NOT EXISTS代替。

本文仅介绍数据分析师常用的SQL基本语法,若想了解更多SQL的复杂用法,可网上搜索资料研究,也欢迎大家前来一起交流学习。

本文来自企鹅号 - 乐享数据媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 乐享数据媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档