数据分析师必备技能SQL
在数据分析的整个流程中,数据获取是不可或缺的一环,那么作为数据分析师,我们不仅仅需要了解如何获取二手数据,还必须掌握如何从数据库中获取我们所需的一手数据。而事实上,在我面试过的数据分析师中,有部分分析师并没有掌握这项基本且重要的技能,以致于最终被淘汰,而这项基本且重要的技能就是会编写SQL。
SQL的基本概念和作用
SQL的基本概念:SQL是一种结构化查询语言(Structured Query Language),用于存取数据以及查询、更新和管理关系型数据库。对于专业的数据库管理员而言,需要掌握比较复杂的用法,但是对于数据分析师,掌握常用的SELECT查询命令即可。
SQL的作用:对于数据分析师而言,使用SQL的目的就是从数据库中获取所需要的源数据,便于后续的分析使用。
常用的SQL语法
常用语法有:
SELECT / FROM / WHERE / DISTINCT / AS / CASE WHEN / PARTITION BY/ROW_NUMBER / OVER / GROUP BY / ORDER BY / LEFT JOIN / RIGHT JOIN / INNER JOIN / ON / HAVING / IN / EXISTS / UNION / MAX / MIN / AVG / COUNT / SUM / SUBSTRING / CAST / SUB QUERY
举例:
SELECT
a.name,
b.sex,
b.age
FROM
table1 AS a
LEFT JOIN table2 AS b ON a.name = b.name
WHERE
b.sex = 0
AND b.age < 18
ORDER BY
a.name
SQL性能优化技巧
当我们用SQL获取想要的数据时,可能会遇到查询的速度比较慢的问题,这时我们需要考虑自己写的SQL脚本是否有优化的空间,常用的SQL性能优化技巧有:
尽量不要使用SELECT * , 想查哪个字段就写出哪个字段;
查询记录条数时,用COUNT(1)代替COUNT(字段名称);
WHERE后加限制条件时,将可以过滤较多数据记录的条件写在后面;
尽量不要使用全连接FULL JOIN;
LEFT JOIN时将大表作为主表;
避免在WHERE字句中使用IN、NOT IN 、OR、HAVING,可以使用EXISTS、NOT EXISTS代替。
本文仅介绍数据分析师常用的SQL基本语法,若想了解更多SQL的复杂用法,可网上搜索资料研究,也欢迎大家前来一起交流学习。
本文来自企鹅号 - 乐享数据媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文来自企鹅号 - 乐享数据媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。