首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏成员
625
文章
934015
阅读量
106
订阅数
3 个常考的 SQL 数据分析题(含数据和代码)
SQL是数据分析必备的技能了,面对数据分析问题如何快速写出一手漂亮的SQL是初学者最大的难题,本篇分享3个常考数据分析题,摘自《SQL数据分析:从基础破冰到面试题解》一书中。
Python数据科学
2022-03-11
1.1K0
一起揭开 PySpark 编程的神秘面纱
在开始讲解PySpark程序启动原理之前,我们先来了解一下Spark的一些概念和特性。
Python数据科学
2021-09-29
1.6K0
风控中必做的数据分析
我的观点是风控和其他互联网业务都是互通的,本文介绍下风控中必做的数据分析,用以说明数据分析是一通百通的。
Python数据科学
2021-09-08
1.2K0
数据分析思维和方法:用户画像分析
我们经常在淘宝上购物, 作为淘宝方, 他们肯定想知道他的使用用户是什么样的, 是什么样的年龄性别, 城市, 收入, 他的购物品牌偏好, 购物类型, 平时的活跃程度是什么样的, 这样的一个用户描述就是用户画像分析。
Python数据科学
2021-02-01
1.5K0
分享 5 个免费的在线 SQL 数据库环境
今天给大家分享几个在线的免费 SQL 运行环境,也就是在线数据库。这些网站可以帮助我们快速运行一些 SQL 语句的测试或者验证,同时还可以在网络上进行分享,关键不需要自己安装数据库。
Python数据科学
2021-01-14
3.3K0
SQL:我为什么慢你心里没数吗?
SQL 语句执行慢的原因是面试中经常会被问到的,对于服务端开发来说也是必须要关注的问题。
Python数据科学
2020-12-31
8020
SQL中JOIN时条件放在Where和On的区别
SQL中JOIN子句是用于把来自两个或多个表的数据连接起来,在这个过程中可能会添加一些过滤条件。昨天有小伙伴问,如下图的这两种SQL写法查询结果是否会一样?(好像这是某一年阿里的面试题)
Python数据科学
2020-11-11
3.3K0
相见恨晚!OLAP数仓基础入门大全
导读:近七年在网易杭研一直从事数据库相关的开发工作,主要是MySQL和MongoDB这两种数据库,去年开始涉及图数据库Neo4J。上述几种,都可认为是OLTP类数据处理,由于工作需要,需要调研学习OLAP技术和相关系统,本文开始逐步进行第一轮总结,很多东西还只是片面理解,权当做个笔记。
Python数据科学
2020-09-30
8410
MySQL 证明为什么用limit时,offset很大会影响性能
链接:https://github.com/zhangyachen/zhangyachen.github.io/issues/117
Python数据科学
2020-01-16
1.1K2
今日GitHub热榜第一:最全中华古诗词数据库,收录30多万诗词
这个名为“chinese-poetry”、号称“最全中文诗歌古典文集数据库”的项目,今日登顶GitHub热榜第一。
Python数据科学
2019-12-31
7500
SQL干货 | 窗口函数的使用
Mysql从8.0版本开始,也和Sql Server、Oracle一样支持在查询中使用窗口函数,本文将根据官方文档,通过实例介绍窗口函数并举例分组排序函数的使用。
Python数据科学
2019-12-31
1.4K0
一次非常有趣的 SQL 优化经历
发现没有用到索引,type全是ALL,那么首先想到的就是建立一个索引,建立索引的字段当然是在where条件的字段了。
Python数据科学
2019-12-18
3500
避坑:8种常见SQL错误用法分享
分页查询是最常用的场景之一,但也通常也是最容易出问题的地方。比如对于下面简单的语句,一般 DBA 想到的办法是在 type, name, create_time 字段上加组合索引。这样条件排序都能有效的利用到索引,性能迅速提升。
Python数据科学
2019-12-09
7000
MySQL的COUNT语句,竟然都能被面试官虐的这么惨!?
数据库查询相信很多人都不陌生,所有经常有人调侃程序员就是CRUD专员,这所谓的CRUD指的就是数据库的增删改查。
Python数据科学
2019-12-09
6730
SQL语句大全,所有的SQL都在这里(1.5万字长文)
1、说明:创建数据库 CREATE DATABASE database-name
Python数据科学
2019-12-03
7150
数据湖如何为企业带来9%的高增长?可否取代数据仓库?
数据湖是一个集中的存储库,允许您以任何规模存储所有结构化和非结构化数据。您可以按原样存储数据,而不必首先构造数据,并运行不同类型的分析—从仪表板和可视化到大数据处理、实时分析和机器学习,以指导更好的决策。
Python数据科学
2019-11-28
8110
科技公司最爱的50款开源工具,你都用过吗?
本文介绍了多款知名的开源应用软件,科技公司可以用它们来管理自己的 IT 基础设施、开发产品。
Python数据科学
2019-11-27
5270
MySQL:数据库优化,可以看看这篇文章
数据库优化一方面是找出系统的瓶颈,提高MySQL数据库的整体性能,而另一方面需要合理的结构设计和参数调整,以提高用户的相应速度,同时还要尽可能的节约系统资源,以便让系统提供更大的负荷.
Python数据科学
2019-11-26
8950
8种最坑的SQL错误用法,第一个就很坑?
作者:程序员追风 链接:https://juejin.im/post/5dd15451e51d453b3d3d4329
Python数据科学
2019-11-23
7490
SQL 性能优化梳理
数据库通过锁机制来解决并发场景-共享锁(读锁)和排他锁(写锁)。读锁是不阻塞的,多个客户端可以在同一时刻读取同一个资源。写锁是排他的,并且会阻塞其他的读锁和写锁。简单提下乐观锁和悲观锁。
Python数据科学
2019-11-21
8510
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档