首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
872484
阅读量
105
订阅数
数据分析思维和方法:用户画像分析
我们经常在淘宝上购物, 作为淘宝方, 他们肯定想知道他的使用用户是什么样的, 是什么样的年龄性别, 城市, 收入, 他的购物品牌偏好, 购物类型, 平时的活跃程度是什么样的, 这样的一个用户描述就是用户画像分析。
Python数据科学
2021-02-01
1.5K0
SQL:我为什么慢你心里没数吗?
SQL 语句执行慢的原因是面试中经常会被问到的,对于服务端开发来说也是必须要关注的问题。
Python数据科学
2020-12-31
7770
相见恨晚!OLAP数仓基础入门大全
导读:近七年在网易杭研一直从事数据库相关的开发工作,主要是MySQL和MongoDB这两种数据库,去年开始涉及图数据库Neo4J。上述几种,都可认为是OLTP类数据处理,由于工作需要,需要调研学习OLAP技术和相关系统,本文开始逐步进行第一轮总结,很多东西还只是片面理解,权当做个笔记。
Python数据科学
2020-09-30
7960
记住没:永远不要在 MySQL 中使用 UTF-8!
最近我遇到了一个 bug,我试着通过 Rails 在以“utf8”编码的 MariaDB 中保存一个 UTF-8 字符串,然后出现了一个离奇的错误:
Python数据科学
2020-08-19
4990
MySQL 证明为什么用limit时,offset很大会影响性能
链接:https://github.com/zhangyachen/zhangyachen.github.io/issues/117
Python数据科学
2020-01-16
1.1K2
今日GitHub热榜第一:最全中华古诗词数据库,收录30多万诗词
这个名为“chinese-poetry”、号称“最全中文诗歌古典文集数据库”的项目,今日登顶GitHub热榜第一。
Python数据科学
2019-12-31
6910
一次非常有趣的 SQL 优化经历
发现没有用到索引,type全是ALL,那么首先想到的就是建立一个索引,建立索引的字段当然是在where条件的字段了。
Python数据科学
2019-12-18
3380
避坑:8种常见SQL错误用法分享
分页查询是最常用的场景之一,但也通常也是最容易出问题的地方。比如对于下面简单的语句,一般 DBA 想到的办法是在 type, name, create_time 字段上加组合索引。这样条件排序都能有效的利用到索引,性能迅速提升。
Python数据科学
2019-12-09
6320
MySQL的COUNT语句,竟然都能被面试官虐的这么惨!?
数据库查询相信很多人都不陌生,所有经常有人调侃程序员就是CRUD专员,这所谓的CRUD指的就是数据库的增删改查。
Python数据科学
2019-12-09
6630
SQL语句大全,所有的SQL都在这里(1.5万字长文)
1、说明:创建数据库 CREATE DATABASE database-name
Python数据科学
2019-12-03
6990
数据湖如何为企业带来9%的高增长?可否取代数据仓库?
数据湖是一个集中的存储库,允许您以任何规模存储所有结构化和非结构化数据。您可以按原样存储数据,而不必首先构造数据,并运行不同类型的分析—从仪表板和可视化到大数据处理、实时分析和机器学习,以指导更好的决策。
Python数据科学
2019-11-28
7620
科技公司最爱的50款开源工具,你都用过吗?
本文介绍了多款知名的开源应用软件,科技公司可以用它们来管理自己的 IT 基础设施、开发产品。
Python数据科学
2019-11-27
5100
MySQL:数据库优化,可以看看这篇文章
数据库优化一方面是找出系统的瓶颈,提高MySQL数据库的整体性能,而另一方面需要合理的结构设计和参数调整,以提高用户的相应速度,同时还要尽可能的节约系统资源,以便让系统提供更大的负荷.
Python数据科学
2019-11-26
8810
8种最坑的SQL错误用法,第一个就很坑?
作者:程序员追风 链接:https://juejin.im/post/5dd15451e51d453b3d3d4329
Python数据科学
2019-11-23
7370
SQL 性能优化梳理
数据库通过锁机制来解决并发场景-共享锁(读锁)和排他锁(写锁)。读锁是不阻塞的,多个客户端可以在同一时刻读取同一个资源。写锁是排他的,并且会阻塞其他的读锁和写锁。简单提下乐观锁和悲观锁。
Python数据科学
2019-11-21
8350
美团MySQL实时同步到数据仓库架构与实践
在数据仓库建模中,未经任何加工处理的原始业务层数据,我们称之为ODS(Operational Data Store)数据。在互联网企业中,常见的ODS数据有业务日志数据(Log)和业务DB数据(DB)两类。对于业务DB数据来说,从MySQL等关系型数据库的业务数据进行采集,然后导入到Hive中,是进行数据仓库生产的重要环节。
Python数据科学
2019-11-12
2.1K0
干货 | 整理一份详细的数据预处理方法
作者:lswbjtu https://zhuanlan.zhihu.com/p/51131210
Python数据科学
2019-11-12
1.1K0
SQL数据库的基础知识及使用!
数据库的约束:避免垃圾数据的产生,禁止非法的数据加入数据库中,保证数据库的结构良好
Python数据科学
2019-10-31
6660
推荐收藏 | 100个数据分析常用指标和术语
有个朋友是金融行业产品经理,最近在对已有的站内用户做分层与标签分类,需要对用户进行聚类分析。一般从事数据分析行业的朋友对这类词并不陌生,但是像市场运营人员就会把这类些名词概念搞混,导致结果不准确。数据分析相关概念多且杂,容易搞混。为了便于大家区分,今天小编就来盘点一下数据分析常用的术语解释。建议大家收藏起来方便查看。
Python数据科学
2019-10-10
7230
如何写得一手好SQL ?
链接 | cnblogs.com/xiaoyangjia/p/11267191.html
Python数据科学
2019-10-10
6300
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档