Python数据科学

474 篇文章
85 人订阅

全部文章

用户2769421

数据科学实战:保险产品交叉销售预测分析

今天的内容是一期Python实战训练,我们来手把手教你用Python分析保险产品交叉销售和哪些因素有关。

2610
用户2769421

留存率案例:数据指标体系的构建

经常会听到互联网人形容一个产品的体量和知名度用活跃用户来衡量,比如:“微信的日活接近10亿了,真社交巨兽。”

5310
用户2769421

安利3个Python数据分析EDA神器!

EDA是数据分析必须的过程,用来查看变量统计特征,可以此为基础尝试做特征工程。东哥这次分享3个EDA神器,其实之前每一个都分享过,这次把这三个工具包汇总到一起来...

6430
用户2769421

Python空间+气泡图完美绘制房价分布

今天的推文教程使用geopandas进行空间图表的绘制(geopandas空间绘图很方便,省去了很多的数据处理过程,而且也完美衔接matplotlib,学习py...

7320
用户2769421

SQL中JOIN时条件放在Where和On的区别

SQL中JOIN子句是用于把来自两个或多个表的数据连接起来,在这个过程中可能会添加一些过滤条件。昨天有小伙伴问,如下图的这两种SQL写法查询结果是否会一样?(好...

4910
用户2769421

学习Anaconda一定要了解这几件事

我们知道Python的英文表达是蟒蛇,有意思的是anaconda也是蟒蛇的意思,准确是是水莽,莽中之王,更大、更重、更长。

10120
用户2769421

我半夜爬了严选的女性文胸数据,发现了惊天秘密

七夕节相信大家看到最多的是朋友圈秀恩爱(晒花),路上随处可见的也是某某女性手捧鲜花,各种大小花店一抢而空,只剩下满店狼藉。鲜花固然代表着美丽,代表着各种美好的含...

4631
用户2769421

相见恨晚!OLAP数仓基础入门大全

导读:近七年在网易杭研一直从事数据库相关的开发工作,主要是MySQL和MongoDB这两种数据库,去年开始涉及图数据库Neo4J。上述几种,都可认为是OLTP类...

7120
用户2769421

安利一个Python大数据分析神器!

对于Pandas运行速度的提升方法,之前已经介绍过很多回了,里面经常提及Dask,很多朋友没接触过可能不太了解,今天就推荐一下这个神器。

7720
用户2769421

Python中 5 种不同的下划线含义你都知道吗?

本文将介绍Python中单下划线和双下划线("dunder")的各种含义和命名约定,名称修饰(name mangling)的工作原理,以及它如何影响你自己的Py...

7331
用户2769421

又一款程序员摸鱼神器来了?上班也可以在VSCode看股票 & 基金实时数据

项目地址:https://github.com/giscafer/leek-fund

6120
用户2769421

40000字 Matplotlib 实操干货,真的全!

Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。通过 Matplotlib,开发者可以...

13530
用户2769421

安利 5 个拍案叫绝的 Matplotlib 骚操作!

大家都知道,Matplotlib是Python的可视化库,功能很强,可以绘制各种图。一些常规用法前不久分享过Matplotlib官方出品的cheatsheet:...

7330
用户2769421

机器学习基础:缺失值的处理技巧(附Python代码)

在数据分析和建模中,经常会遇到变量值缺失的情况,这是非常常见的。为了保证数据指标的完整性以及可利用性,通常我们会采取特殊的方式对其进行处理。

10020
用户2769421

记住没:永远不要在 MySQL 中使用 UTF-8!

最近我遇到了一个 bug,我试着通过 Rails 在以“utf8”编码的 MariaDB 中保存一个 UTF-8 字符串,然后出现了一个离奇的错误:

8020
用户2769421

决策树算法的原理(接地气版)

决策树算法不像前面介绍的SVM那样,散发着浓厚的数学气味。这个算法还是比较接地气的。

9430
用户2769421

太强了!这个 Jupyter notebook 离线工具可以用一辈子!

VScode、Pycharm、Spyder 都是目前非常好的Python编辑器,但在数据科学领域,Jupyter notebook 仍有无法取代的地方。正是基于...

12020
用户2769421

pandas基础操作技能get!横屏多图预警!

1.运行环境是Python3; 2.由于运行过程中可能有一些结果被我重新编辑或者删去了,所以不要太在意In[ ]的编号顺序; 3.更多更加全面更加正规的使用方法...

9330
用户2769421

Python 为什么推荐蛇形命名法?

关于变量的命名,这又是一个容易引发程序员论战的话题。如何命名才能更具有可读性、易写性与明义性呢?众说纷纭。

14420
用户2769421

Matplotlib官方小抄手册公开,配套可视化代码已打包!

Matplotlib作为强大的数据可视化工具,一直备受Python数据爱好者们追捧。网络上虽有零零散散的教程,但并不是非常的系统和直观,往往我们遇到一些问题的时...

10530

扫码关注云+社区

领取腾讯云代金券