首页
学习
活动
专区
工具
TVP
发布

Python 商业数据分析案例

专栏成员
37
文章
35884
阅读量
21
订阅数
网约车司机工作情况中级分析 | 两维度分类(矩阵法)
单维度分类推文中,我们切分了在线时长和车费收入这两个指标,并将他们分别考量。最后得出该份数据中司机们工作强度和日收入层级的情况。
萝 卜
2022-08-31
9660
网约车中级分析 | 单维度分类
前两篇推文中,我们知道了在分析数据时,指标选取以及确定标准的重要性。如果没有时间回顾,可以快速过一下下面两幅总结图。该系列的前两篇文章都是针对单一的指标进行分析,分析思路也比较初级。
萝 卜
2022-08-31
1K0
网约车渠道初级分析(漏斗与整体结构)
上一篇零售超市数据分析中,我们知道了仅有数据分析的过程和一些结果可视化的图片并不足以说明问题,只有辅以「明确的标准」,才能得出相对可靠的结论。否则单看销售额曲线一直向上,就一定能说明公司的经营在进步吗?加上了增长率曲线和一些业务比例后,发现因为电商的冲击,前五年的情况其实并不乐观,后来调整后才开始好转。
萝 卜
2022-08-31
5820
零售超市数据分析(趋势和指标分析初探)
以前的 “原理+代码” 系列,侧重的是以通俗易懂的方式来讲解一个模型/算法(比如随机森林,不平衡采样),然后再配上注释详细的代码,方便读者学习基本原理和代码实现,最终实现快速上手并为深入学习打下一些基础。
萝 卜
2022-08-31
7670
基于 LRFMC 模型的会员用户画像
RFM 模型的概念介绍,用途,详细的使用方法本博文都不 一一 介绍了,毕竟如此常见的模型,前人论文文献、各平台都已经十分详细的叙述了整个流程。所以我们便将侧重点放在根据场景进行了优化调整的 LRFMC 模型上,这里穿插回顾少部分精华理论即可。
萝 卜
2022-05-12
7650
案例实战 | Python 实现 RFM 模型
对利用Python进行数据分析有一定的了解后,再结合一些业务知识把理论与实际相结合的需求也呼之欲出。将编程语言应用到实践中也还是一件比较有成就感的事情。本文源起是笔者最近常收到如下“骚扰”短信:
萝 卜
2022-05-12
6450
「流程案例」| 胡润富豪榜数据获取、分析与可视化
谁是中国首富?这是每年胡润富豪榜发出时大家最关心的话题。但只关注第一位就太未免浪费这份榜单的价值了,事实上这份榜单能挖掘到的信息很多,比如:
萝 卜
2022-05-12
7430
新专栏 | 有趣的计算机视觉
这个专栏结束时,我们将掌握计算机视觉(Computer Vision,下简称 CV)中最基础又最经典项目之一 —— “人脸识别” 背后的原理,并用代码实现完整的流程,最终为以后更深入的学习人工智能下其他领域的知识打下基础。
萝 卜
2022-05-12
2750
CV | 3.颜色空间及其转换
正因如此,第二章的跑车蓝幕扣去结果才会不尽人意(一些边缘部分还是没有被完全识别),毕竟原图就处在阳光下。
萝 卜
2022-05-12
4570
CV | 2.颜色阈值&蓝幕替换
把图像转为灰度图像的像素网格以及 x 和 y 的函数来处理以后,我们还需要学会如何利用这些信息,例如如何用图像信息来分离特定区域。
萝 卜
2022-05-12
9030
CV | 1. 一切的基础:灰度图像
一切看似复杂的计算机视觉项目,其基础都会回归到单张图片上。能够理解 灰度/彩色图像 的基本原理并将代码用于实际案例是本文的目标。下文将详细介绍如何利用 Python 实现 灰度/彩色图像 的基本处理,主要分为两个部分:
萝 卜
2022-05-12
1.1K0
Pandas 选出指定类型的所有列,统计列的各个类型的数量
通过本文,你将知晓如何利用 Pandas 选出指定类型的所有列用于后续的探索性数据分析,这个方法在处理大表格时非常有用(如列非常多的金融类数据),如果能够较好的掌握精髓,将能大大提升数据评估与清洗的能力,为后续建模提供高质量的数据。
萝 卜
2022-05-12
1K0
joblib 保存训练好的模型并快捷调用
用已知数据集训练出一个较为精准的模型是一件乐事,但当关机或退出程序后再次接到 “ 用新的格式相同的数据来进行预测或分类 ” 这样的任务时;又或者我们想把这个模型发给同事并让TA用于新数据的预测......
萝 卜
2022-05-12
1.3K0
分类/连续变量的探索性数据分析
正式开始建模与处理数据前,对数据进行探索并有一个初步的认识非常重要,本文将围绕变量探索,展示分类、连续变量,以及两种类型变量结合的探索方法,并展示 Python Pandas 数据处理与可视化中的一些快捷常用骚操作~
萝 卜
2022-05-12
1.3K0
案例实战 | 主成分分析实现数据描述
在之前的文章中,我们已经详细介绍了主成分分析的原理,并用Python基于主成分分析的客户信贷评级进行实战。
萝 卜
2022-05-12
1K0
Pandas 查找,丢弃列值唯一的列
数据清洗很重要,本文演示如何使用 Python Pandas 来查找和丢弃 DataFrame 中列值唯一的列,简言之,就是某列的数值除空值外,全都是一样的,比如:全0,全1,或者全部都是一样的字符串如:已支付,已支付,已支付…
萝 卜
2022-05-12
5.6K0
Python map, apply, transform 打标签方法汇总(初阶到高阶)
根据数据的某列进行打标签这个操作在数据分析领域极度常用,对于一些较为复杂的打标签方法,Python 与 SQL 都能很好的实现,这篇针对 Python,主要用到 map,apply 与 transform 等函数,从初阶到高阶,体会方法的异同优劣。
萝 卜
2022-05-12
3320
原理+代码|手把手教你 Python 反欺诈模型实战
本文将基于不平衡数据,使用Python进行反欺诈模型数据分析实战,模拟分类预测模型中因变量分类出现不平衡时该如何解决,具体的案例应用场景除反欺诈外,还有客户违约和疾病检测等。只要是因变量中各分类占比悬殊,就可对其使用一定的采样方法,以达到除模型调优外的精度提升。主要将分为两个部分:
萝 卜
2022-05-12
7430
趣析逻辑回归模型评价指标
Python 实现的逻辑回归后,不像 SAS 那样会自动给出模型精确度的评价,需要人为操作计算 Python 专属的 AUC (Area Under Curve),ROC 曲线与 X 轴围成的面积大小反映了模型的精度。本文将着重 AUC 值和 ROC 曲线背后的原理和 Python 代码实现。
萝 卜
2022-05-12
5010
python 珍藏函数实现随机/分层/系统抽样
抽样调查在统计学与 Python数据分析/数据挖掘/数据科学 中非常常用,在实际业务中更是高频刚需,而 Python 并没有专有的抽样方法库,所以笔者将自己以前的笔记汇总到自写库中,用到时直接调用函数即可,快速且精确。
萝 卜
2022-05-12
8610
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档