首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
872500
阅读量
105
订阅数
将 Pandas 换为交互式表格的 Python 库
Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可以直接在上面进行数据分析的操作。
Python数据科学
2023-08-29
1590
pandas实战:出租车GPS数据分析
本次分享一个交通行业实战项目,这个项目是对出租车GPS数据进行分析,具体内容包括了数据理解、业务场景、数据处理、可视化等。
Python数据科学
2023-08-29
6040
速度起飞!替代 pandas 的 8 个神库
本篇介绍 8 个可以替代pandas的库,在加速技巧之上,再次打开速度瓶颈,大大提升数据处理的效率。
Python数据科学
2023-08-29
6400
终于把 Python 数据分析道明白了
数据分析是指运用适当的方法和技巧对数据(一般数据量较大)进行分析,从看似杂乱无序或毫无关联的数据中挖掘出有价值的信息,总结出隐藏在数据背后的规律。
Python数据科学
2023-08-29
1740
Pandas + ChatGPT 超强组合 pandas-ai :交互式数据分析和处理新方法
Python Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。
Python数据科学
2023-08-29
1340
pandas 文本处理大全(附代码)
文本的主要两个类型是string和object。如果不特殊指定类型为string,文本类型一般为object。
Python数据科学
2022-03-11
1.1K0
3 个常考的 SQL 数据分析题(含数据和代码)
SQL是数据分析必备的技能了,面对数据分析问题如何快速写出一手漂亮的SQL是初学者最大的难题,本篇分享3个常考数据分析题,摘自《SQL数据分析:从基础破冰到面试题解》一书中。
Python数据科学
2022-03-11
1K0
数仓:如何使用RFM模型进行用户分层?
在适当、有效的商务智能环境中,数据分析的质量必须得到保障。而确保数据分析质量的第一步就是根据问题需求从海量数据中提炼出真正所需的数据,因为这是发挥数据价值很重要的一个方面。通过数据的分析与可视化呈现可以更加直观的提供数据背后的秘密,从而辅助业务决策,实现真正的数据赋能业务。本文主要介绍在用户分层和用户标签中常常使用的一个模型——RFM模型。
Python数据科学
2021-09-08
1.5K0
风控中必做的数据分析
我的观点是风控和其他互联网业务都是互通的,本文介绍下风控中必做的数据分析,用以说明数据分析是一通百通的。
Python数据科学
2021-09-08
1K0
数据预警模型,该如何搭建?
数据分析能主动做出预警,是所有人的终极期望。可现实是很惨淡的,经常是指标已经下跌了,业务部门忙得团团转了,数据分析才慢慢悠悠地分析“昨天为啥DAU下降30%”。
Python数据科学
2021-08-10
7960
数据分析:浅谈漏斗分析
说起数据分析,很多人把精力放在了各种高大上的数据模型上。事实上,比较常见的一些数据分析方法,往往都不是什么非常高深的学问,在实践中,涉及到的方法论或者复杂性,其实是远低于学校里学习的专业知识。而我们非常看重数据分析,本质是看重“数据”,以及利用数据来做的“分析”,好的结论不一定有多么高大上的模型,但它一定有数据作为支持。
Python数据科学
2021-08-10
7410
数据分析思维和方法:用户画像分析
我们经常在淘宝上购物, 作为淘宝方, 他们肯定想知道他的使用用户是什么样的, 是什么样的年龄性别, 城市, 收入, 他的购物品牌偏好, 购物类型, 平时的活跃程度是什么样的, 这样的一个用户描述就是用户画像分析。
Python数据科学
2021-02-01
1.5K0
太秀了!用 pandas 搞定 24 张 Excel 报表
大家的关注点主要是如何循环遍历表格、如何用Pandas批量处理,当然,还有在996的压迫下如何提效(来挤出更多摸鱼时间)。
Python数据科学
2021-01-28
6880
机器学习中必知必会的 3 种特征选取方法!
随着深度学习的蓬勃发展,越来越多的小伙伴开始尝试搭建深层神经网络应用于工作场景中,认为只需要把数据放入模型中,调优模型参数就可以让模型利用自身机制来选择重要特征,输出较好的数据结果。
Python数据科学
2021-01-28
1K0
数据科学实战:保险产品交叉销售预测分析
今天的内容是一期Python实战训练,我们来手把手教你用Python分析保险产品交叉销售和哪些因素有关。
Python数据科学
2020-11-19
2.7K0
实战案例解读:数据分析,如何更进一步?
“我是偏运营/业务分析的,复杂的分析算法我不会,还有什么方法能够对评价类数据做更深入分析吗?”
Python数据科学
2020-02-14
6780
数据分析小白必看,一种通用的数据分析思路
数据分析是一个庞大的工程,有的时候过于抽象且依赖经验。本文是笔者对学习和实践数据分析的一个总结,希望提供一种通用的数据分析思路,并在分析思路的每个步骤中介绍相关的分析算法及其应用场景,对于算法只做浅层次的介绍,待读者在实际使用中自行深入了解。
Python数据科学
2020-01-16
4550
统计学5个基本概念,你知道多少?
本文讲述了数据分析师应当了解的五个统计基本概念:统计特征、概率分布、降维、过采样/欠采样、贝叶斯统计方法。
Python数据科学
2019-12-03
7830
中国爬虫违法违规案例汇总!
https://github.com/HiddenStrawberry/Crawler_Illegal_Cases_In_China
Python数据科学
2019-11-29
9960
数据湖如何为企业带来9%的高增长?可否取代数据仓库?
数据湖是一个集中的存储库,允许您以任何规模存储所有结构化和非结构化数据。您可以按原样存储数据,而不必首先构造数据,并运行不同类型的分析—从仪表板和可视化到大数据处理、实时分析和机器学习,以指导更好的决策。
Python数据科学
2019-11-28
7620
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档