首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
620
文章
871804
阅读量
105
订阅数
Python 离群值检测算法--ECOD
基于经验累积分布的离群值检测(ECOD)是一种直观的方法,通过测量罕见事件在分布中的位置来识别异常值。
Python数据科学
2024-04-24
160
多项式朴素贝叶斯分类器(Python代码)
在这篇文章中,我们介绍多项式朴素贝叶斯分类器是如何工作的,然后使用scikit-learn作为实际工作的示例来介绍如何使用。
Python数据科学
2024-04-10
1640
时间序列平稳性检验方法(Python)
当我们拿到时序数据后,首先要进行平稳性和纯随机性的检验,这两个重要的检验是时间序列的预处理。根据检验的结果可以判断出序列属于什么类型,然后对症下药使用相应的分析方法。
Python数据科学
2024-03-05
2520
风控实战:用Python实现vintage报表
大家好,我是东哥。本篇继续分享风控的内容,关于如何用python实现vintage报表及可视化图的实战。
Python数据科学
2023-12-26
2180
风控模型:PSI 稳定性指标详解(Python)
在风控中,风险意味着不确定性,不确定性越强意味着越不可控,做数据化风控也是同理,追求的就是让确定性越来越强,转换成统计概率论来说就是不断提高我们的胜算的概率。当然,没有任何人可以做到100%的确定,因为没有人是上帝视角,所以在风控决策过程中总会产生错杀或者误放。
Python数据科学
2023-11-30
1.1K0
使用 Python 从零实现多分类SVM
本文将首先简要概述支持向量机及其训练和推理方程,然后将其转换为代码以开发支持向量机模型。之后然后将其扩展成多分类的场景,并通过使用Sci-kit Learn测试我们的模型来结束。
Python数据科学
2023-11-14
3120
安利个一行代码的Python可视化神器!
学过Python数据分析的朋友都知道,在可视化的工具中,有很多优秀的三方库,比如matplotlib,seaborn,plotly,Boken,pyecharts等等。这些可视化库都有自己的特点,在实际应用中也广为大家使用。
Python数据科学
2023-09-14
2810
强化学习:原理与Python实战
RLHF(Reinforcement Learning with Human Feedback,人类反馈强化学习)虽是热门概念,并非包治百病的万用仙丹。本问答探讨RLHF的适用范围、优缺点和可能遇到的问题,供RLHF系统设计者参考。
Python数据科学
2023-08-29
3250
将 Pandas 换为交互式表格的 Python 库
Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可以直接在上面进行数据分析的操作。
Python数据科学
2023-08-29
1590
终于把 Python 数据分析道明白了
数据分析是指运用适当的方法和技巧对数据(一般数据量较大)进行分析,从看似杂乱无序或毫无关联的数据中挖掘出有价值的信息,总结出隐藏在数据背后的规律。
Python数据科学
2023-08-29
1730
强烈推荐一个Python可视化模块,简单又好用
数据可视化动画还在用Excel做?现在一个简单的Python包就能分分钟搞定!而且生成的动画也足够丝滑,效果是酱紫的:
Python数据科学
2023-08-29
2120
时间序列平稳性、白噪声、随机游走
作者:东哥起飞,来源:Python数据科学 本文开启时间序列系列的相关介绍,从零梳理时序概念、相关技术、和实战案例,欢迎订阅 👉时间序列专栏 跟踪全部内容。 本篇介绍时间序列的平稳性的相关概念。很多传统时序方法比如ARMA、ARIMA都需要时序具备平稳性,那什么是时序的平稳性?为什么需要平稳性,平稳性有什么作用? 什么是平稳性? 时间序列平稳性是指一组时间序列数据看起来平坦,各阶统计特征不随时间的变化而变化。平稳性分为宽平稳和严平稳,我们分别给出定义: 严平稳 严平稳是一种条件很苛刻的定义,时间序列的所有统
Python数据科学
2023-03-08
1.6K0
超详细配置教程:用 Windows 电脑训练深度学习模型
虽然大多数深度学习模型都是在 Linux 系统上训练的,但 Windows 也是一个非常重要的系统,也可能是很多机器学习初学者更为熟悉的系统。要在 Windows 上开发模型,首先当然是配置开发环境。Kaggle Master 及机器学习实践者 Abhinand 立足于自己的实践,给出了一种简单易行的 Windows 深度学习环境配置流程。
Python数据科学
2022-11-05
1.5K0
pandas 变量类型转换的 6 种方法
对于变量的数据类型而言,Pandas除了数值型的int 和 float类型外,还有object ,category,bool,datetime类型。
Python数据科学
2022-06-06
4K0
pandas 重复数据处理大全(附代码)
重复值处理主要涉及两个部分,一个是找出重复值,第二个是删除重复值,也就是根据自己设定的条件进行删除操作。
Python数据科学
2022-03-11
2.2K0
yyds!Python 量化交易神书面世,赠送 5 本
前不久,收到清华大学出版社赠送的 《深入浅出Python量化交易实战》 一书,也答应了出版社要写一些读书笔记,今天就来交作业了。
Python数据科学
2022-03-11
5530
pandas 缺失数据处理大全(附代码)
之前一直在分享pandas的一些骚操作:pandas骚操作,根据大家反映还不错,但是很多技巧都混在了一起,没有细致的分类,这样不利于查找,也不成体系。
Python数据科学
2022-03-11
2.3K0
3W 字!Python 操作 Excel 报表自动化指南!
来源:https://blog.csdn.net/u014779536/article/details/108182833
Python数据科学
2021-10-19
3.2K0
一起揭开 PySpark 编程的神秘面纱
在开始讲解PySpark程序启动原理之前,我们先来了解一下Spark的一些概念和特性。
Python数据科学
2021-09-29
1.6K0
我利用这几个神器来拯救自己奇丑无比的 python代码
Jupyter notebook的代码要想写得规范,推荐用Code prettify插件。
Python数据科学
2021-09-08
5660
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档