首页
学习
活动
专区
工具
TVP
发布

Python数据科学

专栏作者
619
文章
868760
阅读量
105
订阅数
时间序列基本概念、任务、预测方法
作者:东哥起飞,来源:Python数据科学 本文开启时间序列系列的相关介绍,从零梳理时序概念、相关技术、和实战案例,欢迎订阅 👉「时间序列专栏」 跟踪全部内容。 本篇介绍时间序列的定义、任务、构成以及预测方法,主要是基本概念的介绍和理解。 时间序列定义 时间序列,通俗的字面含义为一系列历史时间的序列集合。比如2013年到2022年我国全国总人口数依次记录下来,就构成了一个序列长度为10的时间序列。 专业领域里,时间序列定义为一个随机过程,是按时间顺序排列的一组随机变量 ...X_1,X_2,..X_T...
Python数据科学
2023-03-08
1.3K0
一位上海交大教授的深度学习五年研究总结
我是2017年11月开始接触深度学习,至今刚好五年。2019年10月入职上海交大,至今三年,刚好第一阶段考核。2022年8月19号,我在第一届中国机器学习与科学应用大会做大会报告,总结这五年的研究以及展望未来的方向。本文是该报告里关于理论方面的研究总结(做了一点扩展)。报告视频链接可以见:https://www.bilibili.com/video/BV1eB4y1z7tL/
Python数据科学
2022-11-05
3310
pandas 变量类型转换的 6 种方法
对于变量的数据类型而言,Pandas除了数值型的int 和 float类型外,还有object ,category,bool,datetime类型。
Python数据科学
2022-06-06
4K0
安利 4 个时序预测算法:Prophet、Deep AR..
时间序列预测是一个发展历史悠久的技术领域,传统的统计学算法(e.g. ARIMA、ETS、GARC)以及近年来的机器学习(e.g. 广义线性模型、xgboost)、深度学习算法(e.g. LSTM、CNN、Transformer) 都可以用于时间序列预测,不同方法各有长处和短处。
Python数据科学
2022-04-12
2.7K1
pandas 分类数据处理大全(附代码)
category是pandas的一种分类的定类数据类型。和文本数据.str.<methond>一样,它也有访问器功能.cat.<method>。
Python数据科学
2022-04-12
1.1K0
一文读懂异常检测 LOF 算法(Python代码)
本篇和大家介绍一个经典的异常检测算法:局部离群因子(Local Outlier Factor),简称LOF算法。
Python数据科学
2022-04-12
3.2K0
pandas 文本处理大全(附代码)
文本的主要两个类型是string和object。如果不特殊指定类型为string,文本类型一般为object。
Python数据科学
2022-03-11
1.1K0
实践教程:CNN调优总结
使用没有 batchnorm 的 ELU 非线性或者有 batchnorm 的 ReLU。
Python数据科学
2021-10-19
5210
安利 3 个 pandas 数据探索分析神器!
EDA是数据分析必须的过程,用来查看变量统计特征,可以此为基础尝试做特征工程。东哥这次分享3个EDA神器,其实之前每一个都分享过,这次把这三个工具包汇总到一起来介绍。
Python数据科学
2021-10-19
5410
我利用这几个神器来拯救自己奇丑无比的 python代码
Jupyter notebook的代码要想写得规范,推荐用Code prettify插件。
Python数据科学
2021-09-08
5640
17 个机器学习的常用算法!
在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见应用场景如分类问题和回归问题。常见算法有逻辑回归(Logistic Regression)和反向传递神经网络(Back Propagation Neural Network)
Python数据科学
2021-09-08
3950
68 个Python内置函数,你用过几个?
内置函数就是Python给你提供的,拿来直接用的函数,比如print.,input等。
Python数据科学
2021-09-08
4560
比 requests 更强大 Python 库,让你的爬虫效率提高一倍!
最近公司 Python 后端项目进行重构,整个后端逻辑基本都变更为采用"异步"协程的方式实现。看着满屏幕经过 async await(协程在 Python 中的实现)修饰的代码,我顿时感到一脸懵逼,不知所措。
Python数据科学
2021-08-12
9240
60 个 Python 闯关小例子,建议收藏!
来源丨https://github.com/jackzhenguo/python-small-examples
Python数据科学
2021-08-12
4970
20 个短小精悍的 pandas 骚操作
大家好,我是东哥啊。 本次为大家整理了一个pandas骚操作操作的大集合,共20个功能,个个短小精悍,一次让你爱个够。系列内容,请看?「pandas100个骚操作」话题。 另外,最近收到出版社送的一本
Python数据科学
2021-08-10
1.1K0
机器学习建模中的 Bagging 思想
我们在生活中做出的许多决定都是基于其他人的意见,而通常情况下由一群人做出的决策比由该群体中的任何一个成员做出的决策会产生更好的结果,这被称为群体的智慧。集成学习(Ensemble Learning)类似于这种思想,集成学习结合了来自多个模型的预测,旨在比集成该学习器的任何成员表现得更好,从而提升预测性能(模型的准确率),预测性能也是许多分类和回归问题的最重要的关注点。
Python数据科学
2021-08-10
7340
快收藏!!整理了100个Python小技巧!!
目前Python可以说是非常流行,在目前的编程语言中,Python的抽象程度是最高的,是最接近自然语言的,很容易上手。
Python数据科学
2021-07-16
7640
特征选择:8 种常见的特征过滤法
特征抽取是数据挖掘任务最为重要的一个环节,一般而言,它对最终结果的影响要高过数据挖掘算法本身。
Python数据科学
2021-07-16
8.3K0
详解16个pandas函数,让你的 “数据清洗” 能力提高100倍!
作为一个数据分析师来说,数据清洗是必不可少的环节。有时候由于数据太乱,往往需要花费我们很多时间去处理它。因此掌握更多的数据清洗方法,会让你的能力调高100倍。
Python数据科学
2021-03-17
2.3K0
机器学习:模型调参大法总结
调参即超参数优化,是指从超参数空间中选择一组合适的超参数,以权衡好模型的偏差(bias)和方差(variance),从而提高模型效果及性能。常用的调参方法有:
Python数据科学
2021-03-17
6.7K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档