机器学习与统计学

634 篇文章
69 人订阅

全部文章

统计学家

私藏的5个好用的Pandas函数!

explode用于将一行数据展开成多行。比如说dataframe中某一行其中一个元素包含多个同类型的数据,若想要展开成多行进行分析,这时候explode就派上用...

9473
统计学家

分分钟甩Word几条街,Python编辑公式竟可以如此简单!

我们在 Word 中编辑文本时,遇到超复杂的公式,想想就令人头大,一个不小心就会输错。真心不想用啊,写论文就够令人头疼了,没想到,最难的是编辑超长的公式。

4910
统计学家

深度学习训练过程可视化(附github源码)

深度学习训练过程一直处于黑匣子状态,有很多同学问我具体怎么解释?其实很多还是无法可解释,但是通过可视化,具体可以知道深度学习在训练过程到底学习了哪些特征?到底对...

5110
统计学家

贝叶斯:没有人比我更懂南京市长江大桥

摘要:贝叶斯方法对于由证据的积累来推测一个事物发生的概率具有重大作用,它告诉我们当我们要预测一个事物,我们需要的是首先根据已有的经验和知识推断一个先验概率,然后...

4110
统计学家

在数据科学中需要多少数学技能?(附链接)

作者:Benjamin Obi Tayo 翻译:刘思婧 校对:车前子 编辑:数据派THU

3410
统计学家

关于Python 3.9,那些你不知道的事

Python的下一个版本带来了更快速的进程释放,性能的提升,简便的新字符串函数,字典并集运算符以及更兼容稳定的内部API。

6410
统计学家

40000字 Matplotlib 实操干货,真的全!

Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。通过 Matplotlib,开发者可以...

4110
统计学家

超详细丨完整的【推荐系统】架构设计

本文我们将从架构设计的角度回顾和讨论推荐系统的一些核心算法模块,重点从离线层、近线层和在线层三个架构层面讨论这些算法。

7420
统计学家

机器学习算法基础:层 次 聚 类 详 解

层次聚类假设类别之间存在层次结构,将样本聚到层次化的类中。所谓层次就是一层一层的进行聚类,可以采用自顶向下的聚类策略(分裂),也可以采用自下而上的策略(凝聚)。

7630
统计学家

机器学习模型调参指南(附代码)

ML工作流中最困难的部分之一是为模型找到最好的超参数。ML模型的性能与超参数直接相关。

7920
统计学家

Python中浅拷贝与深拷贝的骚操作

为什么同样是list3 = list1[:] 执行list1.sort() 操作,list3不发生变化 执行list1[0][0] = 111 操作,list...

7850
统计学家

Python极简入门:数据类型、条件语句、循环语句、异常处理

https://blog.csdn.net/weixin_37777526/article/details/108427112

7410
统计学家

数学系的概率论和我们的不太一样。。。

如果你让 n 个数学家来定义数学到底是什么,你可能会得到 2n 个不同答案。在我看来,它将事物抽象化到只剩下核心要素,并为推理任何事物提供了最终的框架。

6720
统计学家

机器学习基础:可视化方式理解决策树剪枝

看了一些市面上的经典教材,感觉决策树剪枝这一部分讲的都特别晦涩,很不好理解。本文以理论白话+具体案例的形式来讲清楚这个重要知识点,打好决策树这个基础,有助于理解...

7220
统计学家

推荐一款科研必备的Python数据可视化神器——PyQtGraph

PyQtGraph是一个纯python的图形和GUI库,构建于PyQt4/PySide和numpy之上,它主要用于数学/科学/工程应用方面。

8320
统计学家

机器学习基础:令你事半功倍的pipeline处理机制

你有没有遇到过这种情况:在机器学习项目中,对训练集的各种数据预处理操作,比如:特征提取、标准化、主成分分析等,在测试集上要重复使用这些参数。

11450
统计学家

超炫酷动态排序图、视频,我都帮你用Python实现了

先看一下最终效果,这是一张Python生成的GIF,还可以输出MP4格式的视频,到底怎么做的?且听我娓娓道来——数据集、代码、详细做法全部讲清楚。

5610
统计学家

机器学习基础:决策树的可视化

目前无论是机器学习竞赛还是工业界,最流行、应用最广泛的xgboost其实是优化后的GBDT(LightGBM里面的boosting比较经典稳定的也是GBDT哦!...

7520
统计学家

Python骚操作:一行代码实现探索性数据分析

在使用数据前,我们首先要做的是观察数据,包括查看数据的类型、数据的范围、数据的分布等。dataprep.eda是个非常不错的工具,它可以帮你快速生成数据概览。d...

10710
统计学家

机器学习基础:缺失值的处理技巧(附Python代码)

在数据分析和建模中,经常会遇到变量值缺失的情况,这是非常常见的。为了保证数据指标的完整性以及可利用性,通常我们会采取特殊的方式对其进行处理。

7720

扫码关注云+社区

领取腾讯云代金券