数据科学CLUB

86 篇文章
14K 次阅读
17 人订阅

全部文章

用户3577892

回顾|程序的组织结构

if语句能够有条件地执行代码,如果条件为真,就执行后续代码块;如果条件为假,就不执行

5210
用户3577892

顺序表与单链表

线性表的顺序表示指的是用一组地址连续的存储单元依次存储线性表的数据元素,这种表示 也称作线性表的顺序存储结构或顺序映像。通常,称这种存储结构的线性表为顺序表(S...

4000
用户3577892

一元回归分析

谈论的是预测区间,两者是不同的,显然,预测区间要比置信区间宽很多. 要提高预测区间(置信区间也一样) 的精度,即要使

5410
用户3577892

单因素方差分析及其相关检验

(1)问题与数据 设某因子有r个水平,记为,在每一水平下各做m次独立重复试 验,若记第i个水平下第j次重复的试验结果为,所有试验的结果可列表如下:

10110
用户3577892

卡方检验及其Python实现

检验主要是测试样本分类数据的分布是否符合预期分布。相信大家如果学过高中生物,都知道孟德尔——遗传学之父,当时他根据颜色和形状把豌豆分为四类:黄圆、绿圆、黄皱和绿...

7220
用户3577892

Pandas绘图功能

可视化是用来探索性数据分析最强大的工具之一。Pandas库包含基本的绘图功能,可以让你创建各种绘图。Pandas中的绘图是在matplotlib之上构建的,如果...

5510
用户3577892

概率密度函数的核估计

核密度估计法是一种通过某个(连续的)概率分布的样本来估计这个概率分布的密度函数的方法。

10540
用户3577892

假设检验在数据分析中的应用

在这篇文章中,我不会具体去推导检验统计量和相应拒绝域的得出,这对于大部分非统计学专业的人士来说是晦涩的,我只想通过一个案例告诉大部分初学者假设检验怎么在数据挖掘...

9930
用户3577892

Scipy使用简介

Scipy中的special模块是一个非常完整的函数库,其中包含了基本数学函数,特殊数学函数以及numpy中所出现的所有函数。伽马函数是概率统计学中经常出现的一...

11220
用户3577892

用Scipy求解单个正态总体的置信区间

假定参数是射击靶上 10 环的位置,作一次射击,打在靶心 10 环的位置上的可能性很小,但打在靶子上的可能性就很大,用打在靶上的这个点画出一个区间,这个区间包含...

9320
用户3577892

为什么随机误差服从正态分布?

正态分布分布在概率论与数理统计中处于核心地位。它最初作为二项分布计算的渐近公式由棣莫弗引进,后被拉普拉斯发展成系统的理论,但把它作为一个分布来进行研究则归功于高...

14610
用户3577892

为什么电话呼叫次数服从泊松分布?

7810
用户3577892

蒙特卡洛法求积分

问题一:我们如何用蒙特卡洛方法求积分?问题二:如何近似求一个随机变量的数学期望?问题三:估计的误差是多少?问题四:如何从理论上对蒙特卡洛估计做分析?结论

8210
用户3577892

交叉验证

概述Holdout 交叉验证K-Fold 交叉验证Leave-P-Out 交叉验证总结

11020
用户3577892

Python统计分析

描述性统计偏度和峰度累计值假设检验和区间估计示例1假设检验置信区间示例2假设检验置信区间

7110
用户3577892

数据特征分析

“原因和结果、投入和产出、努力和报酬之间本来存在着无法解释的不平衡。一般来说,投入和努力可以分为两种不同的类型: 多数,它们只能造成少许的影响;少数,它们造成主...

9310
用户3577892

高斯过程

为了计算充分统计量,即后验预测分布的均值和协方差矩阵,我们用下面代码实现公式(4)和(5)

17920
用户3577892

ROC曲线

9910
用户3577892

混淆矩阵

混淆矩阵是一个表,经常用来描述分类模型(或“分类器”)在已知真实值的一组测试数据上的性能。混淆矩阵本身比较容易理解,但是相关术语可能会令人混淆。

8720
用户3577892

XGBoost原理简介

在大数据竞赛中,XGBoost霸占了文本图像等领域外几乎80%以上的大数据竞赛.当然不仅是在竞赛圈,很多大公司也都将XGBoost作为核心模块使用,好奇的人肯定...

15030

扫码关注云+社区

领取腾讯云代金券