首页
学习
活动
专区
工具
TVP
发布

数据科学CLUB

专栏作者
90
文章
128846
阅读量
18
订阅数
检验样本是否服从泊松分布
本文以一个订单数据为例,研究顾客购买次数的分布规律,尝试从中估计总体的分布,以对后续的订单数据进行预测或进行业绩的对比
用户3577892
2021-07-08
1.5K0
关于马尔可夫链的一道题目
某人有 2 把伞,并在办公室和家之间往返.如果某天他在家中(办公室时)下雨而且家中(办公室)有伞他就带一把伞去上班(回家),不下雨时他从不带伞.如果每天与以往独立地早上(晚上)下雨的概率为0.7,试求他被雨淋湿的机会.
用户3577892
2021-04-21
2.1K0
回顾|Python中的数据结构
可对列表执行所有的标准序列操作,如索引、切片、拼接和相乘,但列表的有趣之处在于它不同于元组 是可以修改的。
用户3577892
2021-03-15
2.9K0
线性化和牛顿法
如何使用导数去估算特定的量. 例如, 假设想不借助计算器就得到 的一个较好估算. 我们知道 比 略大, 所以显然可以说 大约 比 3 多一点. 这没问题, 但其实可以不费太多劲就做出一个好得多的估算. 下面是具体做法.
用户3577892
2021-03-13
8170
回顾|程序的组织结构
if语句能够有条件地执行代码,如果条件为真,就执行后续代码块;如果条件为假,就不执行
用户3577892
2021-02-23
1.8K0
顺序表与单链表
线性表的顺序表示指的是用一组地址连续的存储单元依次存储线性表的数据元素,这种表示 也称作线性表的顺序存储结构或顺序映像。通常,称这种存储结构的线性表为顺序表(Sequent ial List
用户3577892
2021-02-23
9020
一元回归分析
谈论的是预测区间,两者是不同的,显然,预测区间要比置信区间宽很多. 要提高预测区间(置信区间也一样) 的精度,即要使
用户3577892
2021-01-14
1.1K0
单因素方差分析及其相关检验
(1)问题与数据 设某因子有r个水平,记为,在每一水平下各做m次独立重复试 验,若记第i个水平下第j次重复的试验结果为,所有试验的结果可列表如下:
用户3577892
2021-01-02
1.4K0
卡方检验及其Python实现
检验主要是测试样本分类数据的分布是否符合预期分布。相信大家如果学过高中生物,都知道孟德尔——遗传学之父,当时他根据颜色和形状把豌豆分为四类:黄圆、绿圆、黄皱和绿皱.孟德尔根据遗传学原理判断这四类的比例应为9:3:3:1.为做验证,孟德尔分别统计了这四类豌豆的个数,正是利用
用户3577892
2020-12-01
3.1K0
Pandas绘图功能
可视化是用来探索性数据分析最强大的工具之一。Pandas库包含基本的绘图功能,可以让你创建各种绘图。Pandas中的绘图是在matplotlib之上构建的,如果你很熟悉matplotlib你会惊奇地发现他们的绘图风格是一样的。
用户3577892
2020-11-12
1.7K0
概率密度函数的核估计
核密度估计法是一种通过某个(连续的)概率分布的样本来估计这个概率分布的密度函数的方法。
用户3577892
2020-11-05
1.8K0
假设检验在数据分析中的应用
在这篇文章中,我不会具体去推导检验统计量和相应拒绝域的得出,这对于大部分非统计学专业的人士来说是晦涩的,我只想通过一个案例告诉大部分初学者假设检验怎么在数据挖掘中使用。
用户3577892
2020-10-09
1.2K0
Scipy使用简介
Scipy中的special模块是一个非常完整的函数库,其中包含了基本数学函数,特殊数学函数以及numpy中所出现的所有函数。伽马函数是概率统计学中经常出现的一个特殊函数,它的计算公司如下:
用户3577892
2020-09-18
2K0
用Scipy求解单个正态总体的置信区间
假定参数是射击靶上 10 环的位置,作一次射击,打在靶心 10 环的位置上的可能性很小,但打在靶子上的可能性就很大,用打在靶上的这个点画出一个区间,这个区间包含靶心的可能性就很大,这就是区间估计的基本思想。
用户3577892
2020-09-01
1.9K0
为什么随机误差服从正态分布?
正态分布分布在概率论与数理统计中处于核心地位。它最初作为二项分布计算的渐近公式由棣莫弗引进,后被拉普拉斯发展成系统的理论,但把它作为一个分布来进行研究则归功于高斯,他在19世纪初的测量误差研究中导出的误差函数,后被高斯命名为正态分布。因此正态分布又称高斯分布。这项研究又是当代统计学中重要思想——最大似然估计的源头。
用户3577892
2020-08-18
2K0
为什么电话呼叫次数服从泊松分布?
假设条件 image.png image.png
用户3577892
2020-08-18
6370
蒙特卡洛法求积分
问题一:我们如何用蒙特卡洛方法求积分?问题二:如何近似求一个随机变量的数学期望?问题三:估计的误差是多少?问题四:如何从理论上对蒙特卡洛估计做分析?结论
用户3577892
2020-08-10
9340
交叉验证
概述Holdout 交叉验证K-Fold 交叉验证Leave-P-Out 交叉验证总结
用户3577892
2020-07-23
1.2K0
Python统计分析
描述性统计偏度和峰度累计值假设检验和区间估计示例1假设检验置信区间示例2假设检验置信区间
用户3577892
2020-07-14
8630
数据特征分析
“原因和结果、投入和产出、努力和报酬之间本来存在着无法解释的不平衡。一般来说,投入和努力可以分为两种不同的类型: 多数,它们只能造成少许的影响;少数,它们造成主要的、重大的影响。” → 一个公司,80%利润来自于20%的畅销产品,而其他80%的产品只产生了20%的利润
用户3577892
2020-07-09
9800
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档