专栏首页Brian统计学基础一之数据描述和随机变量

统计学基础一之数据描述和随机变量


概述

最近在梳理统计学基础,发现一些统计学的基本知识已经全部还给老师。由于在学习和工作中用到一部分,所以又重新拿了起来。统计学:主要分为描述统计学和推论统计学

数据集的集中趋势

在描述数据的集中趋势几种概念:

1.平均值:所有数字的平均,描述集中趋势的某特定数字。 2.众数:出现次数(频率最多)最多的数字。描述的是离散值频率最多的数字。 3.中位数:从小到大排序,排序索引中间的数字。 以上都是描述数字集的中间趋势。 4.极差:最大值减去最小值。数字之间越紧密,极差越小;反之亦然。 5.中程数:最大值和最小值得平均值。

方差和标准差

均值虽然很好的描述了数据的集中趋势,但是数据的离散程度它无法确切的反应。比如:0 0 5 5 和2 2 3 3虽然这两个数据集的平均是都是2.5,但是后者离均值的离散程度更疏密一些,或者说更紧凑。这种离散程度均值是无法衡量的,所以数据的离散程度通过方差和标准差来衡量。我们先看一下方差和标准差的公式:

随机变量

随机变量可以理解为随机试验对结果的一种数字映射,本质上这种映射是一种函数。随机变量大致可以分为离散随机变量和连续随机变量离散随机随机变量:试验结果的映射是离散的值。例如:探索明天是否下雨的试验?只有两种试验结果下雨或者不下雨。 连续随机变量:试验结果的映射是连续的。例如:对于明天下雨雨量的统计?雨量是一种连续的结果。对于连续随机变量的概率是无精确衡量,可以允许一个误差范围。对于明天雨量估计误差范围为0.1,大致为2ml的雨量。|Y-2|<0.1,那么概率计算就是对误差范围内进行积分(黎曼和)。

随机变量的分布

随机变量的概率分布很多种,我们先看一下二项分布。

二项分布

如果投掷一个不均匀的硬币,正面朝上的概率为p,反面朝上的概率为1-p。我们进行5此试验,那么它的概率分布是:

随机变量期望

随机变量的期望值就是总体的均值,无法用全部求和然后除数目的方式求得,所以一般都是用期望来估计。

二项分布的期望

依据期望的定义,二项分布期望:

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 线性代数基础之矩阵乘法

    概述 最近在回顾偏微分方程、线性代数和统计学方面的知识,为了方便自己后期查询。对一些数学思想和思维进行了深刻探讨。一些思想对自己解决问题和思路很有帮助,所以就记...

    BrianLv
  • C++11基础学习系列三

    ---- 概述 随着自己学习C++11的进度,今天记录和实战C++11的战果。废话少说,直接记录C++11的点滴。 数组 在前面学习系列里面,介绍了模板容器类v...

    BrianLv
  • Pandas进阶之数据规整化

    ---- 概述 在Pandas基本使用简单了介绍了一下Pandas的基本使用和用法,大家如果没有一点基础的同学可以先看一下那篇文章。今天我们来讲解一下Panda...

    BrianLv
  • 如何开展性能测试

    之前有在自己建的测试群直播分享了一些性能测试的基础内容,当时有人说希望有个实战的分享,想了想某些东西属于公司机密不方便直接直播分享,

    小老鼠
  • 如何开展性能测试?

    之前有在自己建的测试群直播分享了一些性能测试的基础内容,当时有人说希望有个实战的分享,想了想某些东西属于公司机密不方便直接直播分享,

    小老鼠
  • 从插件重构看如何提升测试质量与效率

    几个月前技术侧发起了一轮手机管家小火箭的重构,目的是为了更好地梳理小火箭的代码架构逻辑,方便以后更好地提高开发效率和开发质量。

    腾讯移动品质中心TMQ
  • 7款开源自动化测试框架优缺点对比

    1. Robot Framework Robot Framework(RF)是用于验收测试和验收测试驱动开发(ATDD)的自动化测试框架。 基于 Python ...

    企鹅号小编
  • 【性能系列连载一】开篇:性能测试不可不知的“干货”

    提起性能测试,可能很多互联网从业人员会感觉比较混淆(不仅仅只是测试人员会弄混淆,很多开发人员、管理人员对性能测试也都是一知半解)。性能测试,它是属于测...

    测试开发技术
  • 如何建立云环境下的性能测试策略

    生活在当下,企业不仅利用云计算服务降低基础设施成本,而且为整个过程带来更高的效率和灵活性。在这样的情形之下,必须建立起应用程序在云中测试的正确策略。性能测试在任...

    静一
  • 2017 热门开源自动化测试框架优缺点对比

    时间一晃已来到 2017 年的最后一个季度,TestProject 对比了在今年比较热门的 7 款开源自动化测试框架的优缺点,以帮助你选择适合自己的测试框架。

    Debian社区

扫码关注云+社区

领取腾讯云代金券