前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据处理基础(一)

数据处理基础(一)

作者头像
润森
发布2019-11-24 20:35:31
6560
发布2019-11-24 20:35:31
举报
文章被收录于专栏:毛利学Python毛利学Python

最近要考试,对于成天翘课的我来说,不然不翻来从淘宝买来的旧书,预祝考到 61

《实验设计与数据处理》是于 2009 年 10 月由化学工业出版社出版的图书,作者是张成军。本书通过典型实例介绍了常用实验设计及实验数据处理方法在科学研究和工业生产中的实际应用。

在这里插入图片描述

最近考了实验设计与数据处理,虽说这是一本化学实验数据处理的书,但我更觉得是一本分析化学的书,还不如说是一本数据相关的书,也有概率论的味道,做数据的应该学习下最基本的数据处理基础

本文采用的 latex 排版公式 (由于很久没使用),用时有点大

latex:使用

  • https://blog.csdn.net/weixin_44510615/article/details/88911347

在 Latex 里打 x 的平均值

\overline{x}

要在 latex 中输入的文字带有反斜杠和 % 该如何显示?

百分号可以用 % 来输入,反斜杠用 \backslash 输入。

误差

误差是测量测得的量值减去参考量值。测得的量值简称测得值,代表测量结果的量值。所谓参考量值,一般由量的真值或约定量值来表示。对于测量而言,人们往往把一个量在被观测时,其本身所具有的真实大小认为是被测量的真值。

系统误差

系统误差,是指一种非随机性误差。如违反随机原则的偏向性误差,在抽样中由登记记录造成的误差等。它使总体特征值在样本中变得过高或过低。是可以避免的。产生原因主要有:

  • 所抽取的样本不符合研究任务;
  • 不了解总体分布的性质选择了可能曲解总体分布的抽样程序;
  • 有意识地选择最方便的和解决问题最有利的总体元素,但这些元素并不代表总体

随机误差

随机误差也称为偶然误差和不定误差,是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差。其产生的原因是分析过程中种种不稳定随机因素的影响, 如室温、相对湿度和气压等环境条件的不稳定, 分析人员操作的微小差异以及仪器的不稳定等。

精密度、准确度和精确度

  • 精密度:测量中所测得数值重现性的程度,称为精密度。它反映偶然误差的影响程度,精密度高就表示偶然误差小。
  • 准确度是指你得到的测定结果与真实值之间的接近程度。
  • 精确度(精度) 它反映测量中所有系统误差和偶然误差综合的影响程度

虽然精确度高可说明准确度高,但精确的结果也可能是不准确的。例如,使用 1mg/L的标准溶液进行测定时得到的结果是 1mg/L,则该结果是相当准确的。如果测得的三个结果分别为 1.73mg/L, 1.74mg/L1.75mg/L,虽然它们的精确度高,但却是不准确的。

精密度高的准确度不一定高,准确度高的精密度也不一定高,但精确度高,则精密度和准确度都高。

为了说明精密度与准确度的区别,可用下述打靶子例子来说明。

顺序 abc

(a) 中表示精密度和准确度都很好,则精确度高;(b) 表示精密度很好,但准确度却不高

表示精密度与准确度都不好。在实际测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值。

关于平均值术语

真值是待测物理量客观存在的确定值,也称理论值或定义值。通常真值是无法测得的。若在实验中,测量的次数无限多时,根据误差的分布定律,正负误差的出现几率相等。再经过细致地消除系统误差,将测量值加以平均,可以获得非常接近于真值的数值。但是实际上实验测量的次数总是有限的。用有限测量值求得的平均值只能是近似真值,常用的平均值有下列几种:

(1) 算术平均值 算术平均值是最常见的一种平均值。

在这里插入图片描述

(2) 几何平均值 几何平均值是将一组 n 个测量值连乘并开 n 次方求得的平均值。即

在这里插入图片描述

(3)均方根平均值

它的计算方法是先平方、再平均、然后开方。

在这里插入图片描述

(4) 对数平均值

在化学反应、热量和质量传递中,其分布曲线多具有对数的特性,在这种情况下表征平均值常用对数平均值。

设两个量

,

、 ,其对数平均值

在这里插入图片描述

变量的对数平均值总小于算术平均值

以上介绍各平均值的目的是要从一组测定值中找出最接近真值的那个值。在化工实验和科学研究中,数据的分布较多属于正态分布,所以通常采用算术平均值。

有关偏差的术语

偏差:分为绝对偏差、相对偏差、平均偏差、标准偏差和相对标准偏差。

  • 极 差:是指某一次测定结果中极大值与极小值之间的差值。
  • 绝对偏差:是指某一次测量值与平均值的差异。
  • 相对平均偏差:是指某一次测量的绝对偏差占平均值的比值。
  • 平均偏差:是指单项测定值与平均值的偏差(取绝对值)之和,除以测定次数。
  • 标准偏差(σ):是指统计结果在某一个时段内误差上下波动的幅度。
  • 相对标准偏差(RSD):是指标准偏差与测量结果算术平均值的比值。

测定某批次 5 袋药品重量,得到如下数据:37.45、37.20、37.50、37.30、37.25(g),计算测定结果的平均值、极差、绝对偏差、平均偏差、相对平均偏差、标准偏差、相对标准偏差:

  • 平 均 值:
  • 极 差:
  • 绝对偏差:各次测定的绝对偏差分别为 0.11、-0.14、0.16、-0.04、-0.09
  • 平均偏差:
  • 相对平均偏差:
  • 标准偏差:
  • 相对标准偏差:

下面是作业(当然不是我的)

在这里插入图片描述

有效数字及其运算规则

在科学与工程中,该用几位有效数字来表示测量或计算结果,总是以一定位数的数字来表示。 不是说一个数值中小数点后面位数越多越准确。

有效数字

一个数据,其中除了起定位作用的 “0” 外,其他数都是有效数字。如 0.0037 只有两位有效数字,而 370.0 则有四位有效数字。

2、有效数字运算规则

记录测量数值时,只保留一位可疑数字。

当有效数字位数确定后,其余数字一律舍弃。舍弃办法是四舍六入不是四舍五入,即末位有效数字后边第一位小于 5,则舍弃不计;大于 5 则在前一位数上增 1;等于 5 时,前一位为奇数,则进 1 为偶数,前一位为偶数,则舍弃不计。这种舍入原则可简述为:“小则舍,大则入,正好等于奇变偶”。

如:保留 4 位有效数字

  • 3.71729→3.717;
  • 5.14285→5.143
  • 7.62356→7.624
  • 9.37656→9.376

在加减计算中,各数所保留的位数,应与各数中小数点后位数最少的相同。

  • 例如将

三个数字相加时,应写为

在乘除运算中,各数所保留的位数,以各数中有效数字位数最少的那个数为准;其结果的有效数字位数亦应与原来各数中有效数字最少的那个数相同。

例如:

应写成

上例说明,虽然这三个数的乘积为 0.3281823,但只应取其积为 0.328。

(5)在对数计算中,所取对数位数应与真数有效数字位数相同。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-11-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小刘IT教程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 误差
    • 系统误差
      • 随机误差
        • 精密度、准确度和精确度
          • 关于平均值术语
            • 有关偏差的术语
              • 有效数字及其运算规则
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档