首页
学习
活动
专区
工具
TVP
发布

学习数据分析,必备的数学知识是啥?

“大学四年就这么结束了,要步入社会了才开始有危机感,想想竞争对手要不是各种名校毕业,要不就是各种奖项加身,在网上海投简历都石沉大海,完全不知道自己能做啥”

如果你依然迷茫,依然不知道自己喜欢什么工作的情况下,有没有什么技能是所有岗位通用,能够帮你在求职中先人一步的呢?

那么这个技能就是:数据分析

如果你还在校园,提前掌握数据分析能力,能让你在今后的求职中更有底气;

如果你正在求职,学习数据分析,能大大提高自己的求职竞争力;

如果你已经工作,数据分析更是你急需学习的技能,提高效率、升职加薪就靠它啦。

随着未来每个人与数据打交道的机会跟频率越来越多,数据分析能力成为工作中的核心竞争力之一!

掌握基本的数据分析能力已经成为刚需!

提到数据分析,很多同学第一反应就是:数据分析要数学很好吧,学习数据分析要掌握什么数学基础才可以呢?

如果说数据分析需要什么数学基础,那统计学应该是涉及最多的了,但不需要非常深入,因为大多数数据分析用到的无非是统计量、数据分布等基础知识。

知识点汇总

集中趋势

集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?

分散性与变异性的度量

离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。例如,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分差或百分点来比较。

概率论基础、独立事件、条件概率、全概率公式以及贝叶斯定律

数据分布

数据分布主要靠几何分布、泊松分布、二项分布来研究数据的分布趋势。例如,目标数据段整体分布是发散的还是集中的?集中在哪个频率段?中位数集中在哪个区间段?占80%的数据集中在什么数据区间段?看分布的目的就是了解业务数据是否稳定,以及数据的集中度。

正态分布

正态数据类型按照属性可以分为连续型数据和离散型数据。

连续型数据属于可以不断细分的数据,如:长度,宽度,高度,密度,温度等。

离散型数据不可被细分,主要来表达客观事物的属性,如:个数,属性,比率等。

不论是连续型数据还是离散型数据,都能使用数据的分布来表达。数据分布属于概率统计范畴,也是数据相关知识的基础。只有对各种数据分布有一定理解,才能选取合适的分析方法和工具,对数据做出合理的分析。分布主要是离散数据与连续数据

统计抽样

统计抽样涉及到如何设计样本、点量估计、比例抽样分析。当对海量数据进行数据分析,查看数据分布情况的时候比较困难。就需要对样本进行抽样,通过抽样样本分布情况来反映总体样本的分布情况。

置信区间

主要是置信区间计算与误差范围计算,以前上学的时候经常会考试,考完试以后老爱去估分,一般人估分不太可能直接估一个具体的数,肯定都是估一个大概的数,啥叫大概的数呢?就是比如高考分数预计 600 左右,这个左右其实就是一个区间,还有平常很多食品包装袋上会写 ±0.5 KG,表示啥意思呢?就是要么多给了你 0.5 KG,要么少给了你 0.5 KG。我们把这种用一个范围来对一个事情进行估计的方式称为区间估计,得出来的区间就是置信区间。

假设检验

假设检验的基本思想,可以理解为带有概率性质的反证法。在总体分布未知或已知分布但有部分参数未知时,为了推断总体的某些未知特性,提出关于总体的假设。我们根据样本提供的信息,计算适当的统计量,对所提的假设做出接受或拒绝的决策。假设检验就是做决策的过程。

唯心鸭z_zhizuobiao

需要注意的是,数据就是数据,问题还是要通过具体的业务措施去解决,数据分析只是告诉你,出问题的地方在哪里,要从哪些方面去改善,你需要由此方向去得出问题解决方案。

都说统计学是数据分析的基石,描述统计学就是用几个关键的数据来描述数据集的整体情况。从而通过数字深层次的了解的一个行业的真实状况,做到心中有数,及时调整,分析预判。以上为学习数据分析需要具备的统计学基础,如有补充欢迎留言。

各平台同名“职坐标在线”

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20201020A02LT600?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券