首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据分析中的常用“公式

虽然文章标题中含有“公式”,但本文侧重于——从公式的角度看数据分析的思维方式。...X->Y 此处用来表示自变量X和因变量Y的关系(严格来说,这个算不上一个公式),公众号的老朋友们应该会发现我在很多文章中都会参考这个公式的框架。...描述、解释、预测是数据分析常见的3种场景: 描述,可以理解为用指标来对业务进行展示的过程,比如报表开发、指标体系等,这个过程好比要用一个量化的指标来衡量Y(比如KPI),然后再分析组成Y需要有哪些成分X...加权求和 该公式表示整体和局部的关系,既可以用于对某个指标的拆解,也可以类似用AHP方法来合成一个新的综合指标。 e.g....连乘公式 通常用于带有“转化率”的场景,比如电商交易是典型的“鱼骨图”或者“漏斗”模式。 连乘公式可以用于业务环节的拆分,也可以和“加权求和”公式混合使用。 e.g.

74810
您找到你想要的搜索结果了吗?
是的
没有找到

公式我都会,为何依然分析不好数据

还在为时至今日依旧搞不懂大数据到底是什么而羞愧?还在为“统计学”这门看似烧脑的学科而望而却步不敢走进它的大门?...你要问:我实在对数字提不起兴趣,那是不是注定要被这个大数据时代抛弃? 为你重启兴趣之门:从现在开始不算晚 你说你不懂得如何激发兴趣? 比如你老跟我聊骰子点数出现的概率有啥意思?...没关系,它也许能深挖出你体内潜藏的求知欲;你感觉这个人被繁冗的理论公式掏空了都没欲望?没关系,他能帮你快速入门,深入浅出了解统计学各类理论知识,解锁操作技能。...这本书不会有繁冗的数学公式推导,不过在有些时候,为了说清楚问题,数学公式和定理是不可或缺的。水平有限,力争通过通俗易懂的语言让大家明白统计是怎么回事,以及统计可以用来做些什么。...喜欢编程并想深入研究理论知识的,可以使用Stata、SAS、R;想要快速解决问题的,可以使用SPSS;甚至可以使用Excel完成绝大多数统计分析工作。

43830

实用的典型相关分析(多公式预警)

在sklearn的交叉分解模块中有两种典型算法族,一个是本文所述的典型相关分析算法(CCA),一个是偏最小二乘算法(PLS),他们都是具有发现两个多元数据集之间的线性关系的用途,本文先解释典型相关分析...常见的,比如考虑一组因变量和一组自变量的关系的量化,这个可以根据各自变量对应的真实数据进行概率学上的相关系数或协方差矩阵算出,如果说因变量有q个,自变量有p个,那就需要计算p*q次,这不仅计算次数多而且会因为忽略变量间强相关性而抓不到问题本质从而得出错误的结果...,所以自然而然会想到抽取同组变量的强相关性部分然后再求不同组的相关性,而抽取方法可以采用主成分的思想进行降维,这也是典型相关分析的思想所在(不过在具体抽取主成分有较大差异),典型相关分析本身是反映两组指标之间的整体相关性的一种多元统计分析方法...则计算此时向量 , 的方差,即有 可用把 看成常数,根据方差公式 ,类比到矩阵即可(tricks: 是向量,向量平方一定是自身与自身转置的乘积,然后再满足矩阵乘法维度变化即可),方差也可表示为自身与自身的协方差...和 不足以解释所有的原始变量,则需要在新找另一组变量 和 ,则此时转化为 后面两项为独立性的约束,很显然这里的思想是排除因为第一组强相关向量的干扰 因为这里是用协方差(这里也是相关系数,因为数据进行标准化后两者等同

86220

七种常见的数据分析法之:公式拆解法

导读 公式拆解法是针对问题的层级式解析,在拆解之前,不能盲目拆解,需要有目的性的找方向,从而挖掘原因。 来源:诸葛io数据教练丨作者:诸葛io ?...看最上面这张图,以日销售额为例做了一次公式拆解分析,这次拆解一共包括了5层,最后一层是对推广效果的衡量。...公式拆解分析法的第一步是需要确定要分析的指标,然后找到这个指标的直接影响因素。...看到这,你明白什么是公式拆解法了么? 所谓公式拆解法就是针对某项指标,用公式表现该指标的影响因素,例如日销售额的影响因素是各商品的销售额,找到影响因素后,需要对影响因素的影响因素进行拆解。...公式拆解法是针对问题的层级式解析,在拆解之前,不能盲目拆解,需要有目的性的找方向,从而挖掘原因。

1.8K10

人工智能大数据背后的神秘公式:贝叶斯公式

转自:工业智能化 大数据、人工智能、海难搜救、生物医学、邮件过滤,这些看起来彼此不相关的领域之间有什么联系?答案是,它们都会用到同一个数学公式——贝叶斯公式。...科学家把所有假设与已有知识、观测数据一起代入贝叶斯公式,就能得到明确的概率值。而要破译某种现象的成因网络,只需将公式本身也结成网络,即贝叶斯网络,它是贝叶斯公式和图论结合的产物。...接下来只需要向这个模型代入观测数据,通过网络节点间的贝叶斯公式重新计算出概率值。为每个新数据、每个连接重复这种计算,直到形成一个网络图,任意两个原因之间的连接都得到精确的概率值为止,就大功告成了。...贝叶斯公式的价值在于,当观测数据不充分时,它可以将专家意见和原始数据进行综合,以弥补测量中的不足。我们的认知缺陷越大,贝叶斯公式的价值就越大。...[5] 统计之都创作小组:失联搜救中的统计数据分析 [6]机器之心:《科学》封面重磅论文:人工智能终于能像人类一样学习

3K50

精通数组公式16:基于条件提取数据

excelperfect 在Excel中,基于AND或OR条件从数据集中提取数据是经常要做的事。...5.这里没有考虑使用VBA解决方案,有时使用它们是自动执行数据提取的好方法。 为何提取数据公式如此复杂? 当从表中提取数据时,实际上是在执行查找。...如下图1所示,提取满足3个条件的数据记录,可以看出有2条记录满足条件。对于垂直表,从多列中提取数据的查找公式不会很难;查找公式难于在多行中使用。...辅助列作为查找列,供查找函数查找并提取数据。 2.基于全数据集的数组公式。这些公式是独立的,不需要额外的列辅助。对于这些公式,必须在公式内为与条件相匹配的记录创建一个相对位置数组。 ?...图4:在单元格H12中输入的最终公式 当条件改变或者数据增加时,提取区域的数据会自动更新,如下图5所示。 ?

4.2K20

Excel公式技巧40: 对数据随机排序

有时候,为公平起见,我们会将一组数据随机排序。如下图1所示,在列D中对列C中的数据随机排序。 ? 图1 实现过程如下: 步骤1:在列C的左侧添加两个辅助列,如上图1中的“序号”和“随机数”列。...步骤3:在列B中每个单元格中输入公式:=RAND(),生成随机数。如上图1所示,可以在单元格B3中输入公式后,下拉至单元格B11。...步骤4:在单元格D3中输入公式: =VLOOKUP(SMALL(B3:B11,A3),B3:C11,2,FALSE) 下拉至单元格B11。...这样,每次工作表重新计算时或者按F9键时,列D中的数据都会重新排列一次,如下图2所示。 ?...图2 上述列D的公式中,每一个单元格都在列B中查找对应的列A中相应位置的数字,然后返回相应的列C中的数据,由于RAND函数是易失的,因此每次工作表重新计算(输入数字、设置格式等)或者按F9键强制工作表重新计算时

4K30

Excel公式技巧18: 使用公式排序

本文给出一个基于公式的排序解决方案,将指定区域内的数据按字母顺序排序。 如下图1所示,在单元格区域A2:A11中是一组未排序的数据,在单元格区域B2:B11中是已排序的数据。 ?...工作原理 让我们以单元格B8中的公式为例来分析: =LOOKUP(1,0/FREQUENCY(ROWS($1:7),COUNTIF($A$2:$A$11,"<="&$A$2:$A$11)),$A$2:$...A$11) 与单元格B2中的<em>公式</em>相比,唯一的变化是ROWS函数内由1改成了7。...<em>公式</em>中: COUNTIF($A$2:$A$11,"<="&$A$2:$A$11) 对于该区域内的每个字符串,返回一个值数组,对应该区域内按字母顺序位于该字符串之前或等于该字符串的字符串数。...($1:7),COUNTIF($A$2:$A$11,"<="&$A$2:$A$11)),0)) 小结 虽然可以使用Excel的排序功能,但使用<em>公式</em>可以实时更新<em>数据</em>。

1.9K20

Latex公式编辑和子公式编辑

这里,“\label{XX}”为可选项,表示在文档中该公式标记为“XX”,在正文中通过“\eqref{XX}”来引用该公式编号(带括号)。...这里,\ref{YY}表示引用公式YY的编号(不含括号),\tag{\ref{YY}{a}}表示给该行公式打上标签,也可以写为\tag{2a},但是,这种条件下(2a)中的2不会随着YY公式编号的改变而改变...pss: align支持使用“&”使多行公式在指定位置对齐,公式的latex代码中不允许有空行;3、子公式编号格式二(编号为(1a)、(1b))首先可以使用“\tag{}”给各行公式任意编号,但是默认编号值不加一...在latex代码中标记为“ZZ”的公式,原本应该编号为(4),但是自动编号为(3)。...在上面的公式中,(3a)(3b)中的'a'、'b'是自动编号的。

3.8K30

最美公式

欧拉公式暗示着:大自然充满无限想象,但是最终都会归于终点。 我们宇宙诞生于138亿年前的一次暴涨,那么138亿年前发生了什么事?...另外,虚数在物理学中还隐含了时间的属性,比如广义相对论的四维时空(闵可夫斯基时空)中时间就是虚数;而广义的欧拉公式e^ix=cosx+isinx,随着x的增长,该公式的数学图形是绕着原点旋转,定义域在[...简简单单的一个数学公式,也只使用了最基本的运算符号,不仅把数学中最基本的五个常数联系了起来,还包含了如此深奥的宇宙哲学原理,被称作“宇宙第一公式”一点不过分。   ...在数学中,你再也找不到能与之媲美的公式了,或许只有物理学中的质能方程还能一较高下;比如下图这个数学公式,虽然也包含了数学的基本常数,但是与欧拉公式相差甚远。...欧拉公式不仅仅是形式优美,而且还有着巨大的实用价值,比如在研究交流电时少不了它,信号分析时的必备数学工具,量子力学的重要数学工具,极坐标切换需要它,求反常积分需要它,研究任何圆周运动使用欧拉公式都能大大得到简化

91120

Excel公式技巧61:插值公式技术

学习Excel技术,关注微信公众号: excelperfect 一个项目从2013年开始投资,相关数据如下图1所示,求该项目的投资回收期?也就是说,累计现金流等于0的那个时间点。 ?...可以以时间为横坐标,现金流数据为纵坐标,绘制图表后,测量横坐标上的时间来近似求出;也可以使用三角形等比公式来精确求得。这里使用公式来计算。...在单元格D8中输入公式: =(FORECAST(0,OFFSET(C4,,MATCH(0,C6:G6)-1,1,2),OFFSET(C6,,MATCH(0,C6:G6)-1,1,2))-C4)/365...公式的关键在FORECAST函数,包含有3个参数。...,2,1,2) 得到单元格区域:E4:F4 同理,公式中的: OFFSET(C6,,MATCH(0,C6:G6)-1,1,2) 得到单元格区域E6:F6 因此,公式中的FORECAST函数转换为: =FORECAST

2.3K20

精通数组公式17:基于条件提取数据(续)

excelperfect 导语:本文为《精通Excel数组公式16:基于条件提取数据》的后半部分。 使用数组公式来提取数据 创建数据提取数组公式的技巧是在公式内部创建一个“匹配记录”相对位置的数组。...图8:匹配的数据数据集中的第7行和第10行 在单元格F12中输入下面的数组公式: =IF(ROWS(F12:F12)>7,"",INDEX(A20,SMALL(IF(A11:A20>=3,IF(A11...图12:使用辅助列使公式更简单易懂 示例:提取满足OR条件和AND条件的数据 如下图13所示,需要提取West区域或者客户K商品数在400至1300之间的数据,使用的数组公式如图。 ?...图13:提取满足OR条件和AND条件的数据 示例:提取满足OR条件和AND条件且能被5整除的数据 如下图14所示,需要提取West区域或者客户K且商品数能被5整除的数据,使用的公式如图。 ?...4.有两种有用的方法来考虑数据提取公式:提取匹配一组条件的记录或数据;从单个查找值返回多个数据值。 注:本文为电子书《精通Excel数组公式(学习笔记版)》中的一部分内容节选。

3.2K10
领券