3、Countif函数 作用:根据条件统计个数 示例:统计两个列重复的内容 =COUNTIF(Sheet15!A:A,A2) 说明:如果返回值大于0说明在另一个表中存在,0则不存在。 ?...8、Averageif函数 作用:根据(单)条件统计平均值 示例:统计平均数(不包含0值) =AVERAGEIF(C2:C4,">0") ?...9、Averageifs函数 作用:根据(多)条件统计平均值 示例:统计员工中财务部大专学历的平均工资 =AVERAGEIFS(D:D,B:B,"财务",C:C,"大专") ?...14、Trimmean函数 作用:返回一组数中的修剪平均值,即按一定比例除去最大和最小后计算平均值 示例:从评分中除去一个最大值和一个最小值后计算平均值。...15、Rank函数 作用:计算某个值在一组数据中的排名 示例:在C列计算当日收入的总排名 =RANK(B2,B:B) ?
3.计算占比 有了前面的基础,就可以进行最终计算了:直接用商品金额ext_price除以订单总额sum_price。并赋值给新的列pct即可。 ?...4.格式调整 为了美观,可以将小数形式转换为百分比形式,自定义函数即可实现。 ? 思路二: 对于上面的过程,pandas中的transform函数提供了更简洁的实现方式,如下所示: ?...这种方法在需要对多列分组的时候同样适用。 多列分组使用transform 为演示效果,我们虚构了如下数据,id,name,cls为维度列。 ?...本文开头的例子就是这样。而apply函数返回聚合后的行数。例如: ? transform和apply的另一个区别是,apply函数可以同时作用于多列,而transform不可以。...在上面的示例数据中,按照name可以分为三组,每组都有缺失值。用平均值填充是一种处理缺失值常见的方式。此处我们可以使用transform对每一组按照组内的平均值填充缺失值。 ?
MongoDB 聚合查询 在MongoDB中我们可以通过aggregate()函数来完成一些聚合查询,aggregate()函数主要用于处理诸如统计,平均值,求和等,并返回计算后的数据结果。...相当于SQL分组语法group by column_name中的column_name部分。如果根据某字段的值分组,则定义为_id:’$字段名’。...可以自定义,类似SQL中的字段别名。 $sum:如果取值为1表示总条数,相当于每个document中都多个count属性,count取值为1,累加和就是总条数。...:"$name",avgAge:{$avg:"$age"}}}]); 统计结果返回数组 - $push 分组后按照分组数组进行合并,如果希望看到某个列合并之前的所有数据可以使用$push,把分组后同一组的所有值放到一个数组中...]) 运行结果 数组字段拆分 - $unwind $unwind会把数组列进行拆分,原来的document会根据数组属性值个数分为多个document。
MongoDB 聚合查询 在MongoDB中我们可以通过aggregate()函数来完成一些聚合查询,aggregate()函数主要用于处理诸如统计,平均值,求和等,并返回计算后的数据结果。...相当于SQL分组语法group by column_name中的column_name部分。如果根据某字段的值分组,则定义为_id:’$字段名’。...可以自定义,类似SQL中的字段别名。 $sum:如果取值为1表示总条数,相当于每个document中都多个count属性,count取值为1,累加和就是总条数。...:"$name",avgAge:{$avg:"$age"}}}]); 统计结果返回数组 - $push 分组后按照分组数组进行合并,如果希望看到某个列合并之前的所有数据可以使用$push,把分组后同一组的所有值放到一个数组中...数组字段拆分 - $unwind $unwind会把数组列进行拆分,原来的document会根据数组属性值个数分为多个document。
2、查看多列 ? 3、查看特定行 这里使用的方法是loc函数,其中我们可以指定以冒号分隔的起始行和结束行。注意,索引从0开始而不是1。 ? 4、同时分割行和列 ? 5、在某一列中筛选 ?...8、筛选不在列表或Excel中的值 ? 9、用多个条件筛选多列数据 输入应为列一个表,此方法相当于excel中的高级过滤器功能: ? 10、根据数字条件过滤 ?...11、在Excel中复制自定义的筛选器 ? 12、合并两个过滤器的计算结果 ? 13、包含Excel中的功能 ? 14、从DataFrame获取特定的值 ?...五、数据计算 1、计算某一特定列的值 输出结果是一个系列。称为单列数据透视表: ? 2、计数 统计每列或每行的非NA单元格的数量: ? 3、求和 按行或列求和数据: ? 为每行添加总列: ?...9、多条件求和 ? 10、求算术平均值 ? 11、求最大值 ? 12、求最小值 ? 13、Groupby:即Excel中的小计函数 ?
条件过滤 我们需要看第一季度的数据是怎样的,就需要使用条件过滤 体感的舒适适湿度是40-70,我们试着过滤出体感舒适湿度的数据 最后整合上面两种条件,在一季度体感湿度比较舒适的数据 列排序 数据按照某列进行排序...“by”参数可以使用字符串,也可以是列表,ascending 的参数也可以是单个值或者列表 ascending 默认值是 True 列中的每行上的 apply 函数 在前一篇的增加列的部分,根据风速计算人体感觉是否舒适...详见代码: 均值和标准差 我们通过 describe 方法查看的统计信息中均值和方差都是按照列统计呢,这里要说的,既可以按照列,还可以按照行 均值,行 df.mean(axis=0),列df.mean(...datetime') 在 DataFrame 中查找 NaN 每行有多少 NaN,df.isnull().sum() Dataframe 中 NaN 的总数,上面统计出来的数量求和,df.isnull(...特别是统计数量、计算和、求平均值,等等。
添加误差棒 (1)计算标准偏差,将所有数据输入Excel, 分别计算每组数据的平均值 (2)将所有数据输入Excel,用公式“stdev”计算每组数据的标准偏差 (3)将X轴数据,平均值,标准偏差输入origin...add function 和add column),最后单击OK,新计算出的数据出现在先前选中的数据列中。...2)自定义拟合 origin 中虽然提供了强大的拟合曲线库外,但在实际使用中,你可能会发觉在所提供的曲线库中没有你想要拟合的公式。这时你就可以使用用户自定义公式进行拟合。...在action中选simulate,在参数中填上你根据数据及其它一些条件确定的粗略的初始参数以及拟合起始点的位置及拟合点数,然后按下create curve就会在图上出现一条拟合曲线,但这往往与期望值差距较大...参数优化采用试错法,根据曲线形状逐渐改变参数,注意,多参数时改变任何一个参数都会改变曲线形状,因此可以一次变一个参数,直到达到满意的形状。
而在Applying操作步骤中还可以进行以下数据操作处理: 聚合(Aggregation)处理:进行如平均值(mean)、最大值(max)、求和(sum)等一些统计性计算。...aggregate对多列操作 除了sum()求和函数外,我们还列举几个pandas常用的计算函数,具体如下表: 函数(Function) 描述(Description) mean() 计算各组平均值 size...同时计算多个结果 可能还有小伙伴问“能不能将聚合计算之后的新的结果列进行重命名呢?”,该操作在实际工作中经常应用的到,如:根据某列进行统计,并将结果重新命名。...在pandas以前的版本中需要自定义聚合操作,如下: # 定义aggregation汇总计算 aggregations = { #在values01列上的操作 'values01': {...这里举一个例子大家就能明白了,即我们以Team列进行分组,并且希望我们的分组结果中每一组的个数都大于3,我们该如何分组呢?练习数据如下: ?
条件过滤 我们需要看第一季度的数据是怎样的,就需要使用条件过滤 image.png 体感的舒适适湿度是40-70,我们试着过滤出体感舒适湿度的数据 image.png 最后整合上面两种条件,在一季度体感湿度比较舒适的数据...默认值是 True 列中的每行上的 apply 函数 在前一篇的增加列的部分,根据风速计算人体感觉是否舒适,为了功能的演示,在这里使用 DataFrame 的 apply 方法,他会在指定列的每个值上执行...详见代码: image.png 均值和标准差 我们通过 describe 方法查看的统计信息中均值和方差都是按照列统计呢,这里要说的,既可以按照列,还可以按照行 均值,行 df.mean(axis=0)...(df_2, how='left', on='datetime') 在 DataFrame 中查找 NaN 每行有多少 NaN,df.isnull().sum() Dataframe 中 NaN 的总数...特别是统计数量、计算和、求平均值,等等。
输入: 答案: 28.如何计算numpy数组的平均值,中位数,标准差?...难度:2 问题:在iris_2d的sepallength(第1列)中查找缺失值的数量和位置。 答案: 34.如何根据两个或多个条件过滤一个numpy数组?...输入: 输出: 答案: 53.如何根据给定的分类变量创建分组ID? 难度:4 问题:根据给定的分类变量创建组ID。使用以下iris的species中样品作为输入。...答案: 57.如何计算numpy二维数组每行中的最小值? 难度:3 问题:针对给定的二维numpy数组计算每行的min-max。 答案: 58.如何在numpy数组中找到重复的记录?...难度:3 问题:查找由二维numpy数组中的分类列分组的数值列的平均值 输入: 输出: 答案: 60.如何将PIL图像转换为numpy数组?
) 计算指定行的值的平均值 DOUBLE avg(DISTINCT col) 计算排重后的值的平均值 DOUBLE min(col) 计算指定行的最小值 DOUBLE max(col) 计算指定行的最大值...DOUBLE variance(col)var_pop(col) 返回集合 col 中的一组数值的方差 DOUBLE var_samp(col) 返回集合 col 中的一组数值的样本方差 DOUBLE...salary) FROM employees; 4 77500.0 3.表生成函数 表生成函数是与聚合函数“相反的”一类函数,其可以单列扩展成多列或者多行。...下面我们通过一个例子来进行讲解,如下的语句将 employees 表中每行记录中的 subordinates 字段内容转换成0个或者多个新纪录,如果某员工 subordinates 字段为空,如果不为空...array数组中的一个元素 N行结果 explode(MAP map) 返回0到多行结果,每行对应每个map键-值对,其中一个字段是map的键,另一个字段对应map的值 数组的类型 explode(ARRAY
accumulator允许编写自己的自定义聚合IF函数(甚至可以使用REDUCE编写PRODUCTIF),如果集中于LAMBDA的计算部分,可以看到: IF(AND(value>G3,value<G4)...这些函数接受一个数组或区域,调用lambda,并将所有数据按每行或列分组,然后返回一组单个值。 这两个函数很好,因为它们允许进行以前不可能的计算,它们会产生数组。...图4 如果没有BYROW,将需要创建一个辅助列,并使用一组公式计算平均值,然后可能使用筛选或其他一些功能。 使用BYROW,可以创建一个满足约束条件的LAMBDA,然后将结果传递给FILTER函数。...LAMBDA参数,accumulator:从LAMBDA中返回的值;value:从数组中的值。 MAKEARRAY函数,通过应用LAMBDA函数,返回指定行和列大小的计算数组。...BYCOL函数,将LAMBDA应用于每一列并返回结果数组。参数array,按列分隔的数组;参数lambda,一种将列作为单个参数并计算一个结果的LAMBDA。
df.groupby([col1,col2]) 从多列返回一组对象的值 df.groupby(col1)[col2] 返回col2中的值的平均值,按col1中的值分组(平均值可以用统计部分中的几乎任何函数替换...) df.pivot_table(index=col1,values=[col2,col3],aggfunc=max) 创建一个数据透视表,按col1分组并计算col2和col3的平均值 df.groupby...(col1).agg(np.mean) 查找每个唯一col1组的所有列的平均值 data.apply(np.mean) 在每个列上应用函数 data.apply(np.max,axis=1) 在每行上应用一个函数...df.describe() 数值列的汇总统计信息 df.mean() 返回所有列的平均值 df.corr() 查找数据框中的列之间的相关性 df.count() 计算每个数据框的列中的非空值的数量 df.max...() 查找每个列中的最大值 df.min() 查找每列中的最小值 df.median() 查找每列的中值 df.std() 查找每个列的标准差 点击“阅读原文”下载此速查卡的打印版本 END.
•选中要计算的区域 •在数据菜单下点击删除重复值按钮 •选择要对比的列,如果所有列的值均相同则删除重复数据 •点击确定,相容内容则被删除,仅保留唯一值 条件格式删除重复项 使用排序的方法删除重复项有一个问题...3.忽略默认值,不去处理 用平均值填充缺失值 •选择B列数据,计算平均值 •将平均值单独复制一行(选择值粘贴),务必复制,否则将会出现循环引用。...循环引用:A单元格中的公式应用了B单元格,B单元格中的公式又引用了A •Ctrl+G唤出定位菜单,选的定位空值,找到B列的所有空值 •应用平均值数据,按住Ctrl+Enter同时填充所有缺失值位置 数据加工...然后输入三个参数(数据,规则,返回结果列) 3.数据合并 数据拆分是指将一列数据分为多列,而数据合并是指将多列数据合并为一列。...自定义筛选 普通筛选只能按照一种标准进行筛选,如果需要筛选出满足两个条件的数据,就需要用到自定义筛选。
下面是支持在参数中使用通配符的Excel函数: AVERAGEIF 返回区域内满足一个条件的所有单元格的平均值(算术平均值)。 AVERAGEIFS 返回满足一组或多组条件的所有单元格的平均值。...COUNTIF 计算满足一个条件的单元格数。 COUNTIFS 计算满足一组或多组条件的单元格数。 DPRODUCT 将列表或数据库中与指定的条件匹配的记录字段(列)中的值相乘。...DSTDEVP 通过使用列表或数据库中与指定的条件匹配的记录字段(列)中的数字,计算基于整个总体的总体标准差。 DSUM 在列表或数据库中与指定的条件匹配的记录字段(列)中的数字之和。...DVARP 通过使用列表或数据库中与指定的条件匹配的记录字段(列)中的数字,计算基于整个总体的总体方差。 HLOOKUP 在表或值数组的顶行中搜索值,然后在表或数组中指定的行返回同一列中的值。...MAXIFS 返回由一组或多组条件指定的单元格中的最大值。 MINIFS 返回由一组或多组条件指定的单元格中的最小值。 SEARCH 在另一个文本值中查找一个文本值(不区分大小写)。
笛卡尔积的表示方法: 笛卡尔积可表示为一张二维表 表中的每行对应一个元组,表中的每列对应一个域 例如: D1=导师集合SUPERVISOR={张清玫,刘逸} D2=专业集合SPECIALITY={计算机专业...,表的每行对应一个元组,表的每列对应一个域; 5、属性 关系中不同列可以对应相同的域; 为了加以区分,必须对每列起一个名字,称为属性(Attribute); n目关系必有n个属性; 6、码 候选码(Candidate...2、参照完整性 关系间的引用 例:学生、课程、学生与课程之间的多对多联系: 学生(学号,姓名,性别,专业号,年龄) 课程(课程号,课程名,学分) 选修(学号,课程号,成绩) 例:学生实体及其内部的一对多联系...3、用户自定义完整性 用户根据当前环境自行定义,例如 check 分数 >= 0 and 分数 <= 60; 针对某一具体关系数据库的约束条件,反映某一具体应用所涉及的数据必须满足的语义要求; 关系模型应提供定义和检验这类完整性的机制...R 中的 Y 与 S 中的 Y 可以有不同的属性名,但必须出自相同的域集。 R 与 S 的除运算得到一个新的关系 P(X) 。 P 是 R 中满足下列条件的元组在 X 属性列上的投影: ?
主键 表中每一行都应该都有一列或者几列来唯一标识自己。主键用来表示一个特定的行。 主键:一列或者几列,其值能够标识表中每行。...如果表中的列可以作为主键,则它必须满足: 任意两行都不具有相同的主键值(主键列不允许NULL值) 每行都必须有一个主键值 主键列中的值不允许修改或者更新 主键值不能重用(如果某行从表中删除,则它的主键不能赋给以后的行记录...如果它不是最后的子句,那么就会报错。 按多个列排序 在实际的需求中,我们经常会遇到根据多个列进行排序。比如根据员工的姓名排序,如果姓相同,再根据名字进行排序。...七、创建计算字段 计算字段 存储在数据库表中的字段一般不是应用程序中所需要的格式。我们需要直接从数据库中检索出来进行转换、计算或者格式化过的数据。计算字段并不实际存在于数据库表中。...计算字段是运行时在select语句内创建的。 拼接字段 将多个字段联结在一起构成单个字段。根据不同的DBMS,使用+或者||来进行联结。但是在MySQL中必须使用特殊的函数来进行操作。
如有一组数组数据m个n维列向量Anxm 想要降维,随意丢弃数据显然不可取,降维可以降低程序计算复杂度,代价是丢弃了原始数据一些信息,那么降维的同时,又保留数据最多信息呢。...此处,一个字段的方差可以看做是每个元素与字段均值的差的平方和的均值,即: 假设Anxm已经是每行元素减去均值,那么每行均值为0(这么操作可以带来很大的方便,等于对数据做了平移操作),每行方差为...协方差 上图,在n维空间中u是Anxm一个列向量,投影到低维空间中,e是低维空间一个基向量,||e||=1,需要确定e的方向,使得A的列向量投影到e的点方差最大,也就是很分散,向量u投影到e的坐标是它们的内积...,先算平均值 方差就简单多了 这是个二次型,求最大方差转化为求该二次型最大值 由对称矩阵性质,对称矩阵AA^T的特征向量构成n维空间一组标准正交基,用矩阵p表示,则向量e可以被...,如下图所示,红色和蓝色的点为原数据,中间绿色的点为重构后的数据,由此可看出,这种情形下,主元方向不能保持数据的聚类信息(使用LDA)。
我们可以这样理解:where筛选的是行(一个元组),而having筛选的是组(多行元组)。 GROUP BY子句 : 将查询结果按某一列或多列的值分组,值相等的为一组。...分组后聚集函数将作用于每一个组,即每一组都有一个函数值。如果分组后还要求按一定的条件对这些组进行筛选,最终只输出满足指定条件的组,则可以使用 HAVING短语指定筛选条件。...) AVG( LDISTINCTIALL]k列名>)计算一列值的平均值(此列必须是数值型) MAX([ DISTINCTIALL])求一列值中的最大值 MIN([DSTⅠ NCTIALL]...)求一列值中的最小值 HAVING使用举例 例一 显示每个地区的总人口数和总面积.仅显示那些面积超过1000000的地区 SELECT region, SUM(population), SUM...: (1)where子句查找符合条件的数据; (2)使用group by 子句对数据进行分组; (3)对每个分组运行聚集函数计算; (4)用having 子句去掉不符合条件的组。
领取专属 10元无门槛券
手把手带您无忧上云