首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

四种分组求和方法,操作简单效率又高竟然是这个!| Power Query实战

这个问题很常见,解决起来也不难,即按“型号+序号”进行分组,对后面各“日期求和: 这个问题方法很多,当数据量不大时候,各种方法在效率上不会有多大差异,但是,如果数据量很大,可能就会体现出来较大差别...”等聚合内容,单击确定,即可得到最终结果: 这种方法操作也不复杂,实际是利用了表展开时“聚合”功能,背后调用了Table.AggregateTableColumn函数。...关于这个函数,我曾经在以前文章《合并查询,一个严重效率问题以及简单解决办法 | PQ优化实战》里提到过,效率比较低,尽量避免使用。在这个例子里,最后测试结果也是,这种方式效率是最低。...因为每个日期作为一数据,从数据建模角度来说,一般建议转换为每一行(逆透视),后续也没有必要进行汇总后横着放。...从这个简单例子,大家可以看到,同一个问题,往往有很多解决办法,在不同场景下,可能不同方法之间在效率、适应性等等方面都有差异

2.9K30

汇总Excel数据,列名不一样怎么办?| Power Query实战

日常工作中,很多朋友遇到类似如下问题——多个要汇总Excel工作表,列名却存在一些差异,比如有的表里叫“日期”,而另一个表里可能是“采购日期”…… 碰到这种情况,该怎么办?...首先,这个问题如果说有一劳永逸办法,那肯定是规范数据源头,比如对填报数据设定模板,对表头进行锁定……但如果数据已经这个样子了,那么,就要根据实际情况进行灵活处理。以下讲2种比较常见情况。...(true)识别列名,这样,得到结果将是按位置生成列名,直接合并再筛选数据即可。...接下来是比较复杂第2种情况,即位置也不是一一对应!...这时,可以继续细分为以下2种情况: 1、列名有比较明确规则,比如,【日期都包含“日期”两个字、【采购人员】都包含“采购、员”三个字…… 这时,因为虽然列名有差异,位置也不一致,但命名有规律可循

1.8K30
您找到你想要的搜索结果了吗?
是的
没有找到

这样Power BI周分析你见过吗?

按周进行分析,首先需要创建一个日期表(关于日期表创建多种方式可参考这篇文章:Power BI创建日期几种方式概览),或者在已有日期表中新建“WEEKDAY”和“WEEKNUM”: ?...")" 然后在把两合为一,或者干脆直接一搞定也可以。...不过,细心你已经发现了,排序是乱,并不是按照周一到周日或者周日到周六顺序排。很明显,此时要排序,结果发现是不支持直接排序: ? 所以我们需要用到一个初学者经常会问【按排序】了。...选中“周几”,点击按排序,按WEEKDAY进行排列,是不是符合你要求了: ? 再经过一些恰当修饰,就得到了一个比较美观按周展示矩阵了: ?...自动调整列宽对于绝大部分矩阵来说是很必要,否则可能会出现领导打开报告看到是这样一幅画面: ? 那有没有办法既让矩阵自动调整列宽,又让首列自动分为两行呢? 答案是肯定: ? 如何实现呢?

3.3K41

圣经中校验码

但是和《史记》不同是,《圣经》写作持续了很多世纪,不是由某一位作者单独编著而成,后世的人一直在做补充。当后世的人看到几百年前抄本时,难免也会抄写错误。...同样办法,对于每一也是这样处理,把每一文字对应数字加起来,就得到了这一校验码。...当犹太学者抄写完一页《圣经》时,他们需要把每一行和每一文字对应数字加起来,得到行和校验码,如果每一行和每一校验码和原《圣经》校验码一致,则说明抄写正确,没有出现错误文字。...如果发现某一校验码和原《圣经》校验码不一致,则说明该行文字中和原《圣经》不一致,出现了抄写错误情况。但是这一行有很多文字,到底是哪个文字抄写错误了,我们暂时还不得而知。...当然我们也可以对该行文字一个一个和原《圣经》进行对比,但是还有没有更轻松准确办法? 答案是:有。

92120

因果推断DiD方法在游戏数据分析中实践

假设我们灰度了一个新推荐策略,实验用户高留存是由新策略导致吗,这个策略能带来多大收益,有没有存在一种可能:实验用户正好是高活跃用户?...在历史观测数据上去研究某个干扰变量是否会对留存造成影响,把某一用户分为实验组和对照组,然后比较这两组用户次日留存。两组用户次日留存肯定是有差别的,但又有多少差异是由于干扰变量带来?...要探究上述问题,最好方法可能是使用随机流量AB实验,但是AB实验也存在一些局限性,在之前写过一篇文章《AB实验踩坑之路》中提到,有些情况下可能没办法控制想要测试干扰变量。...历史上取了4个日期数据,实验组和对照组因为是用11月17日用户筛选出来,在其他日期部分用户没有登陆,所以留存率是小于1。...treatment日期前两天和后一天入组用户活跃比例 我们首先得到第一层差分,即各组内11月16日和11月18日之间活跃情况差异

1.9K21

3分钟学会Excel“自主学习”

1 信息拆分 下面表格数据,我们是不是经常遇到呢?我们需要将信息拆分成两,更方便我们进行信息收集。Excel分列功能就能够完成目标,但是因为名字长度不同,分列功能出现了短板。...接下来是成绩,与“姓名”同理。我们需要注意是,姓名列和成绩是无法同时进行多填充。 ? 2 如何从身份证中快速提取出生日期 我们都知道,身份证第七个数字到第15个数字中间数据为出生日期。...从身份证中提取出生日期,以得到用户年龄是很常见问题。如下表中,我们有用户身份证号,现在你需求是:需要从身份证中提取出生日期,你可能会想到分列或者MID函数,那有没有一键解决办法呢?...3 如何快速合并分离信息 快捷键“ctrl+E”除了拆分信息,身份证提取出生日期,还可以进行信息合并。比如我们看如下信息,想要进行第一和第二合并,并用符号“-”合并,在第三进行填写。...,并非excel形式日期格式,对于这样日期格式,不可以采用"DATE"等日期计算函数,所以我们需要对其修改格式。

79010

PowerBI 基于移动平均及最小二乘法动态趋势预测

首先来看一个按日期(到日期级别细度)来KPI图。 柱形图 ? 非常凌乱。 只选择一年,则有: ? 折线图 没有办法看出任何走势。如果改为折线图,则有: ? 可以看出这个摆动幅度非常大。...移动平均原理 如果将任何一个点值都由此前7个值平均得到,就是7日移动平均了。考察如下示意图: ? 解释移动平均: ? 例如对于第X号日期,其移动平均为[X-6,X]共7日指标值算术平均。...MAX( 'Calendar'[日期] ) , -7 , DAY ) ) / 7 于是就可以得到: ?...动态参数化 不难想到,可以将刚刚度量值进行动态化,得到: KPI.RA.X = // Rolling average AVERAGEX( DATESINPERIOD( 'Calendar'[日期...某个实验得到四个红色点:(1,6),(2,5),(3,7),(4,10),而我们知道这些点应该与一条直线吻合,所以我们希望通过这几个点来卡出一条直线,该直线与已知数据点整体差异最小。

2.5K22

把表头日期整到一?很多人会碰到这个小问题,其实很简单!|PQ实战

因为每个细分表所需要取日期不一样,我们无法直接将某一日期赋值到整列,所以只能根据日期标志先把日期提到并列位置: 然后再进行向下填充: 这个时候,有的朋友可能就会按照前面单表处理方式,删除前几行,...然后提升标题…… 但是,这样操作就会发现,有一列名是动态日期!...为了避开这个问题,我们考虑换一种方式,即在提升标题前,先想办法把列名搞定,其实也很简单,我们再添加一个条件即可: 即基于我们前面填充号日期,再进行判断,如果是各细分表标题行,就直接赋值“日期”,...这样,我们就可以把原来填充日期删掉,然后继续按单表思路进行处理了。 具体处理过程可下载数据文件参考。...- 03 - 关于套路 表头日期转成一是数据规范处理时典型问题,其他还有单号或者填表人等等,也经常单独放在表头或表尾,但请不要把某一种解法视作“套路”!

32610

2021第二期_数据挖掘班_微信群答疑笔记

尝试写了一个函数,把每一提取出来变成新CSV,但是在文件名命名上好像没办法实现自动化? file=后面应该写引号里加文件名对不对?...,harmony会友好很多哦,你只需要指定sce某一,需要被整合那个因素 如果用seurat的话,FindIntegrationAnchors()使用list(),把72个单独对象,生成一个list...作者组织这个文件有点特殊,读取时候,默认参数搞不定,需要去找找参数,也有更快解决问题办法,就是annoprobe 做差异分析时,报错,这是我exp列名,是不是要把空白去掉呀,为啥会有空白呢?...网上搜了是把不全补全为NA,这样调整后感觉会对原始数据有影响呢? 确定一个办法不行,就换另一个,搜到结果也不止这一个。...想请问一下老师们 R中有没有办法模糊识别呀 就是我从两个地方下载得到表格想要通过基因全称来合并 但是可能两边基因全称有一点点区别 比如-变成空格这种 虽然变化很小 但是%in%就没法识别了 R中没那么智能

98130

Power BI 人力资源应用:动态计算年龄

假设我们想查看30岁以下员工数量,通常我们可能导出人力系统中员工信息,然后新建一,如下计算: 但这有一个问题,此处年龄是静态截止到现在年龄,如果我们想动态查看不同年份30岁以下员工数量,例如如下...: 请注意这个动画中两个信息,首先每个人年龄会随着年份变化而自动变化。...或者,我们可能还需要按照年份查看30岁以下员工趋势,准备各个年份节点HR数据再汇总会显然过于冗余。 那么,有没有更好办法实现?其实在Power BI中实现该功能只要将年龄从转换为度量值即可。...首先,将数据准备好,员工信息可从公司系统导出,日期表按照以下函数新建: 日期表 = CALENDAR(DATE(2015,1,1),DATE(2019,12,31)) 日期表与员工信息表之间不要建立关系...然后新建年龄度量值(不是计算): 年龄 = MAX('日期表'[年])-MAX('员工信息'[出生年份]) 接着使用度量值计算30岁以下员工数量: 30岁以下员工数量 = CALCULATE ( [员工数量

2.3K20

如何在矩阵行上显示“其他”【3】切片器动态筛选猫腻

1.建立子类别和年度组合表 使用SUMMARIZE函数将子类别和年度组合列出来 子类别表2 = SUMMARIZE('data',data[子类别],'日期表'[年度]) 2.添加sales计算...你也可能会说,当切片器选择某一具体年时候,桌子是9还是7这个问题是固定,比如,切片器选择了2019,桌子排序就固定是7。...同样,按照其他进行排序,也是会得到同样结果: 事情好像无法往下进行了。 但是铁人王进喜有句名言:“有条件要上,没有条件,创造条件也要上。” 我们再重新审视一下这个按排序错误。...对于子类别中同一个值,sales.oneyear.rankx2不能有多个值。 如果说这个问题有解决办法,那么突破口一定是在这个位置。...1.不同年份子类别名称自然是相同 2.不同年份排序数字一般也是不同 对于第二条,100%没有办法进行操作,必然是不同

2.5K20

基本 SQL 之增删改查(二)

聚合函数: AVG(column_name):求取结果集某一平均值,如果某条记录行该字段NULL,将不参与平均值计算 COUNT(column_name):统计结果集中数据记录行数,即统计有多少条数据...MAX(column_name):返回结果集中某最大值 SUM(colunmn_name):求和结果集某 MIN(column_name):返回结果集中某最小值 除此之外,还有一些求标准差,...日期时间函数: 由于日期函数在不同数据实现来说,很多相同功能函数具有不同函数名称,我们这里仅以 MySql 来介绍这些函数,给你一个宏观印象,不同数据库之间只不过语法差异,搜索引擎就可以解决。...NOW():返回当前日期时间,精确到时分秒 CURDATE():返回当前日期 CURTIME():返回当前时间 DATA(日期时间/日期表达式):该函数用于提取参数中日期部分,参数可为一个时分秒日期对象...,看有没有预定义函数能够解决你的当下需求。

88220

中、英文与数字月份互转,总有一种你会用到!

1 在日常工作中,大家会用到各种月份表达方式,比如英文简写、英文全称、中文和数字等,如下图所示: 但是,我们更多时候,不是对月份本身单独使用,月份从日期而来,而有用到日期地方...对于这个简单写法,你有没有想过:为什么出来月份名称是中文,而不是英文?...其实,这只是因为咱们系统区域(语言)设置为中文了!所以,这里面其实有个陷阱:如果你系统语言改成了英文,那得到结果就变了!...([英文转日期]) 4、中文转数字 因为中文月份没办法转为日期,所以,要转换的话,我们可以通过预设列表方式来实现,也就是找到这个列表位置即可(记得加1哦): = List.PositionOf...我们可以随便找一,右键-更改类型-使用区域设置: 然后选择需要“区域”: 查看生成公式就能找到对应写法了: 6 关于日期格式、区域语言转换问题,

4.8K31

通过日期偏移来解决因中美习惯不同而导致PowerBI相对日期切片器周分析错误问题

所以这个问题没有几乎办法100%解决,除非开发人员特地为中国用户设置选项,通过选项可以设定一个周第一天是周一。 所以我们还得想别的办法。..."问题,也是用同样办法: ?...添加一date2,把date日期向前推了一天,然后把date2作为切片器时,选择当前周,默认还是会筛选date25月17日(周日)到5月23日(周六),不过这个时候date筛选就会变成5月18...所以在结果矩阵中,是根据date去筛选,所以会得到正确按照Monday为一周第一天来显示数据。...一个办法是添加一个空白按钮将这个日期范围给隐藏起来,用户直接看表中日期即可: ? 当然,追求完美的你,也可以试试通过其他办法让这个地方就显示date中正确日期: ?

1.3K30

MySQL--查询和常用函数(知识点)

,select后面的列名列表控制是要显示多少列,所有用* 代替。...笨办法: select * from student where studentNo=21 or studentNo=24 or studentNo=27 or studentNo=30 使用in:...select * from student where studentNo in(21,24,27,30); in作用就是当前值在某一个集合中存在就为真 not in 作就是当in为真的时候进行非运算...描述成为一个点 st_distance--> 对两个点进行计算 st_distance(point(log,lat),point(106.485737,29.531308))这个结果要乘以111195 得到数据就是两点之间直接距离...year(日期) 返回指定日期年份 MONTH(日期) 返回指定日期月份 day(日期) 返回指定日期号数 HOUR(日期) 返回指定日期小时数 MINUTE

23420

【运营】沉睡、流失客户分析?Power BI一招帮你搞定

但有一点是几乎所有行业都想通,就是我们要对沉睡、流失客户进行回访,分析,想尽办法进行唤醒、激活或重新购买。Power BI如何帮助业务人员进行统计汇总呢?...结合新用户计算方式,我们脑海中大概有一个轮廓: 首先,要定义何为流失,因各家企业对该指标的定义有较大差异,就以6个月内曾经有订单,但最近两个月内没有订单客户定义为流失客户; 第二步,如何写度量值:...最后一就是该月流失客户。 根据上一讲列表显示明细【运营】新用户明细?...日期'[日期]), DATEADD('日期'[日期],-6,MONTH)) //返回6个月之前第一天 VAR ENDDAY= CALCULATE( MAX('日期'[日期]...这样我们就可以得到各月流失用户了。 你会发现,有些用户在这个月也流失,在下个月还流失,这是由于不同企业对于流失概念定义有区别造成,其实准确来说应当叫做睡眠。

2.7K33

笔记:如何使用postgresql做顺序扣减库存

扣减数量 以及 扣减后数量(实际库存),扣减顺序是按照批次日期升序扣减,批次日期为空首先扣减(需考虑到排序);还有就是:没有任何扣减数量(没有出库产品 最终 扣减后数量(批次库存数量-出库数量...我们已经通过连表做好出库数据,排序也做好了,现在。。。...~,看出问题了就不能无视缺陷存在,所以对于最后一个批次如果出库数量仍然大于当前批次数量,他差异(出_入差异)应该就是负数;等等,那我如何确定每个产品最后一个批次呢,让我们试着用sql找找看 **...,当然对于出库数不存在解决办法就相当easy了,当然如果你认真揣度过上面的sql的话。。。..._result 这一即为最终求解哈,为了这一费老多力了] 最后 ** 很多时候我们以为似乎并不是那么难,只是你很少去思考而已,当然呐,以上只是个人拙见,解决方法肯定还有很多,各位不妨试试看囖~

1.2K20

微信小程序自定义yPicker组件分析及省市区三级联动实现

这不,最近项目中有个需求是 省市区三级联动 ,我就顺便从组件库中第一个 「扩展日期-时间(点此直接至GitHub)」picker组件开始说一下这两个功能实现。...简单说一下“自定义日期-时间组件” 它背景是项目的第一版当时发现微信小程序内置日期组件:picker只能精确到某一天(年月日),但是我们很多时候需要年月日时分甚至是年月日时分秒(如结束时间/发布时间...” 主要实现策略 如上所示,监听了两个事件,分别是:日期选择窗口弹出时以及点击“确定”按钮时触发函数change、多选择器每一滑动时触发事件columnchange。...change中很简单:只需要把选中数据暴露给页面中(或者通过 triggerEvent 返回给调用页面)即可; columnchange中要做就是当前选中每一值填充到data中对应数组某一项...:遍历固定某一某一个数组)并渲染出来。

75820

用Python实现excel 14个常用操作,Vlookup、数据透视表、去重、筛选、分组等

pd.pivot_table(sale,index="地区名称",columns="业务员名称",values="利润",aggfunc=[np.sum,np.mean]) 三、对比两差异 因为这表每数据维度都不一样...,比较起来没啥意义,所以我先做了个订单明细号差异再进行比较。...需求:比较订单明细号与订单明细号2差异并显示出来。...实际上缺失值处理办法是很复杂,这里只介绍简单处理方法,若是数值变量,最常用平均数或中位数或众数处理,比较复杂可以用随机森林模型根据其他维度去预测结果填充。...比如这里需求填充客户名称缺失值:就可以根据存货分类出现频率最大存货所对应客户名称去填充。 这里我们用简单处理办法:用0填充缺失值或则删除有客户编码缺失值行。

2.5K10
领券