首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

理解PQ里数据结构(四、根据内容定位及筛选

而不是非得用标,比如定位姓名为“大海”(记录Record) 大海:PQ里实际提供了根据内容直接定位记录机制,但是,因为是对记录定位,所以仅针对有唯一记录情况,如果是多个记录的话,实际上就不是定位概念...,而是筛选概念,除了操作筛选功能来实现之外,可以用函数Table.SelectRows来实现。...所以,反过来说,只要能标识出唯一值,那么就可以正确定位,比如表里大海有2,但如果加上数量这个条件,就能定位到唯一值,如定位到姓名为“大海”且数量为20(记录): 结果就是对: 小勤:那如果是要得到筛选内容呢...,即根据条件筛选出一个表里符合条件 用法: Table.SelectRows(表, 筛选条件) 参数: 表:要进行筛选筛选条件:用于筛选条件 结果如下: 小勤:原来定位筛选还有这样差别...,定位实际得到是一个记录,而筛选实际得到是一张表。

91720

Power Query 真经 - 第 7 章 - 常用数据转换

更改 “Date” 列数据类型,单击 “Date” 左边日期 / 时间】小图标,选择【日期】【替换当前转换】。 将查询名称更新为 “Sales”。...用户目标是建立一个每天表格(继承适当开始和结束时间,以及小时)。此外,要求规范是将 “Cooks: Grill/Prep/Line” 列不同职位拆分成单独列。...总的来说,需要对 Power Query 默认设置进行唯一更改是将【拆分为】【列】改为【】。一旦这样做,数据就会很好地拆分成新,如图 7-16 所示。...当然,如果有六年数据,会有六个不同年份一月份结果,这可能是或者也可能不是用户想要数据结果。 将数据集筛选到【最早】日期,只筛选与所选列中最早日期相匹配。...更改 “Date” 列数据类型【使用区域设置】【日期】【英语 (美国)】【确定】。 更改 “Sales” 列数据类型【使用区域设置】【货币】【英语 (美国)】【确定】。

7.2K31
您找到你想要的搜索结果了吗?
是的
没有找到

手把手教你玩转 Excel 数据透视表

什么时候用数据透视表 找出同类数据在不同时期某种特定关系 以简洁友好方式,查看大量表格数据 对数值数据快速分类汇总,按分类和子类查看数据信息 建立交叉表格,将移动到列或将列移动到,以查看数据源不同汇总...而如果对数据源进行了删除或新增,则需要手动更改数据源。 自动刷新可以在数据透视表选项面板中选择打开文件时刷新数据或使用VBA自动刷新数据表。 5.   ...,使用透视表可以十分快捷地生成每个班级课程表,具体操作如下: 除了制作每个班级课程表之外,简单改变透视维度,又可以生成每位老师课程表: 上边生成透视表可以让老师们直观看到自己每天课程数量...并且统计结果黏贴为普通区域,基于该区域生成一张有对比效果图表,一起来看看吧~ 6-3 在销售中应用 在销售管理系统中,一个高频需求点就是根据销售订单,快速生成月报、季度报告、年报等等。...接下来,我们对日期创建组,实例中以月维单位,实际项目中,可以根据实际需求,按照季度等其它单位创建组。 透视表在实际业务中应用广泛,也可应用于报表合并分析及拆分。

2.5K20

PQ-这份数据要按日期和客户分类汇总,怎么办?怎么办?

但这个日期怎么整成规范? 大海:其实比较简单,导入pq后,添加自定义列,通过判断将日期放到自定义列里面去,然后向下填充就得到完整日期列了。...Step 01 添加自定义列,提取日期到新列(如果明确其他列为null即可提取日期,那也可以用if...then...else...进行判断提取) Step 02 填充日期 Step 03 提升标题...(2次),得到列名并修改新添加自定义列列名为“日期” Step 04 通过筛选去掉多余日期和标题根据实际情况筛选) 小勤:原来也挺简单啊。...但其中提升标题行时会自动添加“更改数据类型”步骤,这些步骤里将列名固定了,以后如果数据有变化,可能导致找不到这些列错误: 小勤:那该怎么办呢? 大海:对于更改类型步骤,直接删除就好了。...小勤:但好像还有个问题,就是新增列改名为“日期步骤,也可能会因为开始日期不是“2019-1-1”导致出错? 大海:对。所以我们也要考虑改掉这个步骤里内容,让它变成可动态处理

80120

Extreme DAX-第4章 上下文和筛选

根据我们在 DAX 课程授课中经验,区分查询上下文和筛选上下文有助于大家理解更复杂应用场景。 以下展开讨论每一种上下文类型。 4.2.1 上下文 上下文是创建计算列时会用到上下文类型。...这种关系难道不应该对每天总运费进行计算然后单独返回每一天值吗? 以上这些示例向我们揭示了上下文本质。TotalShipping 示例表明在行上下文中,关系不会传递筛选。...图4.9 一个展示年初至今销售额图表 根据年初至今定义,您在 August(八月)这一列中看到是 2021 年 1 月 1 日至 2021 年 8 月 31 日期总销售额。...当然,这取决于组织对实际销售业务定义。 更改关系行为另一种方法是更改活动关系筛选器传递行为。...但在完成此操作之前,CROSSFILTER 会根据在 fSales 表中选择筛选 Cities 表中

5.4K20

独家 | 手把手教数据可视化工具Tableau

Tableau 根据 Excel 数据源中前 10,000 和 CSV 数据源中前 1,024 数据类型来确定如何将混合值列映射为数据类型。...字段背景颜色指明它是离散(蓝色)还是连续(绿色)。 将维度拖到“”或“列”时,只需通过单击字段并选择“度量”便可将字段更改为度量。...但是存在以下例外: 如果解聚整个视图,则不会根据定义来聚合视图中字段。如果您使用是多维数据源,则会在数据源中聚合字段,但视图中字段不显示该聚合。...举例来说,如果将“Sales”(销售额)放在上面视图中”上,标记数量为 57;但如果随后也将“Profit”(利润)放在“”上,标记数量将增加到 114。但这与更改视图详细级别不同。...并且,如果您随后应用了排除两个初始值筛选器,平均值也将更改,该值会将是另一个值。然后您更改了聚合,... 您就明白了。可能值数量即使不是无限,也肯定是巨大

18.8K71

Excel应用实践03:使用Excel进行个人计划执行记录与统计分析

有些执行得很好,比如每天更新完美Excel微信公众号,坚持每天学习,而有些则还没有开始。是时候该督促自已全面开始了!...下图1所示为我使用数据记录表,工作表名“个人计划执行记录”,每天晚上睡觉前或者第二天上午上班前,我会将一天学习生活情况记录在此。 ?...输入日期后,单击其右侧“更新”按钮,自动统计这两个日期之间相应数据。该按钮关联了下文所讲用于实现自动统计VBA程序。...筛选条件区域 Dim rngCriteria As Range '循环变量 Dim rng As Range Dim cell As Range '数据区域最后一...Dim lngDataLastRow As Long '筛选数据最后一 Dim lngFilterLastRow As Long '数据分析区域最后一

1.8K20

《DAX进阶指南》-第6章 动态可视化

我们想要实现是创建能够实现以下功能DAX 度量值。 允许用户更改应用计算。 允许用户更改销售表中使用应用计算和日期列。 允许用户更改标签。 将上述所有内容合并到一个可视化效果中。...如果你需要有关 DAX 筛选器函数更多信息,请参见第4章。在此过程中,我们将根据我们特定需求调整此基本计算,代码如下。...当几乎每天都有订单时,则使用MAX(fSales[OrderDate])可以解决这个问题。...但是,你仍应使用Code列,以避免在有人决定更改描述时必须更改DAX代码。我们”二次幂”方法支持允许选择两个或多个项目的场景。...每个CALCULATE函数现在都有两个筛选器参数:一个提供具有正确参考日期滚动总周期,另一个提供正确关系,代码如下。

5.6K50

如何以正确方法做数据建模?

你将注意到,从每个维度表到事实表关系是一对多,并在一个方向上过滤记录,如关系箭头所示。例如,“客户信息表”与“在线销售”之间关系基于这两个表中“客户Key”列。...可以使用事实表中字段来执行诸如计算两个日期类型列之间差值或计算具有未来日期等操作。另外在“视情况而定”情况,你必须根据业务报告需求做出判断,在简单性和可维护性与复杂性和灵活性之间取得平衡。...如果报告要求根据购买产品选定客户筛选产品,我们可以使用“销售”事实表作为桥接表,并将产品和销售之间关系更改为使用双向筛选器。 根据关系基数,使用双向过滤器可能会导致性能损失。...下面是另一个示例:鉴于为所选客户帐户和交易记录要求,下面的模型不适用于现成关系。要了解原因,请遵循筛选记录流。从“客户”到“账户客户”,关系箭头指示筛选器流向正确方向。...将关系筛选更改为“双向”可修复问题并满足报告要求。 ? 如前所述,双向滤波器引入了潜在性能损失。

3.2K10

一步一步教你PowerBI利用爬虫获取天气数据分析

3、确定月份URL信息 点击上图任意月份,进入月份天气列表页。通过分析URL地址我们也可以看到规律。URL中城市拼音加年月变量可以获得各个城市各个月份每天天气状况。 ?...日期,注意这里需要将日期转换为数值,提取完成后再转换为日期 ? 展开日期列数据,将格式更改日期类型 ? 添加年月列 ? 提取年和月数据用于后续切片器 ? 删除重复项 ?...删除多余内容,筛选去除标题和空白 ? 拆分气温为最高和最低气温,按分隔符/拆分 ? 去除温度符号℃,用于转换为数值 ? 处理后 ?...大家可以将起始日期更改为2019-1-1以后日期加载数据会比较快一点。 三、制作可视化报告 1、制作年份,月份,城市切片器。城市切片器注意设置方向为水平方向 ? 2、气温趋势线 ?...大家可以根据自己喜好调整不同主题颜色 四、总结 我们顺利完成了抓取湖北省各个城市2019年历史天气数据。

2.4K10

PowerBI建模表与表关系

表与表关系 各位表哥表姐、表弟表妹们,我们生活一个表世界,大家可能每天都在跟表格打交道,我们这节就来重新认识表这个家族。 ?...2 建立关系 注意到在关系视图中,表与表之间是有关联。这个关联是怎样建立?'咖啡数据'中有每天销售情况,'日期表'中有每天日期和对应年月日星期等。...这两张表有共同日期列,并且是一对多关系(日期表中日期是不重复,咖啡数据中日期会有重复多项)。...利用可视化图形中最像数据透视表矩阵表来举例说明,插入一个矩阵,随意放几组数据,比如放'区域负责人名单'表中[年龄],列放'杯型'表中[体积],值放销售量(数量列求和)。...一张年龄与杯子体积对应销售量数据表展现在眼前。 注意到这里和列我们用不是咖啡数据表里数据!通过关系建立,我们得以把所有的表中数据放在了一张表里,这就是数据模型力量。 ?

3.9K20

上下文筛选函数Earlier含义及用法

首先:筛选出比当天日期小1天表。...时间 金额 比较状态 结果 2019/5/1 100 筛选日期比2019/5/1小一天表 不存在,返回空白 2019/5/2 200 筛选日期比2019/5/2小一天表 时间为2019/5/1表...2019/5/3 300 筛选日期比2019/5/3小一天表 时间为2019/5/2表 2019/5/4 400 筛选日期比2019/5/4小一天表 时间为2019/5/3表 2019/5/5...500 筛选日期比2019/5/5小一天表 时间为2019/5/4表 2019/5/6 600 筛选日期比2019/5/6小一天表 时间为2019/5/5表 最后一天筛选出来结果就是下图这样...其次:我们要针对这个表进行取值,我们需要是金额这一列数字,因为我们每天只有一条数据,我们可使用任意取值公式。这里我们用最简单sum,min,max等函数进行取值。

1.6K10

多用度量值,少用新建列:一个度量值解决分月均摊

解决方案 首先,第一2020.1.1-2021.12.31总共处在12个月,然而第二2021.1.29-2022.1.29却是占了13个月份。...currentDay ) VAR month = FORMAT ( currentDay, "MM" ) RETURN ROW ( "年度月份", year&month ) ) 第三步:写度量值 思路: 根据起止日期列出期间所有日期...,并得到所在月份A 由起始日期是否在当月15日之前(含)来确定均摊月份B 通过筛选月份确定当月是否在以上B表中,如果在就返回分摊费用 统统这些,我们都可以直接在度量值中写出来。...根据起止日期列出期间所有日期 var date_begin=SELECTEDVALUE(data[起始日]) var date_end=SELECTEDVALUE(data[终止日]) var date_table...最近在研究流数据集,流数据集中是无法通过创建新列或者进行PQ处理,甚至连数据格式都无法更改,能做只有创建复杂度量值。

83830

如何快速分析出城市人口流动数量?

日期”字段是具体日期,要用具体筛选出年份,用到年份提取函数year() 4、星期查询,需要用date_format(date,format)函数在“日期”字段中筛选出周末。...(日期,'%w')=6 or date_format(日期,'%w')=0) group by 流出城市; 查询结果: 即下面标红色框部分求和: 【本题考点】 1、多条件并列and操作符,返回满足所有给定条件...根据format字符串格式化date值。...下列字符和字符串是常用: 格式化日期常用字符串: 3、SQL常用日期提取函数: 4、or操作符,筛选结果只要满足其中之一条件就被筛选出来,在与and连用时,优选计算and,and拥有较高计算次序...2、union用法,union执行两条及以上select 语句,并把结果合成一个结果来查询,union中每个查询都必须包含相同列,union all查询所有的,union查询不重复

96530

Calculate计值流,DAX最重要知识点,没有之一!

1、为什么先写好度量[最大日期],然后在Calculate筛选条件里调用,却不能得到正确结果呢?filter是上下文应该不具备筛选功能?...2、为什么用max却能得到正确结果?max('事实表'[日期])不是计算整张表最大日期吗?...2、CALCULATE 复制原始筛选上下文,以准备新筛选上下文 这个过程中会丢弃原始行上下文,因为新计值上下文将不包含任何上下文。...值得注意是此筛选器可能包含也可能不包含单个,因为上下文转换并不保证新筛选上下文只包含一。如果没有正在生效上下文,则跳过此步骤。...这非常重要,意味着我们可以通过使用 ALL 来消除上下文转换影响。CALCULATE 调节器在上下文转换之后应用,因此可以更改上下文转换效果。

1.8K10

PQ技巧:这个Excel表头里日期怎么放到下面明细里每一

小勤:很多Excel表里都将日期放到表头里,比如很多登记表之类,怎么把这个日期放到下面明细表里每一啊? 大海:这个的确很常见,如果是在Excel里做,很容易,做个绝对引用即可。...通常来说,这种日期是在固定位置,所以也可以参考Excel里绝对引用方法来实现。...step-01 数据以不含标题方式“从表格”接入Power Query后,先删除前面2然后提升标题,得到明细表: step-02 确定从前面哪个查询步骤里特定位置提取日期(比如前面“更改类型...”步骤里“第2、列5”): step-03 回到最后步骤,添加自定义列,提取日期到明细: 小勤:原来Power Query里也能做绝对引用啊。...理解PQ里数据结构(三、跨行引用) 重要!很重要!非常重要!理解PQ里数据结构(四、根据内容定位及筛选) 重要!很重要!非常重要!理解PQ里数据结构(五、跨查询表引用) 小勤:嗯。

86130

手把手教你使用Pandas从Excel文件中提取满足条件数据并生成新文件(附源码)

excel文件 df.to_excel('数据筛选结果2.xlsx') 方法二:把日期分秒替换为0 import pandas as pd excel_filename = '数据.xlsx'...() == False] print(df) # 把筛选结果保存为excel文件 df.to_excel('数据筛选结果2.xlsx') 方法五:对日期时间进行重新格式,并按照新日期时间删除 import...new_workbook = Workbook() new_sheet = new_workbook.active # 创建和原数据 一样表头(第一) header = sheet[1] header_lst...= [] for cell in header: header_lst.append(cell.value) new_sheet.append(header_lst) # 从旧表中根据行号提取符合条件...这个方法就是遍历date,然后遍历一次之后,将hour置空,如此反复,这样就可以每次取到每天唯一某一个小时一个时间。 三、总结 大家好,我是Python进阶者。

3.3K50

Pandas三百题

df.loc[10:20,'总分':] 26-筛选|通过行号 提取第10 df.loc[9:9] 27-筛选|通过行号(多行) 提取第10之后全部 df.loc[9:] 28-筛选|固定间隔...提取0-50,间隔为3 df.loc[0:50:3] 30-筛选|判断(大于) 提取金牌数大于30 df[df['金牌数']>30] 31-筛选|判断(等于) 提取金牌数等于10 df[...] 39-筛选值|组合(行号+列号) 提取第 4 ,第 4 列值 df.iloc[3,3] 40 - 筛选值|组合(行号+列名) 提取索引为 4 ,列名为 金牌数 值 df.at[4,'金牌数'...df.groupby(['district','salary']).get_group(('西湖区',30000)) 9 - 分组规则|通过匿名函数1 根据 createTime 列,计算每天不同 行政区...'日期').resample('M').last() 27 - 日期重采样|分钟 -> 日 按日对 df2 进行重采样,保留每天最后一个数据 df2.set_index('时间').resample('

4.6K22

Python报表自动化

下面我们通过一个简单案例来看看Python报表自动化建模过程。某银行贷款业务部门数据分析员每天需要根据系统生成个人贷款客户信息表统计管辖区域内各经营单位不同贷款产品今年投放情况。...import pandas as pd from datetime import datetime # 因为后面需要处理到日期筛选,所以需要将datetime类从datetime模块中加载进来 data...3.2日期筛选 个人贷款信息表包含该银行所有的历史数据,而我们每日报表只需要统计当年投放情况。所以计算投放金额前,我们需要将合同生效日期不符合要求贷款记录排除掉。...data=data[data["合同生效日"]>datetime(2018,12,31)] data.shape #经过对日期过滤,输出了1673,9列 --- (1673, 9) 对日期列进行观察...然后按下图所示点击 Run All 执行以上代码就可以一键完成我们每天需要日报了。 ? 其实以上模型处理除了可以计算年累计投放数据以外,我们还可以通过修改日期筛选范围。

4.1K41

Python使用RMF聚类分析客户价值

投资机构或电商企业等积累客户交易数据繁杂。需要根据用户以往消费记录分析出不同用户群体特征与价值,再针对不同群体提供不同营销策略。...用户分析指标 根据美国数据库营销研究所Arthur Hughes研究,客户数据库中有三个神奇要素,这三个要素构成了数据分析最好指标 R-最近一次消费(Recency) F-消费频率(Frequency...image 通过该图将用户进行分类: R、F、M都很高,重要价值客户(VIP客户) F、M很高,R不高,重要保持客户 R、F、M都很低,流失客户 M很高,R、F不高,重要挽留客户 根据这8个类别的R、F...包含客户注册日期,最后购买日期以及购买消费总金额 参数: R-求出最近一次投资时间距提数日天数 F-月均投资次数 M-月均投资金额 目标:分析客户交易数据,用户群体特征与价值,进行精准营销,降低营销成本...1 分析数据获取RFM R-求出最近一次投资时间距提数日天数 确定一个提现日,减去用户最新投资日期 F-月均投资次数 总投资次数/总月数 M-月均投资金额 投资总金额/总月数 ?

1.1K40
领券