小勤:大海,上次你的文章《Excel统计无法承受之轻——非重复计数问题PQ解》教我用Power Query直接实现了非重复计数的操作,但现在除了非重复计数,还有很多其他的数据要统计,能不能直接在数据透视表里实现?
大海:传统的数据透视表功能很强大,但非常奇怪的是——不支持非重复计数!你要用数据透视同时实现其他统计和非重复计数,又不想在原始数据表里增加辅助列的话,得考虑用Power Pivot了。
如果要计算非重复计数,我们很容易可以想到一个函数DistinctCount,那如果直接使用是不是就可以了呢?直接
最近,有朋友在用Power Pivot构建表间关系的时候,出现了一个问题:明明我已经删除了重复项,但构建表间关系的时候,还是说我两个表都有重复的数据!结果表间关系建立不起来!
首先,我们来解释什么是不同值和唯一值。不同值意味着值是不同的,例如列表{A, B, B, C}中的不同值是{A, B, C},不同值个数是3。而唯一值意味着值仅出现一次,例如列表{A, B, B, C}中的唯一值是{A, C},唯一值个数是2。
我们以前有讲解过如何统计快速重复数值:EXCEL小技巧,筛选重复值!,但如果老板要你统计不重复的数据怎么办?所以今天我们讲解如何快速统计不重复的数据。
不问花开几许,只愿浅笑安然 除了求和,另一个日常工作中最常用到的聚合方式应该是计数了。DAX提供了一系列关于计数的函数。他们可以帮助我们计算表中有多少行或者某个值出现了多少次。 DAX中包含的计数函数有: COUNT()函数,对列中值的数量进行计数,除了布尔型; COUNTA函数,对列中值的数量进行计数,包含布尔型; COUNTBLANK()函数,返回列中空单元格的计数; COUNTROWS()函数,返回表中行的计数; DISTINCTCOUNT()函数,返回列中值的不重复计数,包含空单元格。 DISTI
那么,如何实现呢?本文介绍两种方式。喜欢看视频的读者可以直接跳过文字,下拉到视频操作。
小勤:大海,公司有个关于网点的客户数量统计问题,涉及到非重复计数的问题,这么常用的功能,Excel里居然不支持!
小勤:大海,在PowerQuery里面能不能对一列数求和、算个数、求最大、最小值之类的啊?
在pandas库中实现Excel的数据透视表效果通常用的是df['a'].value_counts()这个函数,表示统计数据框(DataFrame) df的列a各个元素的出现次数;例如对于一个数据表如pd.DataFrame({'a':['A','A','B','C','C','C'],'b':[1,2,3,4,5,6],'c':[11,11,12,13,13,14]}),其透视表效果如下:
大海:这说明有某个客户是属于多个行(网点)里都存在,所以不重复的客户数总计会比各行之和少。
原文在简书上发表,再同步到Excel催化剂微信公众号或其他平台上,文章后续有修改和更新将在简书上操作, 其他平台不作同步修改更新,因此建议阅读其他出处的文章时,尽可能跳转回简书平台上查看。
ActiveWorkbook.PivotCaches.Create( _ SourceType:=xlDatabase, _ SourceData:=sh & "!R1C1:R" & rn & "C22", _ Version:=4 _ ).CreatePivotTable _ TableDestination:="Sheet1!R1C1", _ TableName:="数据透视表1", _ DefaultVersion:=4 'xlPivot
说明:有点忙,这本书最近更新慢了一些,抱歉!这部分仍免费呈现给有兴趣的朋友。附已发表内容链接:
在使用 Pandas 进行数据分析时,我们需要经常进行查询和统计分析。 但是Pandas 是如何进行查询和统计分析得嘞, let’s go :
导读:数据透视表是Excel中最实用最常用的功能,没有之一。今天对数据透视表进行一次全面的整理,共五大类,23个技巧。
说到排名,大家是再熟悉不过了。从还在学校读书时候的分数排名,到现在出来工作了,只要有考核的需要,也都会涉及到排名。
小勤:ALL函数是清除所有筛选条件并返回表中的不重复值,下面对表的行进行计数应该是3呀,因为有两个大海是重复的,怎么还是4? 大海:没有说all返回的是不重复值啊。 小勤:那么我ALL(表[姓名]),
Power BI虽然源于Excel,但毕竟是不同的产品。我们要试图抛弃Excel中单元格思维的方式,在BI中的表是以列式存储,没有Excel中以A1单元格定位的形式,对于习惯于Excel的你可能要适应一段时间,不过这是件好事情,因为这样的方式使公式易于阅读理解。
介绍 我一直很欣赏EXCEL蕴藏的巨大能量。这款软件不仅具备基本的数据运算,还能使用它对数据进行分析。EXCEL被广泛运用到很多领域,例如:金融建模和商业预测。对于刚进入数据分析行业新手来说,EXCEL可以被当做一款入门的软件。 甚至在学习R或Python前,对于新入门的小白来说,事先掌握一定的EXCEL知识是百利而无一害。EXCEL凭借其功能强大的函数、可视化图表、以及整齐排列的电子表格功能,使你能够快速而深入的洞察到数据不轻易为人所知的一面。 但与此同时,EXCEL也有它的一些不足之处,即它无法非常有
这篇文章是本系列的第一篇,选择性汇总了EXCEL的常用且重点的模块和公式,用作内部员工EXCEL基础操作培训,以帮助表格基础薄弱的同事快速熟悉常用操作,提升工作效率。现将内容分享,作为数据分析基础的第一篇。
今天还是数据分析的学习,如果你觉得文章太长太没意思,欢迎拉到底部直接看大纲总结,一秒学会(学不会我也不负责,让你不看全文)。
交叉表查询可以将同一个表中的一个或多个字段作为行标签,另一个字段作为列标签,然后对表中的某个字段进行某种统计计算(例如计数,求和、平均值等)。
作者 CDA 数据分析师 我一直很欣赏 EXCEL 蕴藏的巨大能量。这款软件不仅具备基本的数据运算,还能使用它对数据进行分析。EXCEL 被广泛运用到很多领域,例如:金融建模和商业预测。对于刚进入数据分析行业新手来说,EXCEL 可以被当做一款入门的软件。 甚至在学习R或Python前,对于新入门的小白来说,事先掌握一定的EXCEL知识是百利而无一害。EXCEL凭借其功能强大的函数、可视化图表、以及整齐排列的电子表格功能,使你能够快速而深入的洞察到数据不轻易为人所知的一面。 但与此同时,EXCEL也有它
分析师面临的普遍问题是,无论从哪里获得数据,大部分情况都是一种不能立即使用的状态。因此,不仅需要时间把数据加载到文件中,还得花更多的时间来清洗它,改变它的结构,以便后续做分析的时候能更好的使用这个数据。
本文涉及一些简单的 Excel 的操作,效果拔群 ---- 步骤: 获取 Docker 版本,并生成一个 csv 文件 导入 CSV 到 Excel 并简单清洗数据 使用 Excel 透视表功能做简单
上篇推文《从【中国式复杂报表】谈设计逻辑》中我们提到,中国式复杂报表作为高度复杂化的产物,不适合进一步用作数据源。但实际工作中,难免遇到以类似复杂表格作为数据源的情况。比如从国家统计局下载数据的表单,就是一个初级版的复杂报表。我们可以看到,表头分了两个层级,且子层级含有合计数。列方向上也有合计(全国)。本文将来一步一步介绍,如何清洗复杂报表数据源。
大海:既然这样的话,那用Power Pivot吧。直接在Power Pivot里实现这种特殊的计算。
处理数量较大的数据时,一般分为数据获取、数据筛选,以及结果展示几个步骤。在 Excel 中,我们可以利用数据透视表(Pivot Table)方便快捷的实现这些工作。
文章背景: 透视列(Pivot)和逆透视列(Unpivot)是在Excel当中经常使用的一对数据聚合和拆分方法,在Power BI中也提供了同样的功能。
> 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
数据透视表是一个很重要的数据统计操作,最有代表性的当属在Excel中实现(甚至说提及Excel,个人认为其最有用的当属三类:好用的数学函数、便捷的图表制作以及强大的数据透视表功能)。所以,今天本文就围绕数据透视表,介绍一下其在SQL、Pandas和Spark中的基本操作与使用,这也是沿承这一系列的文章之一。
本文涉及pandas最常用的36个函数,通过这些函数介绍如何完成数据生成和导入、数据清洗、预处理,以及最常见的数据分类,数据筛选,分类汇总,透视等最常见的操作。
Quick BI(以下简称Qbi)做数据分析有5个模块:仪表板、电子表格、数据大屏、即席分析和自主取数。其中仪表板和即席分析比较接近于Power BI(以下简称Pbi)制作的报告。本文的比较对象,主要指Qbi的仪表板和Pbi的报告。
前面我们介绍过《利用Python统计连续登录N天或以上用户》,这次我们聊聊怎么用python计算新增用户留存率。
Salesforce的成功无法离开其底层平台Salesforce Platform的支持。而Salesforce Platform的核心是元数据驱动的多租户数据模型。
Pandas 是基于 NumPy 的一个开源 Python 库,它被广泛用于快速分析数据,以及数据清洗和准备等工作。它的名字来源是由“ Panel data”(面板数据,一个计量经济学名词)两个单词拼成的。简单地说,你可以把 Pandas 看作是 Python 版的 Excel。
openpyxl提供对透视表的读取支持,以便将它们保留在现有文件中。pivot表的规范(虽然是扩展的)并不明确,也不希望客户机代码能够创建pivot表。但是,应该可以编辑和操作现有的透视表,例如更改它们的范围或是否应该自动更新设置。
数据透视表是一种可以快速汇总、分析大量数据表格的交互式分析工具。使用数据透视表可以按照数据表格的不同字段从多个角度进行透视,并建立交叉表格,用以查看数据表格不同层面的汇总信息、分析结果以及摘要数据。
案例模拟文件下载 http://gofile.me/4KHV7/SUo5ywXxC
SAS里面总结数据:MEANS SAS当然还有类似于excel的数据透视表和R的data.table的模块,就是MEANS。可以输出的summary statistics包括最大值、最小值、平均值、中位数、余非缺失值个数、缺失值个数、范围、标准差、和等等。此外,还可以使用BY或者CLASS进行 分组统计,VAR选择变量等。 image.png 当然这些统计量也可以直接的写入一个SAS数据表,只需要加上一个OUTPUT就可以了。原数据: image.png 最终结果为: SAS PROC统计频
来源:伯乐在线 - PyPer 本文共2203字,建议阅读5分钟。 本文重点解释pandas中的函数pivot_table,并教大家如何使用它来进行数据分析。 介绍 也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为pivot_table。虽然pivot_table非常有用,但是我发现为了格式化输出我所需要的内容,经常需要记住它的使用语法。所以,本文将重点解释pandas中的函数pivot_table,并教大家如何使用它来进行数据分析。 如果你对这个概念
已经使用各类函数统计出了数据结果,却被要求加入新的临时需求。这是数据分析师的工作日常,你是否还在为此苦恼?
一般来说,在各系统里导出的数据,在导出数据的时候,已经对导出行为进行了权限管控,如甲员工只能导广州区数据,乙员工只对导深圳数据,他们的主管可以导华南区的数据等等。理想的场景是各人使用各自的权限导出所需的数据作分析。
在Excel中,数据透视表是一个非常强大的工具,而且非常适合普通人使用,不需要有什么高深技巧,通过一些拖拽操作就能够完成较为复杂的数据汇总、分析等操作。
如果有人说他会透视表,那他一定看过本书;相反,如果没有看过本书说自己会透视表的,那他还没有知道真正的透视表。本书是透视表的真正权威。它随着每次Excel的版本更新而更新,帮助人们掌握Excel中最强大的武器(没有之一),那就是透视表。
领取专属 10元无门槛券
手把手带您无忧上云