专栏首页公众号PowerBI大师如何避开Excel制表路上那些坑

如何避开Excel制表路上那些坑

一直以来咱们都是拿Power BI说事,但大部分内容都是DAX基础,可视化元素应用,分析模型等为主。对新手来说,这些还存在一定门槛。

大家知道,做数据分析,都要历经数据清洗,建模,可视化这三步,我们今天要说的,就是数据清洗之前的那些事儿

要做数据清洗,首先必须要有数据 工作中的数据来自两个地方

  1. 已有的系统(ERP/CRM/考勤/收银等)中导出的数据
  2. Excel里手工输入的数据

系统导出的数据规范整洁,清洗过程简洁轻松

手工数据五花八门,清洗过程痛不欲生

这里总结了关于数据录入的四条规则

只要遵守规则,后续数据清洗就没问题

数据录入的四条规则

规则一:一个表单(sheet)里,只存放一张表格

这似乎是一句正确的废话,起初我也以为这应该是制表共识,不需要解释,直到有一天我看到这样一张Excel表单

面对如此版面,我曾百思不得骑姐——不便于打印,汇总无从下手。每次打开文件,找到需要操作的小表格,都要耗费大量时间,因为这张表同时几个人在用…

至于该怎么改,参见规则一内容,我怕说多了血压会升高

规则二:一个单元格只对应一种数据属性

看下图(姓名电话均为随机生成),觉得有什么问题吗

很多微商或小门店在微信上接单,都是这样在纸质小本子上手写的。除了记录方便,真的没有一点优势。每天收摊结账后,低头眯眼,拿着计算器一通摁……拜托,你以为还是上世纪?

即便把上面这张单子输入EXCEL,区别也不大,想知道当天做了多少金额,还是离不开计算器。有人不服气了“EXCEL不是有汇总函数吗?”那你告诉我,上面这张单子,三列数据汇总哪个?

重复规则二:一个单元格只对应一种数据属性

比如上图第二列,要想输入Excel,就该拆成三列:物品、数量、单位,如果再加上单价,汇总金额自然是唾手可得

其实,早在电脑办公普及之前,前辈们就已经有现成模板给我们参考了。看到这些质朴的纸质单据,是不是很亲切

规则三:相同数据填写要完全一致

此规则适用于多人制表,典型表现就是地名,见下图

单人制表不存在这个问题,因为同一个地名不会出现几种叫法。多人制表则不然,例如N个销售员,在记录各自订单时,对同一个地名,甚至项目名称,都会有不同称呼,日后做汇总,必定增加额外工作量,在数据清洗上浪费时间精力

如何解决?

还记得我们在手机或网站上注册时,省市信息是如何确定的吗。是界面自动跳出省市区县列表让我们选择,而不是手动输入,这样就避免了人为误差。在Excel里就是进行”数据有效性”(EXCEL 2013以下版本)设置或”数据验证”(EXCEL 2013以上版本)。相关细节请自行百度,网络教程汗牛充栋

规则四:选择合适的数据类型

大家经常会遇到数字无法参与计算,日期无法提取年月日这种情况,如下图

▲数据类型是文本,即便输入数字也无法参与计算 绿色小三角是其特殊标志

▲只有“-”和“/”符号才能被自动识别为日期类型 大家习以为常的小数点分隔,并不能被视为日期,因此无法利用函数提取信息

碰到文本数字列,如何批量更正?

利用“数据”——“分列”功能即可。选中该列,点击“分列”,一路下一步到底就行

本文分享自微信公众号 - PowerBI大师(PowerBIMaster),作者:东军

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-05-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 深入分析诡异的 Excel 求和统计缺失问题

    1、背景 昨天有同学在用 Excel 做数据统计时偶然发现 Excel 会少算一些数据,而且这个坑让这位同学排查了很久才确认不是自己统计程序错误而只是 Exce...

    用户1177713
  • 「Azure」数据分析师有理由爱Azure之八-填坑-使用本地网关让AzureAS访问本地数据

    本篇模拟导入一份Excel表格数据,第1个坑将出现,使用导入数据源,选择excel表格后,出现这个吓人的界面,亲测貌似使用【模拟服务帐户】通过。

    Excel催化剂
  • 线上问题解决:java之full gc问题分析,定位及解决

    PC:通过上边的代码应该可以明白,jvm在做回收统计的时候真得会一个一个统计的。开发时,借鉴线程安全,接触到大数据的地方,就有泄露的可能,被反被执行,也有可能出...

    IT架构圈
  • 这些年,Excel不知道坑死了多少人,你有幸免吗?

    近日一篇名为 Excel界地震 微软宣布 跨4代人34岁的 VLOOKUP 退休 刷爆朋友圈,几小时就像病毒一样传播起来并很快得到了10W+的阅读,太香了。几乎...

    BI佐罗
  • 这些年,为了在 Excel 中给序列去重,不知道坑死了多少人

    而我们为了在数据时代领先一步,你需要的不仅仅是有局限的学习 Excel 或者 PPT,而是三者。任何一个只强调一者而忽略他们的组合性的方式都会引入误区。

    BI佐罗
  • PowerBI的M与DAX之争

    前些日子,有一位读者留言一个问题,我写了个公式过去,来回几次都没有解决,最后发现她竟然把DAX公式写在了编辑查询器里,我是五十步笑百步,因为本人也犯过同样的错误...

    公众号PowerBI大师
  • 懂Excel轻松入门Python数据分析包pandas(30):

    Excel 的表格是以灵活为主,也因此造就各种数据灾难现场。今天来看看怎么填补有意义的空白单元格,并且对应的 pandas 方法。

    咋咋
  • Python数据分析实战基础 | 初识Pandas

    这段时间和一些做数据分析的同学闲聊,我发现数据分析技能入门阶段存在一个普遍性的问题,很多凭着兴趣入坑的同学,都能够很快熟悉Python基础语法,然后不约而同的一...

    张俊红
  • Python数据分析实战基础 | 初识Pandas

    这段时间和一些做数据分析的同学闲聊,我发现数据分析技能入门阶段存在一个普遍性的问题,很多凭着兴趣入坑的同学,都能够很快熟悉Python基础语法,然后不约而同的一...

    Python进阶者
  • Python数据分析实战基础 | 初识Pandas

    这段时间和一些做数据分析的同学闲聊,我发现数据分析技能入门阶段存在一个普遍性的问题,很多凭着兴趣入坑的同学,都能够很快熟悉Python基础语法,然后不约而同的一...

    数据森麟
  • Python数据分析实战基础 | 初识Pandas

    这段时间和一些做数据分析的同学闲聊,我发现数据分析技能入门阶段存在一个普遍性的问题,很多凭着兴趣入坑的同学,都能够很快熟悉Python基础语法,然后不约而同的一...

    小小詹同学
  • Python数据分析实战基础 | 初识Pandas

    这段时间和一些做数据分析的同学闲聊,我发现数据分析技能入门阶段存在一个普遍性的问题,很多凭着兴趣入坑的同学,都能够很快熟悉Python基础语法,然后不约而同的一...

    Python数据科学
  • 一文带你快速入门Python | 初识Pandas

    这是Python数据分析实战基础的第一篇内容,主要是和Pandas来个简单的邂逅。已经熟练掌握Pandas的同学,可以加快手速滑动浏览或者直接略过本文。

    CDA数据分析师
  • 土制Excel导入导出及相关问题探讨

    不考虑以上所说的问题,个人花了些许时间写了两个Excel 工具类:ExcelReadUtil以及ExcelWriteUtil (代码地址见篇尾),集中处理了包含...

    上帝
  • 使用 EasyPOI 优雅导出Excel模板数据(含图片)

    来源 | blog.csdn.net/u012441819/article/details/96828044

    程序猿DD
  • 手把手教你使用openpyxl库从Excel文件中提取指定的数据并生成新的文件(附源码)

    这个问题看似简单,直接用Excel中的筛选就可以了。诚然,数据筛选,之后扩展行确实可以做到,针对一个或者两个或者10位数以下的Excel文件,我们尚且可...

    Python进阶者
  • 如何轻松学习Python数据分析?

    今天这篇文章来聊聊如何轻松学习『Python数据分析』,我会以一个数据分析师的角度去聊聊做数据分析到底有没有必要学习编程、学习Python,如果有必要,又该如何...

    寒树Office与RPA
  • 如何轻松学习Python数据分析?

    今天这篇文章来聊聊如何轻松学习『Python数据分析』,我会以一个数据分析师的角度去聊聊做数据分析到底有没有必要学习编程、学习Python,如果有必要,又该如何...

    张俊红
  • Java解析OFFICE(word,excel,powerpoint)以及PDF的实现方案及开发中的点滴分享

    上帝

扫码关注云+社区

领取腾讯云代金券