专栏首页用户6811391的专栏如何快速比对表格数据

如何快速比对表格数据

最近在倒腾一些表格数据,遇到这么个问题:先前下载了一批数据,等再次更新下载时,数目却变少了,我需要快速定位到缺失的条目并探究原因。

如图,左侧 10 条数据是先前下载的,右侧少了 1 条(数据是随便编的):

Python 操作

因为对 Excel 的函数操作不太熟,第一时间我是用 Python 来比对数据的:选取两份表格中的 id 列,分别复制到两份 txt 文档中,转化为 Python 读取 txt 文档数据、列表的相关操作问题。

# 读取两文档中的id数据
with open("001.txt","r") as f:
    data1 = f.readlines()
# data1 为 ['20\n', '12\n', '73\n', '44\n', '5\n', '96\n', '127\n', '28\n', '9\n', '1']

with open("002.txt","r") as f:
    data2 = f.readlines()
# data2 为 ['9\n', '127\n', '73\n', '44\n', '20\n', '96\n', '1\n', '28\n', '12']

# 对读取到的数据做下简单处理,去掉字符串中的换行符   
data1 = [x.strip() for x in data1 ]
data2 = [y.strip() for y in data2 ]

# 选取在 data1 中出现过、但 data2 中却不包含的数据
result = [i for i in data1 if i not in data2 ]
print(result)
# 得到结果 ['5']

根据得到的结果 5 定位到缺失的数据条目。

Excel 操作

拿到结果自然是心满意足继续干活了,闲下来想一般不会编程的文职人员会怎么解决这问题呢?

经过一番搜索,可以直接使用 Excel 的函数。首先随便选定两个表格中的同列数据,放到一个表格中:

选择 C1 处,输入如下公式:

=IF(COUNTIF(B:B,A1)>0,"","少了")

Excel 中 IF 函数:=IF(条件判断, 结果为真返回值, 结果为假返回值)

COUNTIF 函数:=COUNTIF(条件区域,条件),返回满足条件的单元格数目

对 C1 处设置好函数后,鼠标移到右下角,变成十字时点击往下拖覆盖到 C10,便可将该函数自动设置到其它位置,最终得到结果。

“少了”是自定义的提示信息,得到的结果与之前 Python 得出的 "5" 对应的数据是一致的。

问题不大,也挺简单,琢磨琢磨也挺有意思的。

两种解法其实最后的逻辑是相同的,只不过体现在不同的程序和语言上。

解决问题可能几分钟,整理记录却比较耗时,希望能给看到的各位带来点帮助吧~

往期推荐

用Python整理Excel表格

Python读取PDF信息插入Word文档

Python 自动整理 Excel 表格

Python 合并 Excel 表格

Python 如何实时绘制数据

本文分享自微信公众号 - TTTEED(TEDxPY),作者:TED

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-12-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 如何快速导入数据

    日常学习和工作中,经常会遇到导数据的需求。比如数据迁移、数据恢复、新建从库等,这些操作可能都会涉及大量数据的导入。有时候导入进度慢,电脑风扇狂转真的很让人崩溃,...

    MySQL技术
  • 【8】数据浏览表格的快速输出

    阅读目录 用什么来展示数据列表? 表格还是列表? 表头 对表格输出的封装 生成表格的实例 功能的扩展 在页面数据和控件的自动交换机制中,我们通过Pa...

    用户1075292
  • 基于Python快速处理PDF表格数据

    使用Python提取表格数据需要使用pdfplumber模块,打开CMD,安装代码如下:

    砸漏
  • Excel表格如何将一列数字快速分成几行几列?

    Excel表格如何将一列数字快速分成几行几列?这个问题在Excel中用函数解起来也不复杂,但是,正如很多开始用Power Query的朋友说,自从...

    大海Power
  • IntelliJ IDEA 如何快速查看提交代码的对比

    这样做的好处是能够让你在提交之前对需要提交的内容进行一些对比,以便于确定你的代码是正确和你需要修改的。

    HoneyMoose
  • Excel中如何快速实现对工作表的2个以上区域的对比查看?

    技巧130介绍了有关对工作表不同区域的查看方法。但工作的需求总是不断的提高,有微信朋友留言问,如果在查看的工作表不同的区域超过2个以上怎么办?

    砸漏
  • 用大数据教你如何快速写出汪峰风格的歌?

    有一位网友统计了汪老师在大陆发行的9张专辑共117首歌曲的歌词,同一个词语在一首歌出现只算一次。形容词,名词和动词的前十名分别是(词语后面的数字为出现的次数) ...

    小莹莹
  • 使用CatBoost和NODE建模表格数据对比测试

    来自俄罗斯在线搜索公司Yandex的CatBoost快速且易于使用,但同一家公司的研究人员最近发布了一种基于神经网络的新软件包NODE,声称其性能优于CatBo...

    deephub
  • 如何快速成为数据分析师

      说来我正式接触数据分析也快一年,对速成还是有一些心得。优秀的数据分析师是不能速成的,但是零经验也有零经验的捷径。

    风火大数据
  • 数据迁移(2) - 如何快速迁移

    在上一篇中我们介绍了数据迁移的套路,但是没有介绍具体的方案,这篇着重介绍下具体的数据迁移方案

    方丈的寺院
  • MySQL-大批量数据如何快速的数据迁移

    秋日芒草
  • Hive 如何快速拉取大批量数据

    用hive来做数仓类操作,或者大数据的运算,是没有疑问的,至少在你没有更多选择之前。

    烂猪皮
  • 如何快速导出百万级 Excel 数据

    今天分享一个 PHP 最好的一个 Excel 导出扩展。在日常的开发工作中,导出大量的 Excel 文件是必不可少的情况。之前做数据导出一般都是导出 csv 文...

    A梦多啦A
  • MySQL如何快速生成千万数据量?

    在我们平时工作或学习的过程中,有时需要在数据库中生成大量的测试数据,这个时候,我们可以利用mysql内存表插入速度快的特点,先利用函数和存储过程在内存表中生成数...

    公众号 IT老哥
  • 如何根据目标表格式进行整理数据?

    最近因为有在准备替拉美最大电商平台Mercadolibre在国内招商,所以需要把商家提交的资料进行整理,达到给国外要求的目标格式。因为渠道来源有多种多样,怎么快...

    逍遥之
  • 大数据初学者该如何快速入门?

    很多人都知道大数据很火,就业很好,薪资很高,想往大数据方向发展。但该学哪些技术,学习路线是什么样的呢?用不用参加大数据培训呢?如果自己很迷茫,为了这些原因想往大...

    挖掘大数据
  • 如何快速创建百万级测试数据

    进行SQL优化或查询性能测试时,我们需要大量数据测试来模拟,这个时候引出一个问题:数据的创建

    Java宝典
  • MySQL:如何快速的查看Innodb数据文件

    如果要得到答案除了学习源码,可能更加直观的方式就是查看Innodb的ibd数据文件了,俗话说得好“眼见为实”,但是我们知道数据文件是二进制形式的,Innodb通...

    用户1278550
  • 如何对1千万个整数进行快速排序

    输入:一个最多包含n个正整数的文件,每个数都小于n,其中n=10^7。如果在输入文件中有任何正数重复出现就是致命错误。没有其他数据与该正数相关联。

    编程珠玑

扫码关注云+社区

领取腾讯云代金券