首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >使用Python从一个excel工作表查找另一个excel工作表中的值并打印结果

使用Python从一个excel工作表查找另一个excel工作表中的值并打印结果
EN

Stack Overflow用户
提问于 2020-06-10 18:16:19
回答 2查看 81关注 0票数 0

我有两个电子表格"Old_Data“和"New_Data",它们都包含一个名为"ID”的列,它们可以有10K+条目,而且它们没有排序。即ID "1001“可以在"Old_Data”中的第2行,但在"New_Data“中的第4500行。

"New_Data“中也有不在"Old_Data”中的条目,反之亦然。现在,我正在尝试弄清楚如何使用Python从"Old_Data“中获取每个条目,尝试在"New_Data”中找到它,然后在"Old_Data“中附加一个名为"Found”的字段/列,并根据它是否被定位来添加true或false。

你知道我该怎么着手做这件事吗?我附上了几个"New_Data“和"Old_Data”excel表格的例子

EN

回答 2

Stack Overflow用户

发布于 2020-06-10 18:44:21

您可以将两列都读取到一个列表中。

代码语言:javascript
运行
复制
new_ids = list()
old_ids = list()

您必须填充这些列表,要么将您的excel转换为csv.file,然后使用input() / sys.stdin从那里读取列表,要么使用openpyxl或类似的模块。

然后,假设所有这些ID都是唯一的元素:

代码语言:javascript
运行
复制
old_d = dict(old_ids)

for id in old_ids: 
    pos = new_ids.index(id)
    old_d[id] = pos # position in the old list

    #or for simple existence:
    #old_d[id] = (id in new_ids) # just True / False

    #print(f'id {id} from new_ids is in old_ids at position {pos}')

在查找位置的情况下: not found在您的字典中将是-1。拥有一个位置可能比一个简单的存在检查更有用。

它与Excels基本相同。

票数 1
EN

Stack Overflow用户

发布于 2020-06-10 18:55:44

在old_data中检查此代码和相应的结果

代码语言:javascript
运行
复制
import pandas as pd
import numpy as np
new_data = pd.read_excel('new_data.xlsx')
old_data = pd.read_excel('old_data.xlsx')
old_data['exists'] = np.nan
for each in list(old_data.loc[old_data.ID.isin(new_data['ID'])].index):
    old_data['exists'].iloc[each] = 'Exists'
old_data['exists'].fillna('non-existent', inplace=True)
print(old_data)

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62301106

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档