我正在用python加载一个大的数据帧,它有几列和几百万行,所以这肯定是相当消耗内存的。要排除特定列中的某些类型,我使用: import pandas as pddfs = [pd.read_csv(f, sep='\t',encoding='unicode_escape') for f in files]
df = pd.concat
我试图确定Pandas列中是否有具有特定值的条目。我试着用if x in df['id']做这件事。我认为这是可行的,但当我给它一个我知道不在43 in df['id']列中的值时,它仍然返回True。当我只包含匹配缺少的id df[df['id'] == 43]的条目的数据帧子集时,很明显,其中没有条目。如何确定
我有两个工作表,在sheet1中我有一列文章名称(我的名字来自sheet1),在工作表2中我有一个类似于两个"Nom de l‘’entité“的列(在工作表2中按标题进行搜索),如果我在工作表2中找到一个匹配项,我会查找名为"longueur”的列,并复制该值并将其放在工作表1中文章名称的偏移量(0,1)中。我是一个初学者,