首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

尝试在另一个df中查找dataframe列名称值,将其带回dataframe

您好!根据您提供的问题,以下是完善且全面的答案:

在Python的pandas库中,我们可以使用isin()方法来在另一个DataFrame中查找DataFrame列的名称值,并将其带回原始DataFrame。下面是一个示例代码:

代码语言:txt
复制
import pandas as pd

# 创建原始DataFrame
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10],
        'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)

# 创建包含要查找的列名的DataFrame
columns_to_find = pd.DataFrame(['A', 'C'], columns=['Column'])

# 使用 isin() 方法查找并筛选列名值
filtered_df = df[df.columns[df.columns.isin(columns_to_find['Column'])]]

# 打印结果
print(filtered_df)

上述代码中,我们首先创建了一个原始的DataFrame df,其中包含了三列数据 A、B、C。然后,我们创建了一个名为 columns_to_find 的DataFrame,其中包含了要查找的列名 'A' 和 'C'。接着,我们使用 isin() 方法将 columns_to_find 中的列名与 df.columns 进行比较,找到匹配的列名。最后,我们通过使用筛选后的列名对原始DataFrame df 进行筛选,得到了包含匹配列的新DataFrame filtered_df

关于您提到的各个专业知识和技术领域,例如前端开发、后端开发、数据库、服务器运维、云原生等,请您提供具体的问题或者需要了解的概念,我将非常乐意为您提供相关的知识和信息。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

快速介绍Python数据分析库pandas的基础知识和代码示例

“软件工程师阅读教科书作为参考时不会记住所有的东西,但是要知道如何快速查找重·要的知识点。” ? 为了能够快速查找和使用功能,使我们进行机器学习模型时能够达到一定流程化。...选择 训练机器学习模型时,我们需要将放入X和y变量。...通常回根据一个或多个对panda DataFrame进行排序,或者根据panda DataFrame的行索引或行名称进行排序。 例如,我们希望按学生的名字按升序排序。...注意:使用len的时候需要假设数据没有NaN。 description()用于查看一些基本的统计细节,如数据名称或一系列数值的百分比、平均值、标准等。...类似地,我们可以使用df.min()来查找每一行或每的最小。 其他有用的统计功能: sum():返回所请求的轴的的总和。默认情况下,axis是索引(axis=0)。

8.1K20

Python数据分析实战之技巧总结

前三行 # 查找 df5_3= df5.loc[:, '建筑编码'] # Series 查找 df5_3 = df5.loc[:, ['建筑编码', '建筑名称']] # DataFrame类型...多查找 df5_3 =df5.iloc[:, 0:2] # DataFrame类型 01 df5_4= df5['建筑名称'] # Series类型 df5_4= df5.建筑名称 # Series...DataFrame类型 按照原df5_7=df5[df5.电耗量 > 80]# 选择df5.电耗量>80的行 # df5[df5.建筑名称.isin(['B', 'C'])] #DataFrame...条件查找 # df5[['建筑编码1', '建筑名称']][0:3] # DataFrame类型 # # 块查找 df5_8= df5.iloc[0:2, 0:2] # DataFrame类型...,根据大小,将样本数据划分出不同的等级 方法一:使用一个名为np.select()的函数,给它提供两个参数:一个条件,另一个对应的等级列表。

2.4K10
  • 直观地解释和可视化每个复杂的DataFrame操作

    我们选择一个ID,一个维度和一个包含/。包含将转换为两:一用于变量(名称),另一用于(变量包含的数字)。 ?...诸如字符串或数字之类的非列表项不受影响,空列表是NaN(您可以使用.dropna()清除它们 )。 ? DataFrame dfExplode“ A ” 非常简单: ?...默认情况下,合并功能执行内部联接:如果每个DataFrame的键名均未列另一个,则该键不包含在合并的DataFrame。...使用联接时,公共键(类似于 合并的right_on 和 left_on)必须命名为相同的名称。...串联是将附加元素附加到现有主体上,而不是添加新信息(就像逐联接一样)。由于每个索引/行都是一个单独的项目,因此串联将其他项目添加到DataFrame,这可以看作是行的列表。

    13.3K20

    pandas 入门 1 :数据集的创建和绘制

    为了纠正这个问题,我们将header参数传递给read_csv函数并将其设置为None(python中表示null) df = pd.read_csv(Location, header=None) df...pandas,这些是dataframe索引的一部分。您可以将索引视为sql表的主键,但允许索引具有重复项。...我们已经知道我们有5条记录而且没有任何记录丢失(非空)。 此时的名称无关紧要,因为它很可能只是由字母数字字符串(婴儿名称)组成。本专栏可能存在不良数据,但在此分析时我们不会担心这一点。...与该表一起,最终用户清楚地了解Mel是数据集中最受欢迎的婴儿名称。plot()是一个方便的属性,pandas可以让您轻松地在数据框绘制数据。我们学习了如何在上一节中找到Births的最大。...的最大 [df['Births'] == df['Births'].max()] 等于 [查找出生中等于973的所有记录] df ['Names'] [df [' Births'] == df

    6.1K10

    Python进阶之Pandas入门(三) 最重要的数据流操作

    在这里,我们可以看到每一名称、索引和每行示例。 您将注意到,DataFrame的索引是Title,您可以通过单词Title比其他稍微低一些的方式看出这一点。...、非空的数量、每个的数据类型以及DataFrame使用了多少内存。...请注意,我们的movies数据集中,Revenue和Metascore中有一些明显的缺失。我们将在下一讲处理这个问题。 快速查看数据类型实际上非常有用。...另一个快速而有用的属性是.shape,它只输出一个元组(行、): print (movies_df.shape) 运行结果: (1000, 11) 注意,.shape没有括号,它是一个简单的格式元组(...我们的movies DataFrame中有1000行和11清理和转换数据时,您将需要经常使用.shape。例如,您可能会根据一些条件过滤一些行,然后想要快速知道删除了多少行。

    2.6K20

    通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!

    df.sort_values("col1", inplace=True) 数据输入和输出 1. 利用构造一个数据框DataFrame Excel电子表格可以直接输入到单元格。...我们可以用多种不同的方式构建一个DataFrame,但对于少量的,通常将其指定为 Python 字典会很方便,其中键是列名,是数据。...的选择 Excel电子表格,您可以通过以下方式选择所需的: 隐藏; 删除; 引用从一个工作表到另一个工作表的范围; 由于Excel电子表格通常在标题行命名,因此重命名列只需更改第一个单元格的文本即可...outer") 结果如下: 与 VLOOKUP 相比,merge 有许多优点: 查找不需要是查找表的第一; 如果匹配多行,则每个匹配都会有一行,而不仅仅是第一行; 它将包括查找的所有,而不仅仅是单个指定的...查找和替换 Excel 查找对话框将您带到匹配的单元格。 Pandas ,这个操作一般是通过条件表达式一次对整个DataFrame 完成。

    19.5K20

    pandas库详解一:基础部分

    key即为csv的列名 data_dict = {'a_name':a,'b_name':b} ​#设置DataFrame的排列顺序 dataFrame = pd.DataFrame(data_dict...3 行列 3.1 查找 查找DataFrame数据类型的某一(多)行() 这里记录三个可以实现该功能的函数:loc、iloc、ix。...# 返回一个新的DataFrame,更新index,原来的index会被替代消失 # 如果dataframe某个索引不存在,会自动补上NaN df2 = df1.reindex(['a','b','...# 将columns的其中两:race和sex的设置索引,race为一级,sex为二级 # inplace=True 原数据集上修改的 adult.set_index(['race','sex'...], inplace = True) # 默认情况下,设置成索引的会从DataFrame移除 # drop=False将其保留下来 adult.set_index(['race','sex'],

    1.3K30

    pandas数据清洗,排序,索引设置,数据选取

    df.fillna({1:0,2:0.5}) #对第一nan赋0,第二赋值0.5 df.fillna(method='ffill') #方向上以前一个作为赋给NaN 替换replace(...df1.reindex(['a','b','c','d','e'], fill_value=0) # inplace=Ture,DataFrame上修改数据,而不是返回一个新的DataFrame...# 将columns的其中两:race和sex的设置索引,race为一级,sex为二级 # inplace=True 原数据集上修改的 adult.set_index(['race','sex...'], inplace = True) # 默认情况下,设置成索引的会从DataFrame移除 # drop=False将其保留下来 adult.set_index(['race','sex']...() ---- 数据选取 [] 只能对行进 行(row/index) 切片,前闭后开df[0:3],df[:4],df[4:] where 布尔查找 df[df["A"]>7] isin # 返回布尔

    3.2K20

    Pandas从入门到放弃

    操作 以前面的df2这一DataFrame变量为例,若希望获取点A的x、y、z坐标,则可以通过三种方法获取: 1、df[索引];2、df.索引;3、df.iloc[:, :] 注意: 使用第一种方式时...,获取的永远是,索引只会被认为是索引,而不是行索引;相反,第二种方式没有此类限制,故使用容易出现问题。...第三类方法常用于获取多个,其返回也是一个DataFrame。...(4)DataFrame 数据查询 数据查询的方法可以分为以下五类:按区间查找、按条件查找、按数值查找、按列表查找、按函数查找。 这里以df.loc方法为例,df.iloc方法类似。...:] 还可以编写lambda函数来查找,获取x、z轴正半轴的点的数据 df.loc[lambda df : (df['z'] > 0) & (df['x'] > 0)] (5)DataFrame数据统计

    9010

    Pandas图鉴(三):DataFrames

    如果简单地Jupyter单元df的结果恰好太长(或太不完整),可以尝试以下方法: df.head(5) 或 df[:5] 显示前五行。 df.dtypes返回的类型。...,你必须使用方法而不是运算符,你可以看到如下: 由于这个有问题的决定,每当你需要在DataFrame和类似的Series之间进行混合操作时,你必须在文档查找它(或记住它): add, sub,...为了使其发挥作用,这两个DataFrame需要有(大致)相同的。这与NumPy的vstack类似,你如下图所示: 索引中出现重复的是不好的,会遇到各种各样的问题。...注意:要小心,如果第二个表有重复的索引,你会在结果中出现重复的索引,即使左表的索引是唯一的 有时,连接的DataFrame有相同名称。...要将其转换为宽格式,请使用df.pivot: 这条命令抛弃了与操作无关的东西(即索引和价格),并将所要求的三信息转换为长格式,将客户名称放入结果的索引,将产品名称放入其,将销售数量放入其 "

    38920

    【Python】这25个Pandas高频实用技巧,不得不服!

    3更改列名 我们来看一下刚才我们创建的示例DataFrame: df 我更喜欢选取pandas的时候使用点(.),但是这对那么列名中含有空格的不会生效。让我们来修复这个问题。...读者注:该方法机器学习或者深度学习很有用,因为模型训练前,我们往往需要将全部数据集按某个比例划分成训练集和测试集。该方法既简单又高效,值得学习和尝试。 13....类似地,你可以通过mean()和isna()函数找出每一缺失的百分比。...将一个字符串划分成多个 我们先创建另一个新的示例DataFrame: df = pd.DataFrame({'name':['John Arthur Doe', 'Jane Ann Smith'],...,将Close的最大高亮成浅绿色。

    6.5K50

    pandas 入门2 :读取txt文件以及描述性分析

    使用zip函数合并名称和出生数据集。 ? 我们基本上完成了创建数据集。我们现在将使用pandas库将此数据集导出到csv文件df将是一个 DataFrame对象。...为了纠正这个问题,我们将header参数传递给read_csv函数并将其设置为None(python中表示null) ? 现在让我们看看dataframe的最后五个记录 ?...如果我们想给特定的名称,我们将不得不传递另一个名为name的参数。我们也可以省略header参数。 ? 您可以将数字[0,1,2,3,4,...]视为Excel文件的行号。...pandas,这些是dataframe索引的一部分。您可以将索引视为sql表的主键,但允许索引具有重复项。...我们已经知道有1,000条记录而且没有任何记录丢失(非空)。可以验证“名称仍然只有五个唯一的名称。 可以使用数据帧的unique属性来查找“Names”的所有唯一记录。 ?

    2.8K30

    30 个小例子帮你快速掌握Pandas

    16.带删除的重置索引 某些情况下,我们需要重置索引并同时删除原始索引。考虑从DataFrame抽取样本的情况。该示例将保留原始DataFrame的索引,因此我们要重置它。...我们可以重置索引时将其删除。 df[['Geography','Exited','Balance']]\ .sample(n=6).reset_index(drop=True) ?...第一个参数是位置的索引,第二个参数是名称,第三个参数是。 19.where函数 它用于根据条件替换行或。默认替换是NaN,但我们也可以指定要替换的。...低基数意味着与行数相比,一具有很少的唯一。例如,Geography具有3个唯一和10000行。 我们可以通过将其数据类型更改为category来节省内存。...29.根据字符串过滤 我们可能需要根据文本数据(例如客户名称)过滤观察结果(行)。我已经将虚构名称添加到df_new DataFrame。 ? 让我们选择客户名称以Mi开头的行。

    10.7K10

    解决pandas.core.frame.DataFrame格式数据与numpy.ndarray格式数据不一致导致无法运算问题

    问题描述pandas的DataFrame格式数据,每一可以是不同的数据类型,如数值型、字符串型、日期型等。而ndarray格式数据需要每个元素都是相同类型的,通常为数值型。...我们尝试A转换为ndarray进行运算,但是会出现类型不匹配的错误。...这种方法在数据处理和分析是常见且实用的技巧,希望本文对你有所帮助。实际应用场景,我们可能会遇到需要对DataFrame的某一进行运算的情况。...但是由于DataFrame包含了字符串(产品名称)和数值(销售数量和单价),我们无法直接进行运算。...= df['Quantity'] * df['Unit Price']上述代码,我们创建了一个销售数据的DataFrame ​​df​​,其中包含了产品名称、销售数量和单价。

    46420

    Pandas替换的简单方法

    在这篇文章,让我们具体看看在 DataFrame 替换和子字符串。当您想替换的每个或只想编辑的一部分时,这会派上用场。 如果您想继续,请在此处下载数据集并加载下面的代码。...import pandas as pd df = pd.read_csv('WordsByCharacter.csv') 使用“替换”来编辑 Pandas DataFrame 系列(的字符串...Pandas 的 replace 方法允许您在 DataFrame 的指定系列搜索,以查找随后可以更改的或子字符串。...也就是说,需要传递想要更改的每个,以及希望将其更改为什么某些情况下,使用查找和替换与定义的正则表达式匹配的所有内容可能更容易。...首先,如果有多个想要匹配的正则表达式,可以列表定义它们,并将其作为关键字参数传递给 replace 方法。然后,只需要显式传递另一个关键字参数值来定义想要的替换

    5.4K30
    领券