使用Drop时，pandas中的非相关DF中缺少相同的列

当使用Drop函数时，pandas中的非相关DataFrame中缺少相同的列，这意味着在删除行或列时，某些DataFrame中可能会出现缺失的列。

在pandas中，Drop函数用于删除DataFrame中的行或列。它可以通过指定标签或索引来删除行或列。当删除列时，如果指定的列在某个DataFrame中不存在，就会出现缺失的列。

为了解决这个问题，可以使用pandas的reindex函数来重新索引DataFrame，以确保所有DataFrame具有相同的列。reindex函数可以根据指定的索引值重新排序DataFrame的行和列，并添加缺失的列。

下面是一个示例代码，演示如何使用reindex函数解决这个问题：

import pandas as pd

# 创建两个非相关的DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
df2 = pd.DataFrame({'C': [7, 8, 9], 'D': [10, 11, 12]})

# 获取两个DataFrame的列名
columns = set(df1.columns).union(set(df2.columns))

# 使用reindex函数重新索引DataFrame
df1 = df1.reindex(columns=columns)
df2 = df2.reindex(columns=columns)

# 打印结果
print(df1)
print(df2)

这段代码首先创建了两个非相关的DataFrame，其中df1包含列'A'和'B'，df2包含列'C'和'D'。然后，通过获取两个DataFrame的列名，并取并集，得到了所有列的集合。接下来，使用reindex函数分别对df1和df2进行重新索引，以确保它们具有相同的列。最后，打印结果，可以看到两个DataFrame中都包含了相同的列。

对于这个问题，腾讯云的相关产品和产品介绍链接如下：

腾讯云数据库TDSQL：腾讯云数据库TDSQL是一种高性能、高可用、可扩展的云数据库服务，支持MySQL和PostgreSQL引擎。它提供了强大的数据存储和处理能力，适用于各种应用场景。了解更多信息，请访问：腾讯云数据库TDSQL
腾讯云云服务器CVM：腾讯云云服务器CVM是一种弹性计算服务，提供可靠、安全、灵活的云服务器实例。它支持多种操作系统和应用场景，适用于各种规模的企业和个人用户。了解更多信息，请访问：腾讯云云服务器CVM

请注意，以上只是腾讯云的一些相关产品，还有其他云计算品牌商提供的类似产品可供选择。

从两个具有重叠但不相同的周期索引的数据框架中创建数据帧

、

我有两个数据帧，每个表示不规则的时间序列。下面是来自df1的一个示例： index 2014-10-30 16:00 118 2014-10-30 19:00 160 2014-10-30 22:00 88 2014-10-31 00:00 128 2014-10-31 03:00 89 2014-10-31 11:00 66 2014-10-31 17:00 84 2014-10-31 20:00 104 2014-10-31 21:00 82 2014-10-31 23:00 95 2014-11-01 02:00

浏览 6提问于2016-06-23得票数 0

回答已采纳

3回答

Pandas -删除与其他行相似的行

、

我需要从pandas.DataFrame中删除满足不寻常条件的所有行。如果有一个完全相同的行，除了它在列"C“中有Nan值之外，我想删除此行。给定一个表： A B C D 1 2 NaN 3 1 2 50 3 10 20 NaN 30 5 6 7 8 我需要删除第一行，因为它在列C中有Nan，但在列C中有绝对相同的行(第二行)和实数值。但是，第三行必须保留，因为不存在具有相同A、B和D值的行。你如何使用pandas来实现这一点？谢谢!

浏览 20提问于2017-07-04得票数 0

回答已采纳

2回答

使用随机林中选择变量返回整个数据帧

、、、、

我正处于降维过程中。我使用随机森林查找与目标SalePrice列相关程度最高的列。问题是产量太大了。绝对不是我想要的。它正在返回259列。其中一些列是对分类变量进行一次热编码的结果，并将它们重新添加到dataframe中，这在逻辑上增加了数据集的维度。但是，我只想返回与目标变量'SalePrice‘相关最大的列。不是整个该死的数据。这是输出： 0 1 2 3 4 5 6 ... 252 253 254 255 256 257 258 0 1 RL 65.0 8450 Pave NaN Reg

浏览 0提问于2019-08-11得票数 2

回答已采纳

2回答

从Python数据帧中提取值

、、

我有一个如下格式的Pandas数据帧： ID|Date|Values 1234|2021-01-01|{"Reason":"Change", "New Value":"Segment 2", "Old Value":"Segment 1"} 我想解析values列并创建一个新的dataframe： ID|Date|Old|New 值的顺序有时是不同的。如何在Python中提取这些值？

浏览 0提问于2021-06-03得票数 0

1回答

如何按列拆分DataFrame

、

我有一个Pandas DataFrame，它有11列，但我想将DataFrame从第1列(而不是第0列)拆分到第10列。我可以用更复杂的方法实现它，而不是Pandas本身提供的方法。如何使用Pandas支持的DataFrame方法完成此操作数据是595行乘11列，我想得到： >>> import numpy as np >>> import pandas as pd >>> train_data = pd.DataFrame(my_data, columns=my_columns) >>> train_data

浏览 1提问于2015-09-23得票数 3

回答已采纳

1回答

熊猫:根据阈值标准删除列

、、、、

我必须解决这个问题:目标:删除列，其中大多数行缺少输入，：1. Dataframe : Pandas 2.阈值:确定哪些列将被删除。如果阈值为.9，则90%缺失值的列将被删除输出：1.带删除列的Dataframe (如果没有删除列，则返回相同的数据) 我编码了这个： class variableTreatment(): def drop_nan_col(self, df, threshold): self.threshold = threshold self.df = df for i in df.columns:

浏览 4提问于2019-11-13得票数 0

回答已采纳

3回答

如果列不在特定列表中，则从Pandas数据框中删除这些列

我有一个熊猫数据框架，它有一些列。如果列没有显示在列表中，我想删除这些列。 pandas数据框列： list(pandas_df.columns.values) 结果： ['id', 'name' ,'region', 'city'] 和我期望的列名： final_table_columns = ['id', 'name', 'year'] X次运算后的结果应该是： list(pandas_df.columns.values) ['id', 'name&#

浏览 18提问于2019-07-05得票数 13

回答已采纳

2回答

当我需要时，Dask drop()不会丢弃列

、、

我是新来的达斯克，列被删除的方式让我感到困惑。我已经把一个csv文件读到了Dask数据文件中。那么假设我有这个： print(len(columns_to_drop)) # There are 66 print(len(list(df.columns))) # The Dask columns before the drop df.drop(columns_to_drop, axis=1).compute(). # Drop the columns pd_df = df.compute() # Create a Pandas dataframe print(pd_df.shape[1

浏览 1提问于2021-12-14得票数 2

回答已采纳

1回答

如何使用python创建仅针对特定列组合的相关矩阵？

、、、、

我有三列小时，因素(影响停车)，停车间隔。我能够绘制相关矩阵，但它是计算所有组合之间的相关性，我想显示所有5个不同文件的一个相关矩阵，但仅显示这些列之间的相关性。 import numpy as np import pandas as pd import seaborn as sns import math import matplotlib.pyplot as plt %matplotlib inline sns.set(style="darkgrid") Creche_Holiday =pd.read_csv("D:\Data Analysis\Pract

浏览 5提问于2017-07-28得票数 1

1回答

这个熊猫警告是从哪里来的？

、、、、

我有一台DataFrame。为了进行统计条件测试，我根据一个布尔列('mar')将其一分为二。我想使用两个表之间的计数比率来添加一个列，该列表示其他列的每个组合的'mar‘列中真值的比例，如下所示。 >>> df_nomar alc cig mar cnt 1 1 1 0 538 3 1 0 0 456 5 0 1 0 43 7 0 0 0 279 >>> df_mar alc cig mar cnt 0 1 1

浏览 0提问于2017-12-12得票数 1

4回答

如何迭代数据帧的唯一行的列值，在熊猫中有排序的数值索引和重复的数据？

、、、

我有一个熊猫DataFrame，它有排序的数字索引和重复的数字索引，对于给定列中相同的索引值，列值是相同的。我想迭代给定列的值，以获得索引的唯一值。示例 df = pd.DataFrame({'a': [3, 3, 5], 'b': [4, 6, 8]}, index=[1, 1, 2]) a b 1 3 4 1 3 6 2 5 8 我希望迭代列a中的值，以查找索引- [3,5]中的唯一条目。当我使用默认的index迭代并打印列a的类型时，我会得到重复索引条目的Series条目。 for i in df.index: cell_

浏览 0提问于2018-03-06得票数 1

回答已采纳

2回答

Numpy vs Pandas轴

、、

为什么Numpy和Pandas中的轴不同？示例：如果我想摆脱Pandas中的列，我可以这样做： df.drop("column", axis = 1, inplace = True) 在这里，我们使用axis =1来删除一列(在DF中垂直放置)。在Numpy中，如果我想对一个矩阵A进行垂直求和，我会使用： A.sum(axis = 0) 这里我使用了axis = 0。

浏览 12提问于2020-06-25得票数 0

4回答

是否删除Pandas数据帧中的NaN/NULL列？

、、、

我在pandas中有一个dataFrame，其中有几列都是空值。有没有一个内置的函数可以让我删除这些列？

浏览 1提问于2012-06-02得票数 65

回答已采纳

1回答

如何利用熊猫查询的结果过滤熊猫的数据

、、、

我有一个pandas df： import pandas as pd df = pd.DataFrame({'col_a' : ['a','a', 'b'], 'col_b': [1,2,3]}) df.index = [4,5,6] 在这个df上，我应用了一个查询： df_subset = df.query('col_a == "b"') 现在我有了第二个dataframe，它如下所示： import numpy as np df_numpy = pd.DataFrame(np.a

浏览 5提问于2020-08-31得票数 2

回答已采纳

2回答

使用python查找变量之间的相关性

、、、

我试图找到中除quality之外的所有列的相关性，然后绘制葡萄酒质量的频率分布。我是用下面的方法来做的，但是我如何去除质量呢？ import pandas as pd df = pd.read_csv('http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/winequality-white.csv', sep=';') df.corr() 它返回以下输出：我如何用pandas绘制葡萄酒质量的频率分布？我之前使用R进行关联，它对我来说工作得很好，但在这个数据集上

浏览 21提问于2021-06-07得票数 0

回答已采纳

2回答

如何在将数据与其他数据框合并时避免数据框中的列过少？

、、

我有两个数据帧df1和df2。 df1 = A B C D 1 2 3 7 . . df2 = A E F G 1 5 4 5 . . 当我通常想要使用pandas合并两个数据框中的特定列时，我会这样做： import pandas as pd df3 = pd.merge(df1[[A,B]],df2[[A,G]], on='A', how='inner') 然而，我感兴趣的是如何避免数据框中的几列并合并其余列。例如，我希望在合并时避免df1中的列C和D，以及df2中的E和F列，这样得到的df3只有A,B,G列。这是逆向工程

浏览 11提问于2020-10-10得票数 3

回答已采纳

1回答

在MultiIndex DataFrame中基于一级列的删除重复项

、、

浏览 2提问于2019-09-20得票数 4

回答已采纳

3回答

如何根据一定的条件丢弃数据帧中的重复行？

、

我们现在的目标是删除重复的玩家行，但将具有最高计数的行保留在G列(游戏播放)中。我们可以使用什么代码来实现这一点？我在这里附加了一个指向Pandas输出图像的链接。

浏览 10提问于2020-02-05得票数 1

回答已采纳

2回答

如何删除所有列，但不是首先从模式开始？

、、

我有删除以spike开头的所有列的代码 import pandas as pd data = {'spike_starts1': [1,2,3], 'spike_starts2': [4,5,6], 'spike_starts3': [7,8,9], 'not': [10,11,12]} df = pd.DataFrame(data) df2 = df.drop(df.columns[df.columns.str.contains(pat = '^spike')].tolist() , axis=1).copy

浏览 3提问于2020-04-17得票数 1

回答已采纳

2回答

Python:根据特定值将列拆分为串联行

、、、

我肯定有人曾问过这样的问题，但我目前的努力并没有找到解决办法。我有一列文本值，例如： import pandas as pd df2 = pd.DataFrame({'text':['a','bb','cc','4','m','...']}) print(df2) text 0 a 1 bb 2 cc 3 4 4 m 5 ... “text”中的列由字符串、in、floats和nan类型数据组成。我试图将文本列中的每个数字(int/float)中

浏览 8提问于2021-12-23得票数 1

回答已采纳

6回答

按nan数量分列的熊猫数据栏

、

我有一个包含nan的列的数据格式。我想删除那些有一定数量nan的专栏。例如，在下面的代码中，我希望删除2或更多nan的任何列。在这种情况下，列'C‘将被删除，只有'A’和'B‘将保留。我如何实现它呢？ import pandas as pd import numpy as np dff = pd.DataFrame(np.random.randn(10,3), columns=list('ABC')) dff.iloc[3,0] = np.nan dff.iloc[6,1] = np.nan dff.iloc[5:8,2] = np.nan prin

浏览 5提问于2015-06-18得票数 20

回答已采纳

3回答

根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中

、、、

我有一个pandas dataframe，它根据两列(A和B)包含重复的值： A B C 1 2 1 1 2 4 2 7 1 3 4 0 3 4 8 我希望删除重复项，并将最大值行保留在列C中。这将导致： A B C 1 2 4 2 7 1 3 4 8 我想不出该怎么做。我是不是应该用drop_duplicates()或者别的什么？

浏览 162提问于2015-08-19得票数 75

回答已采纳

2回答

如何在熊猫中传播数据？

、、

我正在处理pandas中的spread等效项，我的数据框架如下所示 Name age Language year Period Nik 18 English 2018 Beginer John 19 French 2019 Intermediate Kane 33 Russian 2017 Advanced xi 44 Thai 2015 Beginer 并查找如下所示的输出 Name age Language Beginer Intermediate Advanced Nik 18 English 2018 John 19 Fre

浏览 0提问于2020-12-24得票数 0

2回答

熊猫用第一个可用值的分裂来填充nan值。

、、

我正在尝试将DataFrame中的nan值替换为第一个可用值在以下所有nan值之间的拆分。在下面的例子中： import pandas as pd df = [100, None, None, 40, None, 120] df = pd.DataFrame(df) 我想得到： [33.33, 33.33, 33.33, 20, 20, 120] 如果我能找到一种方法来计算列中每个值后面的nan值的数量，那么我就可以运行一些计算来实现拆分。

浏览 2提问于2019-06-25得票数 3

回答已采纳

1回答

当我在Pandas中使用df.corr时，我的一些列丢失了

、、

这是我的代码： import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt data = pd.read_csv('death_regression2.csv') data3 = data.replace(r'\s+', np.nan, regex = True) plt.figure(figsize=(90,90)) corr = data3.corr() print(np.shape(list(corr))) prin

浏览 1提问于2019-03-04得票数 11

回答已采纳

2回答

使用包含单元格的列表“扩展”熊猫数据

、、

我有一个数据文件，其中第三列是一个列表： import pandas as pd pd.DataFrame([[1,2,['a','b','c']]]) 我想分离这个嵌套并创建更多的行，其值与第一列和第二列的值相同。最终的结果应该是： pd.DataFrame([[[1,2,'a']],[[1,2,'b']],[[1,2,'c']]]) 注意，这是一个简化的例子。实际上，我有多个行，我想要“展开”。至于我的进步，我不知道如何解决。好吧，我想我可以在考虑其他列值的同时，接受嵌套列表中的每个成员。然

浏览 3提问于2014-07-16得票数 1

回答已采纳

3回答

删除在熊猫数据帧中移动的两个列的重复值行？

、

我有以下数据： import pandas as pd data = [['1044', '1924'], ['1044', '1926'], ['1044', '1927'], ['1044', '1928'], ['1048', '1924'], ['1048', '1926'], ['1048', '1927'], ['1048', '192

浏览 5提问于2021-10-31得票数 3

2回答

在使用read_csv函数时，是否有方法验证Pandas中的数据类型长度？

、、、

我试图使用Pandas对列进行某种长度验证。例如，假设我有一个名为test.csv的csv，其中包含以下数据： Column1,Column2,Column3 Data1,Data2,DataDataData3 Data1,Data2,Data3 现在，假设我有一个名为dbo.Test1的SQL表，其列数据类型和长度如下： CREATE TABLE [dbo].[Test1](Column1 VARCHAR(5),Column2 VARCHAR(5),Column3 VARCHAR(5)) 现在，这个场景--我尝试使用Pandas read_csv tp来获取这个test.csv，然后使用to

浏览 4提问于2022-04-18得票数 0

1回答

无法将干净的unicode文本插入到熊猫的DataFrame中

、、、

我在做两件事。1)过滤熊猫中的数据；2)在过滤后的数据中的特定列中清除unicode文本。 import pandas as pd import probablepeople from unidecode import unidecode import re #read data df1 = pd.read_csv("H:\\data.csv") #filter df1=df1[(df1.gender=="female")] #reset index because otherwise indexes will be as per original dataf

浏览 0提问于2016-12-20得票数 1

回答已采纳

2回答

将重复行从列的子集移到Python中的另一个数据帧

、

使用Python和Pandas，我希望找到数据帧中所有具有重复行的列，并将它们移动到另一个数据框架中。例如，我可能有： cats, tigers, 3.5, 1, cars, 2, 5 cats, tigers, 3.5, 6, 7.2, 22.6, 5 cats, tigers, 3.5, test, 2.6, 99, 52.3 我想要猫，老虎，3.5在一个数据帧中 cats, tigers, 3.5 在另一个数据框架中，我想 1, cars, 2, 5 6, 7.2, 22.6, 5 test, 2.6, 99, 52.3 代码应该检查每一列是否重复行，并且只删除在所有行

浏览 2提问于2019-10-21得票数 0

回答已采纳

2回答

删除所有值为零的行，并在dataframe中保留一个特定列。

、、

我有一个dataframe，我想删除所有为零的行。但是，第一列是id，我希望保留该列。我查过了 df = df[(df.T != 0).any()] 但是，它删除了所有列。 import pandas as pd import numpy as np df = pd.DataFrame() df['id'] = [ 'a', 'b', 5, 'd' ] df['b'] = [ 0, 9, 0, 2] df['c'] = [ 0, 2, 0, 2] df['d'] = [ 0,

浏览 5提问于2022-02-25得票数 0

回答已采纳

1回答

熊猫在群中检查最后n行的真假

、、、

如果最后的N (3)行或当前中的任何一行或当前在一个组中为true，则我希望输出为True。这就是我一直在尝试这样做的，要么是使用transform，要么是因为它只有一列。 import pandas as pd data = [ ['False', 'CLE',], ['False', 'CLE'], ['True', 'CLE'], ['False', 'MON'], ['False', 'CLE

浏览 5提问于2021-02-05得票数 1

回答已采纳

1回答

python pandas重命名数据框

、、

这段代码的目的是抓取一堆不同长度的数据表(每个表的行数不同)，将它们转换为pandas数据框，删除一些不必要的列并固定日期。上面所有的方法都可以正常工作，但是当我尝试重命名一个列时，我得到了一个错误。以下是数据示例：实际日期 0 2018年10月15日21:30 2018年09月01日21:30 0.7% 2018年08月02日21:30 0.3% 2018年07月09日21:30 -0.1% 2018年06月04日21:30 -0.2% 2018年05月09日21:30 -0.2% 2018年04月10日6:30 -1.1% 代码如下： from selenium import web

浏览 2提问于2018-09-28得票数 1

2回答

使用Pandas使用键标识符转置多个列

、、

我需要将多个列转置为一个列，并将已存在的列作为键标识符。我更喜欢使用pandas来做这件事，但是普通的python也可以。手边的桌子看起来像这样 ID Col1 Col2 Col3 01 'a' 'b' 'c' 02 'a' 'b' 'c' 03 'a' 'b' 'c' 所需的结果应如下所示： ID Col1 01 'a' 01

浏览 0提问于2018-11-29得票数 1

1回答

在行关联后对列进行排序

、

我有一个包含两行或更多行和42列的pandas数据帧。通过对其进行转置和绘制，我得到了各行的轮廓。 df.T.plot() 我希望对列进行排序，这样首先是列，其中行是强相关的(相似的配置文件，值的方向相同)，然后是列，其中的行具有弱相关性(相反的配置文件，值的方向相反)。我可以对列运行集群算法，但集群并不是我想要的。我认为一种解决方案是在点到线性回归线的距离之后进行排序？？

浏览 1提问于2017-03-14得票数 0

1回答

比较数据框中groupby后的两行并执行操作

、、、

我有两个不同的csv文件，我将它们合并到一个数据框中，并根据“class_name”列进行分组。group by按预期工作，但我不知道如何通过将组相互比较来执行操作。从r1.csv开始，代数类减少了5个学生，所以我想要-5，微积分增加了5，所以它必须增加到+5，这必须作为新列添加到单独的数据框架中。日期算术也是如此。这就是我到目前为止所尝试的 import pandas as pd report_1_df=pd.read_csv('r1.csv') report_2_df=pd.read_csv('r2.csv') for group,elements in

浏览 38提问于2019-12-09得票数 2

回答已采纳

2回答

Pyspark :选择特定的列及其位置

、

我想知道如何在数据框中使用编号而不是名称来选择特定的列？在Pandas中就像这样： df = df.iloc[:,2] 有可能吗？

浏览 1提问于2018-06-18得票数 8

回答已采纳

1回答

pandas DataFrame:规范化一个JSON列并与其他列合并

、、、

我有一个pandas DataFrame，其中包含一个列和多个JSON数据项作为字典列表。我想规范化JSON列并复制非JSON列： # creating dataframe df_actions = pd.DataFrame(columns=['id', 'actions']) rows = [[12,json.loads('[{"type": "a","value": "17"},{"type": "b","value": "19&#

浏览 0提问于2018-04-05得票数 8

回答已采纳

4回答

在Python Pandas中跨多列删除所有重复的行

、、、

pandas drop_duplicates函数非常适合用来“唯一”一个数据帧。但是，要传递的关键字参数之一是take_last=True或take_last=False，而我希望删除列的子集上重复的所有行。这个是可能的吗？ A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A 例如，我想删除与列A和C匹配的行，因此应该删除第0行和第1行。

浏览 75提问于2014-05-15得票数 197

回答已采纳

1回答

inplace=False如何不给出数据文件中的密钥错误

、

所以我有点怀疑。当我呈现交互式下拉列表的最后输出时，我试图删除3列，这将过滤数据帧。请注意，此下拉列表使用这3列中的2列(年份、月份)进行过滤。因此，我编写了df_filter = df_reviews，如果在第二次使用交互时再次调用该函数，它将返回这3列(过滤所需的)。然而，当我使用inplace = True时，它给了我一个 KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\indexes\base.py

浏览 2提问于2020-08-02得票数 0

3回答

Pandas丢弃重复项忽略NaN

、、、

在Pandas df中，我尝试跨多个列放置重复项。每行的大量数据是NaN。这只是一个例子，数据好坏参半，所以存在许多不同的组合。 df.drop_duplicates() IDnum name formNumber 1 NaN AP GROUP 028-11964 2 1364615.0 AP GROUP NaN 3 NaN AP GROUP NaN 充满希望的输出： IDnum name formNumber 1

浏览 0提问于2018-07-07得票数 2

1回答

如何在数据帧的每一列之间插入一个空列？

、

我正在尝试(使用python pandas)拆分从excel文件导入的数据帧的列，并在每一对列之间设置一个空列，但似乎无法解决。输入df示例： ABC 111 222 和输出： A B C 1 1 1 2 2 2 (空格表示它是一个空白列) 主要目标是将df导出到excel中，并在每个原始列之间留出空白列。谢谢!

浏览 1提问于2019-08-07得票数 0

2回答

Pandas: Dataframe.Drop - ValueError:轴中不包含labels ['id']

、

正在尝试从Pandas中的DataFrame中删除列。从文本文件创建的DataFrame。 import pandas as pd df = pd.read_csv('sample.txt') df.drop(['a'], 1, inplace=True) 但是，这会生成以下错误： ValueError: labels ['a'] not contained in axis 以下是sample.txt文件的副本： a,b,c,d,e 1,2,3,4,5 2,3,4,5,6 3,4,5,6,7 4,5,6,7,8 提前谢谢。

浏览 0提问于2017-02-08得票数 8

1回答

删除pandas中最后一行中的最高值的列

、、、、

我有多个单列CSV文件，我使用pandas来连接它们，并找到它们的平均值： #!/usr/bin/env python3 import os import glob import pandas as pd from sys import argv, exit os.chdir(f'{argv[1]}') filenames = [i for i in glob.glob('*.csv')] comb = pd.concat([pd.read_csv(f, header=None) for f in filenames], axis=1) comb.colu

浏览 28提问于2020-04-23得票数 0

回答已采纳

3回答

多柱熊猫的滚动相关性

、、、

我正在尝试计算，然后可视化180天窗口(本例中为3)中多列之间的滚动相关性。我的数据是这样格式化的(在原始文件中有12列加上时间戳和数千行)： import numpy as np import pandas as pd df = pd.DataFrame({"Timestamp" : ['1993-11-01' ,'1993-11-02', '1993-11-03', '1993-11-04','1993-11-15'], "Austria" : [6.18 ,6

浏览 2提问于2020-11-13得票数 1

回答已采纳

1回答

在pandas DataFrame中选择与一列的前两个不同项匹配的行

、、

我希望显示'Nameid'列下的值对应于该列中的前两个不同值的DataFrame中的所有行。在下面的示例中，名为'Nameid'的列下的前两个不同值是1和2。我希望选择'Nameid'等于1或2的所有行，并丢弃其余行。我该怎么做呢？我所拥有的： import pandas as pd df = pd.DataFrame(data={ 'Nameid': [1, 2, 3, 1], 'Name': ['Michael', 'Max', 'Susan

浏览 34提问于2020-11-10得票数 1

回答已采纳

1回答

从对象类型列中删除行

、

我的目标是删除列Drop中包含单词Drop的所有行。该列具有下一个属性： df.dtypes['Drop']：dtype('O') type(df['Drop'])：pandas.core.series.Series 我试过： indexNames = df[df['Drop'] == 'Drop'].index df.drop(indexNames, inplace=True) df.drop(df['Drop'] == 'Drop', axis=0) df['Dro

浏览 1提问于2021-11-25得票数 0

回答已采纳

3回答

Pandas根据值删除数据帧中的行

、

我希望删除pandas数据帧中的行，其中第二列=0 所以这个..。 Code Int 0 A 0 1 A 1 2 B 1 会变成这样..。 Code Int 0 A 1 1 B 1 非常感谢您的帮助！

浏览 0提问于2018-11-07得票数 3

回答已采纳

2回答

Pandas:对NaN值进行`or`操作

、、

我有一个包含3列的DataFrame，这样每一列都可以有一个值NaN。我想根据这3个值填充第4列，以便对这些列应用or操作:如果第一列不是NaN，则获取它的值，否则检查第二列，依此类推。因为NaN值不是False，所以不能按原样使用or运算符。这是我附带的代码，但它不是Pythonic式的或者Pandas式的。有没有内置的函数可以做到这一点？或者，如果你有任何其他的建议？ import pandas as pd import numpy as np nan = np.NaN df = pd.DataFrame({"a": [nan, 1, nan], "b"

浏览 22提问于2021-07-06得票数 1

回答已采纳

2回答

在Pandas中删除特定行

、

我尝试过pandas的drop方法，但我没有使用它。我在代码块中提到了我的特定行。我在“Name”列中遇到了我的行。如何使用python删除pandas中的特定行？例如：- 我的特定行是=> Name : Bertug等级:A年龄: 15 import pandas as pd , re , string dataFrame = pd.read_excel("C:\\Users\\Bertug\\Desktop\\example.xlsx") def vowelCount(s): chars = set("aeiouAEIOU") fo

浏览 1提问于2017-03-31得票数 17

回答已采纳