如何在循环中重命名Pandas DataFrame中的列？_更新pandas Dataframe中的列，如excel_重命名pandas Dataframe中的列的子集 - 腾讯云开发者社区

、、

我试图将字典结构中包含的所有数据格式中的所有列从object转换为string，以便对字符串应用清理函数。 # each key represents a dataframe: # iterate over each dataframe and convert all columns to strings import pandas as pd data = {'dataframe_1':pd.DataFrame({'col1': ['John', 'Ashley'], 'col2': ['+10&#

浏览 2提问于2021-06-29得票数 0

回答已采纳

5回答

除了一些列外，如何在列名中添加后缀？

、

给定熊猫DataFrame，我如何在除Id和Name两列之外的所有列中添加后缀"_old“ import pandas as pd data = [[1,'Alex',22,'single'],[2,'Bob',32,'married'],[3,'Clarke',23,'single']] df = pd.DataFrame(data,columns=['Id','Name','Age','Status'])

浏览 0提问于2018-11-19得票数 12

回答已采纳

2回答

如何在Python中使用pandas重命名DataFrame中的列

、、、

我从Yahoo！导入了五个股票投资组合。并需要创建一个包含所有股票2016年收盘价的DataFrame。但是，我很难用相应的股票名称来标记这些列。 import pandas.io.data as web import pandas_datareader.data as web import pandas as pd from pandas import Series, DataFrame import numpy as np import datetime start = datetime.datetime(2016, 1, 1) end = datetime.datetime(2016

浏览 13提问于2017-01-16得票数 2

回答已采纳

1回答

如何在多索引列上使用pandas rename()？

、、

如何使用DataFrame ()函数简单地重命名pandas rename中的MultiIndex列？让我们看一个例子，并创建这样一个DataFrame： import pandas df = pandas.DataFrame({'A': [1, 1, 1, 2, 2], 'B': range(5), 'C': range(5)}) df = df.groupby("A").agg({"B":["min","max"],"C":"mean"}) pr

浏览 2提问于2018-11-27得票数 3

4回答

ImportError:无法导入名称DataFrame

、

我第一次使用Pandas，并试图导入Pandas、DataFrame和pandas.io.data import pandas as pd from pandas import DataFrame import pandas.io.data 我知道错误了 "ImportError:无法导入名称DataFrame“ 和 "ImportError:没有名为io.data的模块“ 我尝试了以下方法来查找Ubuntu14.04上的错误来源： $pip show pandas -> Version: 0.14.0 Location: /home/new-pc/ana

浏览 5提问于2015-05-11得票数 2

4回答

除了某些列外，如何在列名中添加前缀？

、

这是对@ScalaBoy 提出并由@timgeb回答的问题的改编，问题是相同的，只是关于前缀而不是后缀：对于熊猫DataFrame，除了两列Id和名称之外，我如何在所有列中添加前缀"new_“？ import pandas as pd data = [[1,'Alex',22,'single'],[2,'Bob',32,'married'],[3,'Clarke',23,'single']] df = pd.DataFrame(data,columns=['Id','

浏览 4提问于2021-12-11得票数 3

回答已采纳

2回答

如何引用Pandas中查询字符串中的未命名列？

、、

使用DataFrame时，如何引用查询字符串中未命名的pandas.DataFrame.query列？我知道我可以在后面包围那些无效的Python变量名的列名。但是，这并不涉及未命名的列。例如，我想查询DataFrame中的所有行，其中未命名的列包含大于0.5的值。我的代码开始如下： import pandas as pd import numpy as np array=np.random.rand(10,3) df=pd.DataFrame(array) 到目前为止还不错，但是当我尝试使用pandas.DataFrame.query时，应该使用哪个查询字符串来查找第二列中值大于0.5的

浏览 3提问于2021-07-09得票数 2

5回答

如何在使用Pandas读取Excel文件时指定列名？

、

我以这样的方式将Excel表格读入pandas DataFrame： import pandas as pd xl = pd.ExcelFile("Path + filename") df = xl.parse("Sheet1") 每列的第一个单元格的值被选为dataFrame的列名，我想指定自己的列名，我该怎么做？

浏览 2提问于2013-06-27得票数 14

回答已采纳

3回答

如何在pandas中连接两个不同列名的数据框？- python

、、

df1 = pd.DataFrame({'a':[1,2,3],'x':[4,5,6],'y':[7,8,9]}) df2 = pd.DataFrame({'b':[10,11,12],'x':[13,14,15],'y':[16,17,18]}) 我正在尝试使用df1中的密钥合并这两个数据帧。我想我应该使用pd.merge，但是我如何告诉pandas将df2的b列中的值放在df1的a列中。这是我试图实现的输出： a x y 0 1 4 7 1 2 5 8 2

浏览 1提问于2016-04-29得票数 26

回答已采纳

2回答

查询函数不能处理列名中的空格和圆括号

、、

我有一个列名称中包含空格和括号的数据帧，我正在尝试使用query方法来获取结果。它在处理target_names列时工作得很好，但在sepal length (cm)中出现了错误。 import pandas as pd from sklearn import datasets iris = datasets.load_iris() x = pd.DataFrame(iris['data'], columns=iris['feature_names']) y = pd.DataFrame(iris['target'], columns=[

浏览 23提问于2019-12-20得票数 0

1回答

在循环pandas数据帧之前，我如何找出哪些操作数是受支持的？

、、、、

我正在尝试迭代Pandas DataFrame中的序列中的行。我想获取列csv_df['Strike']的每一行中的值，并将其插入在函数a中调用的变量K中。然后，我希望将输出的a1和a2放入DataFrame中各自的列中。我收到了错误：TypeError: unsupported operand type(s) for *: 'int' and 'zip'，我想如果我能找出支持哪些操作数，我就可以将a1和a2转换为它。我的想法正确吗？注意：S只是一个静态数字，因为df只有一行，而K有很多行。代码如下： from scipy.stats

浏览 1提问于2019-05-08得票数 0

6回答

Pandas列访问，列名包含空格

、

如果我导入或创建一个不包含空格的pandas列，我可以这样访问它： df1 = DataFrame({'key': ['b', 'b', 'a', 'c', 'a', 'a', 'b'], 'data1': range(7)}) df1.data1 它会为我返回那个序列。但是，如果该列的名称中包含空格，则无法通过该方法访问该列： df2 = DataFrame({'key': ['a'

浏览 83提问于2012-12-07得票数 59

回答已采纳

1回答

如何在该字典中引用Pandas数据帧中的键？

、、、、

我有一个字典，里面放了几个数据帧(在这一点上都是一样的)。我正在尝试将数据添加到每个数据帧(会计年度)的同一列中，这些列对应于每个数据帧可以调用的键。我分配的关键字是会计年度。但是，当我尝试使用dict.items()时，它为每个数据帧分配相同的值(上一财年)。我们的目标是按财年预测收入，我将根据每年的收入将收入分解到一个新的列中。我已经将我的代码简化为以下代码： import pandas as pd columns = ['ID','Revenue','Fiscal Year'] ID = [1, 2, 3, 4, 5, 6, 7, 8, 9

浏览 8提问于2018-08-10得票数 1

回答已采纳

1回答

将列值(和类型)更改为pandas Dataframe

、

我正在尝试重命名pandas数据帧中的列，但不同的数据帧具有不同类型的列，我需要帮助。一个简单的例子就能让你明白我的问题。 import pandas as pd dic1 = {'a': [4, 1, 3, 1], 'b': [4, 2, 1, 4], 'c': [5, 7, 9, 1]} dic2 = {1: [4, 1, 3, 1], 2: [4, 2, 1, 4], 3: [5, 7, 9, 1]} df1 = pd.DataFrame(dic1) df2 = pd.DataFrame(dic2) 现在如果我输入 df1.columns

浏览 20提问于2016-08-03得票数 2

回答已采纳

1回答

如何在pandas数据帧中添加标头

、

我有一个pandas dataframe，它的标题id，n和t包含重复的id，在调用groupby和size()之后，在给定计数的情况下生成了没有标题的额外列如何添加与第4列值的值相关联的额外列标题‘below.Now’，使其变为'id'，'n'，'t'，'count‘ id %n%t 7 2 Y 4 7 2 N 6 8 3 Y 2 8 9 N 3 9 1 Y 5 9 6 N 7

浏览 1提问于2015-11-14得票数 0

1回答

如何在熊猫df中重命名空白列名？

、、

我正在使用pandas_datareader返回股票价格。该文件称，熊猫的数据框架由pandas_datareader返回。问题是返回数据帧时使用的是空白列名。这意味着在重命名列之前，我(相信这是真)不能添加另一列。总之，这是我的代码： from datetime import datetime, timedelta from pandas import pandas as pd from pandas_datareader import data, wb from matplotlib.figure import Figure from matplotlib.dates import Dat

浏览 7提问于2017-05-11得票数 0

回答已采纳

1回答

当熊猫列重命名创建列名重复时，该怎么办？

、

如果新列名已经存在，那么当我重命名列时，为什么pandas.DataFrame对象不抱怨呢？这使得将来引用新列时返回pandas.DataFrame而不是pandas.Series，这可能会导致进一步的错误。第二，是否有办法处理这种情况？示例： import pandas df = pd.DataFrame( {'A' : ['foo','bar'] ,'B' : ['bar','foo'] } ) df.B.map( {'bar':'foo','f

浏览 2提问于2015-05-29得票数 0

回答已采纳

1回答

KeyError:当尝试选择dask数据框上的列时：“没有[索引([‘’，'']，dtype='object')]在[列]中”

、

我正在使用from_pandas()函数从熊猫数据帧创建一个dask数据帧。当我尝试使用方括号[ ]从dask dataframe中选择两列时，我得到了一个KeyError。根据dask文档，dask dataframe支持像pandas dataframe一样的方括号列选择。 # data is a pandas dataframe dask_df = ddf.from_pandas(data, 30) data = data[dask_df[['length', 'country']].apply( lambda x: myfun

浏览 67提问于2019-10-04得票数 1

1回答

如何分配列标题/名称pandas？

、、

我的pandas dataframe列如下： 0 0至9.03 1/ 10.17 2- 11.18 如何分配列名？

浏览 18提问于2020-01-15得票数 0

回答已采纳

1回答

如何创建一个空数据文件并追加它

、、

我是新来的蟒蛇和熊猫。我必须读取几个csv文件，这些文件具有相同的列，并创建了一个结果dataFrame(它包含来自每个csv文件的所有行)。我试过了，但是当我打印dataframe时，它是打印空的DataFrame 栏：[]索引：[] 守则是： def readCSV(dir): list = getFilesInDir(dir) # my function which returns list of files. dataframe = pandas.DataFrame() for name in list: df = pandas.read_csv(name)

浏览 0提问于2020-03-22得票数 1

回答已采纳

1回答

熊猫:如何将CSV的内容读成一列？

、、、

我想将一个文件'tos_year.csv‘读入Pandas，这样所有的值都在一个列中。稍后，我将使用pd.concat()将该列添加到现有的dataframe中。 CSV档案以年份的形式保存了80个条目，即“.1966,1966,1966,1966,1967，.” 我无法理解的是如何将这些值读入一行80行的列，而不是80列中的一行。这可能是相当基本的，但我是新手。这是我的密码： import pandas as pd tos_year = pd.read_csv('tos_year.csv').T tos_year.reset_index(inplace=True)

浏览 3提问于2021-03-30得票数 1

回答已采纳

1回答

避免Pandas将None隐式转换为列元组中的NaN

、

我有一个Pandas DataFrame，它的列用Python tuples标记。这些列标签元组可以不包含任何内容。当我尝试使用以下任一方法向数据框添加列时，标记元组中的None被隐式转换为numpy.nan。方法1-使用dataframe[ NewColumn ] = ...语法添加列 >>> import pandas >>> df = pandas.DataFrame() >>> column_label = ( 'foo', None ) >>> df[column_label] = [ 1,

浏览 1提问于2016-01-05得票数 1

1回答

如何在计算后添加新列

、

我有这个DataFrame： Open High Low Close AdjClose Volume datetime 2018-07-27 28.8200 29.3350 27.7050 28.1300 28.1300 8101362 2018-07-26 28.4800 29.1200 27.5500 28.9800 28.9800 10582061 2018-07-25 30.0900

浏览 105提问于2018-07-30得票数 0

回答已采纳

1回答

如何从文件夹中读取excel文件并将它们连接到单个df中？

、

第一次海报来了！我已经浏览了这些论坛一段时间了，我对这个社区的支持感到惊讶。我的问题涉及几个excel文件，它们的名称、列标题、数据类型都是相同的，我正试图与熊猫一起阅读这些文件。在阅读完它们之后，我想比较所有数据帧中的“约定日期”列，如果它们匹配，则创建一个yes/no列。然后，我想导出数据框架。我仍然在学习Python和Pandas，所以我正在努力完成这个任务。到目前为止，这是我的代码： import pandas as pd import glob xlpath = "/Users/myname/Documents/Python/" # read .xlsx f

浏览 7提问于2022-02-26得票数 0

2回答

如何在python中使用熊猫填充数据中的日期

、、

我有一个Case和Date两列的dataframe。在这里，Date实际上是开始日期。我想把它作为一个时间序列填充，说在每种情况下增加三个(month_num)日期，并删除原来的日期。原始数据： Case Date 0 1 2010-01-01 1 2 2011-04-01 2 3 2012-08-01 填充日期后： Case Date 0 1 2010-02-01 1 1 2010-03-01 2 1 2010-04-01 3 2 2011-05-01 4 2 2011-06-0

浏览 6提问于2022-04-27得票数 0

回答已采纳

2回答

如何更改Pandas dataframe的列名时，它是用“泡菜”保存的？

、、、

我用“泡菜”保存了一只熊猫DataFrame。当我称之为它时，它看起来像图A(这很好)。但是，当我想要更改列的名称时，如图B所示，我做错了什么？更改列名的其他方法是什么？图A 图B import pandas as pd df = pd.read_pickle('/home/myfile') df = pd.DataFrame(df, columns=('AWA', 'REM', 'S1', 'S2', 'SWS', 'ALL')) df

浏览 4提问于2016-11-01得票数 0

回答已采纳

1回答

如何将两个urls的标题存储在excel文件中

、、

import bs4 from bs4 import BeautifulSoup from pandas.core.base import DataError from pandas.core.frame import DataFrame import requests import pandas as pd from fake_useragent import UserAgent urls = ['https://www.digikala.com/search/category-mobile', 'https://www.digikala.com/search

浏览 14提问于2021-01-18得票数 0

回答已采纳

1回答

熊猫DataFrame只命名一栏

、、

Pandas Dataframe是否有一种方法只命名第一列或第一列和第二列，即使有4列：这里 for x in range(1, len(table2_query) + 1): if x == 1: cursor.execute(table2_query[x]) df = pd.DataFrame(data=cursor.fetchall(), columns=['Q', col_name[x-1]]) 它给了我这个： AssertionError:传递了2列，传递的数据有4列

浏览 6提问于2016-07-13得票数 2

回答已采纳

1回答

如何在Pandas函数中使用np.Vectorize()？

、、、、

我有一个以Pandas DataFrame格式操作的函数。它适用于pandas.apply()，但不适用于np.Vectorize()。请查找以下功能： def AMTTL(inputData, amortization = []): rate = inputData['EIR'] payment = inputData['INSTALMENT'] amount = inputData['OUTSTANDING'] amortization = [amount] if amount - payment &l

浏览 17提问于2022-09-21得票数 0

1回答

如何使用pandas query()在查询表达式中正确引用多索引列标题？

、

使用简单的(单级)列索引，可以使用.query()访问pandas DataFrame中的列，如下所示： df1 = pd.DataFrame(np.random.rand(10,2),index=range(10),columns=['A','B']) df1.query('A > 0.5') 我正在努力在具有列多索引的DataFrame中实现类似的功能： df2 = pd.DataFrame(np.random.rand(10,2),index=range(10),columns=[['A','B'],[

浏览 0提问于2014-10-21得票数 9

1回答

Teradata Python:如何重命名dataframe中的列？

、

用户如何在不将其转换为Pandas dataframe的情况下重命名teradata dataframe中的列？

浏览 13提问于2019-10-29得票数 0

2回答

熊猫如何在agg功能完成后将柱子扁平化？

、

假设我有一个df： data=[('a', 1), ('a', 1),('b', 1),('a', 3),('b', 2),('c', 1),('a', 2),('b', 3),('a', 2)] df=df=pd.DataFrame(data, columns=['project', 'duration']) # Then I made an aggregation: df_agg=df.groupby('p

浏览 2提问于2020-03-10得票数 4

回答已采纳

2回答

熊猫:获取"TypeError:只有整数标量数组可以转换为标量索引“，同时尝试合并数据帧

、、

重命名DataFrame的列后，在新列上合并时会出现错误： import pandas as pd df1 = pd.DataFrame({'a': [1, 2]}) df2 = pd.DataFrame({'b': [3, 1]}) df1.columns = [['b']] df1.merge(df2, on='b') TypeError:只有整数标量数组可以转换为标量索引

浏览 2提问于2020-01-23得票数 11

回答已采纳

1回答

如何在不使用列名的情况下过滤带有pandas的行-循环过滤器

、、

我尝试使用Pandas过滤DataFrame中的行，但没有使用： df[(df.ColumnA == 1)] 我希望能够做到这一点： i = 'A' x = 'Column'+'i' df[(df.x == 1)] 我的目标是在列过滤器中循环。如果我能做到这一点就更好了： i = A x = 'Column'+'i' y = 1 df[(df.x == y)] 允许我在列中循环和在过滤器类型中循环：谢谢!

浏览 3提问于2014-11-01得票数 0

2回答

重命名不带列名的pandas数据框的列

、

我正在尝试在dataframe.from_dict操作之后命名我的新数据帧的列。只需使用pandas.dataframe.from_dict函数： df = pd.DataFrame.from_dict(my_dict,orient='index') 生成不带列标题的数据帧。 data=pd.DataFrame.from_dict(my_dict,orient='index).rename(columns = {'name','number'}) 这不会产生任何错误: TypeError：'set‘对象不可调用。有谁有线索吗

浏览 2提问于2017-07-14得票数 4

回答已采纳

3回答

如何在忽略索引对齐的同时分配列

、

假设我在Pandas中有两个dataframes x和y，我想在x中填充一个列，结果是在y中对一个列进行排序。我试过这个： x['foo'] = y['bar'].order(ascending=False) 但是它不起作用，我怀疑，因为在分配过程中，Pandas 在x和y (它们有相同的一组索引)之间对索引。如何让Pandas使用另一个dataframe 中的另一列来填充，而忽略了对索引的对齐？

浏览 3提问于2013-04-12得票数 15

3回答

如何在熊猫DataFrame中设置值的时区？

、、

我想在Pandas DataFrame中设置列的值的时区。我正在用pandas.read_csv()读取DataFrame。

浏览 1提问于2012-12-22得票数 14

回答已采纳

32回答

重命名Pandas中的列名

、、、、

我有一个使用Pandas和列标签的DataFrame，我需要编辑它们来替换原始的列标签。我想更改DataFrame A中的列名，其中原始列名为： ['$a', '$b', '$c', '$d', '$e'] 至 ['a', 'b', 'c', 'd', 'e']. 我将编辑后的列名存储在一个列表中，但我不知道如何替换列名。

浏览 2提问于2012-07-05得票数 2399

回答已采纳

3回答

循环遍历每列

、

我有一个有n列的dataframe，我正在尝试创建一个递归遍历这些列的函数。例如，假设我有以下数据帧： | left | center | right | |:---- |:------:| -----:| | One | Two | Three | 我想运行一个函数，它使用左列，然后是左列和中列，然后是左列、中列和右列。所以基本上，在每一步，我使用前面的列+ 1。在pandas中有一个有效的方法来做到这一点吗？

浏览 9提问于2020-12-10得票数 0

1回答

为dataframe定义函数

、、

我试图定义一个函数，该函数选择dataframe的一部分，按dataframe中的列分组，并将后缀附加到列名 def diagnosis(x): x = df.query('x == 1').groupby('gender').count() return x.rename(lambda y: y[:11] + '_' + x[0], axis='columns') 其中：诊断-功能名称具有选择标准的x列 dataframe 这是我运行代码时的错误 -------------------------------

浏览 2提问于2022-08-09得票数 0

2回答

Pandas如何查找列值与两个数据帧不同的行

、、、、

我正在尝试获取列中值与两个数据帧不同的行。例如，假设下面有这两个数据： import pandas as pd data1 = {'date' : [20210701, 20210704, 20210703, 20210705, 20210705], 'name': ['Dave', 'Dave', 'Sue', 'Sue', 'Ann'], 'a' : [1,0,1,1,0]} data2 = {'date' : [20

浏览 1提问于2021-08-03得票数 0

2回答

在pandas中迭代dataframe的列

、

我正在尝试在pandas中绘制数据框列中的值的一些直方图，我想循环遍历列以获得紧凑的代码，但代码总是抛出错误？ for c in df.columns: axes[i,0].hist(df[df.num>0].c.tolist()) i +=1 AttributeError: 'DataFrame' object has no attribute 'c'

浏览 19提问于2020-04-24得票数 0

2回答

我可以避免pandas merge中右侧数据框的join列出现在输出中吗？

、

我正在用pandas合并两个数据帧。我希望避免这种情况，在连接时，输出包括右表的连接列。示例： import pandas as pd age = [['tom', 10], ['nick', 15], ['juli', 14]] df1 = pd.DataFrame(age, columns = ['Name', 'Age']) toy = [['tom', 'GIJoe'], ['nick', 'car']] df2 = pd

浏览 7提问于2021-01-19得票数 1

回答已采纳

2回答

使用另一个数组应用函数pandas.Series中的参数

、、、、

有什么方法可以使用另一个pandas.Series的不同值在pandas.Series中应用函数吗？我知道有pandas.Series.apply()，但我需要这样的东西： array1 = pandas.Series([1, 2, 3, 4]) array2 = pandas.Series([5, 5, 6, 0]) def func(x, y): return x+y print(array1.apply(func, args = array2)) Out: 0 6 1 7 2 9 3 4 换句话说，我需要在一个pandas.DataFra

浏览 23提问于2021-04-07得票数 0

2回答

更改行和列，并在数据帧中重命名列

、

我有一个dataframe，我想转换行和列，并按如下方式更改列的名称。我的数据是： import pandas as pd df = pd.DataFrame() df ['time'] = [1,2,3,4] df ['a'] = [3,-1,0, 23] df['b'] = [-1, 2, 5, 6] df 我想把它改为：你能帮我一下吗？

浏览 3提问于2022-03-18得票数 1

2回答

如何在pandas.to_datetime中组合/重写“分钟”？

、、、、

如何在pandas.to_datetime中组合/重写“分钟”？我的数据框架如下所示： df_2 = pd.DataFrame({ 'years' : df.year, 'months': df.Month, 'days' : df.DayofMonth, 'hours' : df.hour, 'mins' : df.min })

浏览 8提问于2022-01-02得票数 0

1回答

从URL创建名称

、

我正在DataFrame中创建一个NAME列，并根据另一列中包含的子字符串设置它的值。有没有更有效的方法来做到这一点？ import pandas as pd df = pd.DataFrame([['www.pandas.org','low'], ['www.python.org','high']], columns=['URL','speed']) print(df.head()) df['Name'] = df['URL'] print(df

浏览 0提问于2020-06-25得票数 3

回答已采纳

1回答

如何在数据帧内的循环上运行if-else语句

、

我有一个带有列name1的dataframe，我想运行一条if-else语句，用特殊字符'-‘分隔姓氏，并像name2和name3一样输出它们，我该怎么做？ import pandas as pd d = { 'name1': ['Braund', 'Cummings-Johnson', 'Heikkinen-Smith'], 'name2': ['Braund', 'Cummings', 'Heikkinen'], 'na

浏览 21提问于2018-06-07得票数 1

2回答

在pandas.merge_asof之后保持两个合并键

、、

我找到了一个很好的函数pandas.merge_asof。从文件中 pandas.merge_asof(left, right, on=None, left_on=None, right_on=None) Parameters: left : DataFrame right : DataFrame on : label Field name to join on. Must be found in both DataFrames. The data MUST be ordered. Furthermore this must be a numeric column,such as d

浏览 3提问于2018-05-04得票数 19

回答已采纳

2回答

熊猫:分组和总和数据，同时增加最小和最大年。

、、

请考虑以下数据： import pandas as pd from pandas import DataFrame df = pd.DataFrame({'ID': ['A','A','A','B','B','B','C','C','C'], 'YEAR': [2000,2001,2002,2007,2008,2009,2015,2016,2017], 'ITEM-A'

浏览 7提问于2022-02-21得票数 1

回答已采纳