更改pandas数据帧中的列名_pandas数据帧中基于列名的堆叠_Sparklyr -更改Spark数据帧中的列名 - 腾讯云开发者社区

、、

我想将几个大型Pandas数据帧转换为Spark数据帧，然后对它们进行操作和合并，如下所示： import pandas as pd from pyspark import SparkContext,SQLContext df1 = pd.read_csv('data1.cat',delim_whitespace=True) df2 = pd.read_csv('data2.cat',delim_whitespace=True) sc = SparkContext() sql = SQLContext(sc) spark_df1 = sql.createDa

浏览 208提问于2020-06-08得票数 0

回答已采纳

1回答

带有orient=“read_json”的pandas表

、、

我已经丢弃了一个扩展基于this answer的json编码器的数据帧字典。我只是改变了转储数据帧的方式，出于我自己的目的，将表的“记录”改为orient=的“表”。不知何故，我无法从json读取数据帧；准确地说，pandas似乎可以正确读取它(没有引发异常)，但它充满了NaN值。有没有人可以检查我是否做错了什么，或者这是不是熊猫的bug (可能指的是多索引数据帧)？我使用的是pandas版本1.1.4。下面的代码足以(我希望)测试pandas是否在我的机器上是KO的，或者我是否以某种方式弄乱了数据帧的格式。我还尝试用一个包括两个索引的虚拟数据帧来重现它，并且没有遇到问题。还要注意

浏览 13提问于2020-12-03得票数 0

回答已采纳

1回答

Pandas append函数添加新列

我想将一行附加到我的数据帧中。下面是代码 import pandas as pd citiesDataFrame=pd.read_csv('cities.csv') citiesDataFrame=citiesDataFrame.append({ 'LatD': 50, '"LatM"' : 70, '"LatS"' : 40, '"NS"': '"S"', '"LonD"': 200, '&#

浏览 40提问于2020-11-25得票数 0

1回答

元素错误:需要12个元素，新元素值为8

、

我有一个包含5列和100个值的数据帧。在进一步分析之前，我正在尝试对数据进行基本的描述性分析。我通过创建一个函数来实现这一点，在这个函数中可以找到不同的描述性信息，并将其存储在新的数据帧中，但我得到了一个元素错误。 import numpy as np import pandas as pd from IPython.display import display df = pd.read_excel('cmc_data.xlsx', engine='openpyxl') print(df) def detailed_analysis(data, pred

浏览 49提问于2020-12-26得票数 1

回答已采纳

1回答

重命名dataframe中的大量列标题

、、

不确定这是否可能。我有一个大约有90列的数据帧。我需要将这些列的特定数量(~50)重命名为不同的名称。这些列将分布在整个数据帧中(即不是前50列或后50列)。有没有一种快速的方法可以做到这一点，而不使用pandas (下面的例子)给出的方法？ df.rename(index={0: "x", 1: "y", 2: "z"}) A B x 1 4 y 2 5 z 3 6 Edit:这是用于创建数据帧的代码： # Function to import data from ARIC json file to dataframe

浏览 0提问于2019-11-20得票数 0

1回答

在azure ML中过滤TabularDataset

、、、、

我的数据集是巨大的。我正在使用Azure ML notebooks，并使用azureml.core读取日期集并转换为azureml.data.tabular_dataset.TabularDataset。无论如何，我会过滤tabularDataset中的数据，而不是转换为pandas数据帧。我使用下面的代码来读取数据。由于数据量巨大，pandas数据帧正在耗尽内存。我不需要将完整的数据加载到程序中。仅需要子集。有没有办法在转换为pandas数据框之前过滤记录 def read_Dataset(dataset): ws = Workspace.from_config() ds

浏览 69提问于2021-01-06得票数 1

5回答

如何在pyspark中获取dataframe列的名称？

、

在熊猫中，这可以通过column.name来完成。但是，当它的spark数据帧列时如何做同样的事情呢？例如，调用程序有一个spark数据帧: spark_df >>> spark_df.columns ['admit', 'gre', 'gpa', 'rank'] 此程序调用我的函数: my_function(spark_df 'rank‘)在my_function中，我需要列的名称，即’rank‘ 如果是pandas数据帧，我们可以在my_function内部使用 >>> pand

浏览 1提问于2016-09-28得票数 55

1回答

Panda追加并合并重新排序数据帧吗？

、、、

我使用python pandas包创建了一个空数据帧(df1)，其中只包含以下列: var1、var2、var3 我还有另一个数据帧(df2)，它看起来像这样:列: var 2，var1，var3值: 1，2，3 当我向df1追加df2时，数据帧中列的顺序发生了变化。我尝试使用sort_values和sort重新排序数据帧和旧的列列表，但不起作用。有人知道我怎么解决这个问题吗？我使用的是python版本2.7

浏览 5提问于2018-01-18得票数 0

回答已采纳

1回答

pandas concat添加带有nans的列吗？

、

我有两个数据帧，每个都有相同的列数： print(df1.shape) (54, 35238) print(df2.shape) (64, 35238) 而且两者都没有任何索引设置 print(df1.index.name) None print(df2.index.name) None 但是，每当我尝试垂直连接它们时(因此要有第三个具有形状(118,35238)的数据帧)，它就会产生一个新的带有NaNs的df： df3 = pandas.concat([df1, df2], ignore_index=True) print(df3) ? 生成的df具有正确的行数，但它已决定将它

浏览 16提问于2019-08-31得票数 0

回答已采纳

1回答

如何从for循环中创建绘图

、、、

仅语法问题我读入了一个按日期对齐的大型数据帧。我有一个关注关键日期(时间窗口)的80+数据帧列表。我想循环遍历该列表并绘制每个项目(时间窗口)，x轴作为时间轴，y轴作为来自每个数据帧的特定数据列。所有数据帧都具有相同的格式和相同的列标题。然后，我希望我的for循环根据列表变量名保存每个绘图。但是，我不确定如何以正确的语法将这些参数传递给for循环。对于下面的问题，我假设温度是所有数据帧中的公共常量，并且是要为所有DF返回的Y轴。我能找到的最相关的例子(第21-24行)： In [21]: winter = daily['2012-12-01': '2013-0

浏览 0提问于2019-07-31得票数 0

2回答

Pandas查找不连续数据的方法

、、

我想找出pandas数据帧中的哪些列具有不连续的数据。所谓“不连续”，我的意思是这些值从某个值变为零，然后再有一些值。 [0,0,0,1,2,3,4,5,0,0,0] # continuous [0,0,0,1,2,0,4,5,0,0,0] # not continuous 我已经设法实现了一些可以做到这一点的代码，使用for循环来迭代数据帧的每一列。我在下面制作了一个工作代码片段来说明我的意思： import numpy as np import pandas as pd def find_discontinuous(series): switch = 0 for inde

浏览 0提问于2017-08-16得票数 1

回答已采纳

1回答

KeyError：“[‘花瓣长度’]不在索引中”

、

我对Pandas数据框架中的索引有一些问题。我要做的是从csv文件中加载数据，创建一个Pandas数据框架，然后从该数据帧中选择特定的列并将其转换为一个数组。 KeyError：“花瓣长度”不在索引中我使用的代码是 import pandas as pd import numpy as np data = pd.read_csv('iris.csv') x = np.array(data[['sepal length', 'petal length']]) 这张桌子是：使用reindex将为列创建缺少的值。

浏览 0提问于2016-12-13得票数 1

1回答

dataframe在使用pandas限制原始结构后，缺少标头

、

python 3.7.2。在pycharm/jupyter中，我使用公共的pandas/read_excel将一个excel表格加载到一个数据帧中，这个部分工作得很好。在excel文件和加载的df中，标题都在第一行。After希望通过应用过滤器(只包括前20行和列的一部分)来创建一个辅助表。代码遍历，但是它返回一个没有标头的dataframe，只返回数字，而不是列名据我所知，默认情况下会加载到pandas包中，除非我将其排除在外。我尝试了许多不同的方案，但都不起作用。 df = pd.read_excel('resources//ifilename.xlsx', parse

浏览 19提问于2019-06-11得票数 0

回答已采纳

1回答

当我在数据帧列表中存储多个数据帧时，我回想起其中的一个，有没有一种方法可以格式化输出的列标题？

、、、、

我是Python和Stackoverflow的新手，所以请耐心等待。我有一个大约140k行的大型数据文件存储为csv。该文件被分成基于年龄组的部分，即。16-24，24-50等。在每次休息时，都会有关于受试者的年龄和性特征的信息线。在将csv加载到pandas之后，我尝试通过使用iloc划分年龄组的信息行来将数据帧拆分成几个较小的数据帧。现在我有了一个数据帧列表。我可以访问列表中的每个数据帧，没有问题，但是(我猜是由于信息行的原因) pandas在一列中显示所有信息。有没有一种方法可以格式化输出，并让pandas显示列标题，并将信息行放入列标题上方的标题中？我很抱歉，如果这不是非常清楚，请随

浏览 7提问于2019-05-29得票数 1

回答已采纳

2回答

我想使用python、pandas来提取满足特定条件的数据帧。

、

我使用python和pandas调用带有元组Time、Name、Good、Bad的Excel数据。我想将数据帧重新处理为满足特定条件的另一个数据帧。具体地说，我想打印出一个数据帧，它存储了整个时间内每个名称的好数据和坏数据的总和。请帮助我谁知道蟒蛇，熊猫。 enter image description here

浏览 23提问于2020-04-29得票数 1

回答已采纳

1回答

使用合并的Excel列中的元组列名选择pandas列失败

、、、

我有一个数据帧，其中的列名是元组。这样做的原因是，数据帧是基于复杂的Excel电子表格，其中列标题由不同大小的合并单元格组成，因此在MultiIndex中，几乎每一列都有一个或多个级别的nan条目，这使得选择和写入数据变得困难。我在过去多次使用相同的解决方案，没有出现问题，例如，MultiIndex头('SCN', nan, nan, nan, nan)将被转换为元组('SCN',)，然后我们将MultiIndex更改为正常的元组索引。然而，由于奇怪的KeyErrors和TypeErrors，这一次我似乎不能对数据帧做太多事情： test.columns Out

浏览 3提问于2021-02-24得票数 1

1回答

Pandas:使用set_index()将列设置为索引创建一个子索引。为什么会发生这种情况，以及如何删除它？

、、、

我想使用pandas数据帧中的第一列作为行索引，所以我尝试使用来实现，但这样做的副作用是添加了额外的列索引。 (运行选项InteractiveShell.ast_node_interactivity = "all"的jupyter notebook代码)： import pandas as pd df = pd.DataFrame([[l+r*10 for l in range(1, 5)] for r in range(1, 5)]) df # before df.set_index(0, inplace=True) df # after set_index()之前的

浏览 9提问于2018-08-16得票数 3

回答已采纳

3回答

在python中从字符串中提取数字

、

我试图从pandas数据帧中的列中仅提取区域编号: 568平方英里(1,471 km2)这里我只想要568，数字和sq之间的空格是牢不可破的空格。

浏览 4提问于2020-05-09得票数 0

1回答

Pandas重塑数据帧，每行一个单元格，包含列名和索引

、

假设我有一个数据帧，它可以表示为： pd.DataFrame(columns=['X', 'Y'],index=['A','B']) X Y A 1 2 B 3 4 然后，我想对每个单元格应用函数，以获得每个行的数据帧、具有列名和索引的单元格的值，如下所示： Col1 Col2 Value 1 X A 1 2 Y A 2 3 X B 3 4 Y B 4 我知道我可以循环它来得到结果，但我希望有一个更好的像

浏览 9提问于2019-05-19得票数 1

回答已采纳

4回答

我可以使用applymap来更改dataframe的变量名吗？

、

如果我想使用熊猫更改数据帧中的变量名，可以不使用pandas.df.rename()函数，而是使用applymap()来更改名称吗？ Registrar Enrolment Agency State District Sub District Pin Code Gender Allahabad Bank Tera Software Ltd Jharkhand Ranchi Namkum 834003 M Allahabad Bank Tera Software Ltd Jharkhand Ranchi Ranchi 834004

浏览 5提问于2017-01-29得票数 3

回答已采纳

2回答

如何修复pandas的按行内容子集时的锁定错误？

、、、

我尝试通过特定列的内容来子集数据帧，但由于某些原因，无论我尝试做什么，它都不起作用。熊猫网站建议对我的数据进行如下处理： >>> import pandas as pd >>> data = pd.read_csv('D:/vini_/Vini/Estudos/FEA.Dev/Cases/case_avancado/Vendas.csv') >>> data.head(5) DataVenda ... Continente 0 6/1/2017 ... Europa 1

浏览 0提问于2021-05-06得票数 0

2回答

重命名不带列名的pandas数据框的列

、

我正在尝试在dataframe.from_dict操作之后命名我的新数据帧的列。只需使用pandas.dataframe.from_dict函数： df = pd.DataFrame.from_dict(my_dict,orient='index') 生成不带列标题的数据帧。 data=pd.DataFrame.from_dict(my_dict,orient='index).rename(columns = {'name','number'}) 这不会产生任何错误: TypeError：'set‘对象不可调用。有谁有线索吗

浏览 2提问于2017-07-14得票数 4

回答已采纳

1回答

Pandas to_sql如何确定将哪个数据框列放到哪个数据库字段中？

、、、、

我目前正在使用Pandas，以便将大型数据帧放入to_sql数据库中。我使用sqlalchemy来连接数据库，这个过程的一部分是定义数据库表的列。我的问题是，当我在数据帧上运行to_sql时，它如何知道数据帧中的哪一列进入数据库中的哪个字段？它是否在数据帧中查找列名，并在数据库中查找相同的字段？是变量的顺序吗？下面是一些便于讨论的示例代码： engine = create_engine('sqlite:///store_data.db') meta = MetaData() table_pop = Table('xrf_str_geo_ta4_1511',

浏览 1提问于2016-01-13得票数 14

回答已采纳

1回答

通过pandas DataFrame编写一个循环，提取值(一个url链接)，然后通过一个函数传递每个url链接元素

、

我对从Python Library报纸上运行article.text()有兴趣，这些链接(n)是我目前存储在(nx1)数据帧中的(让我们称之为数据帧df)。然后，我想将结果存储在df的另一列中。下面是我目前编写的代码：功能： def newspaper_analysis(row): url = row article = Article(url) article.download() article.parse() text = article.text return text 将其应用于数据帧： df['text'] = d

浏览 3提问于2018-03-27得票数 0

1回答

具有相同值的多列的Groupby和sum

、、

我正在处理Pandas数据帧，有以下数据帧： data =pd.DataFrame() data['HomeTeam'] = ['A','B','C','D','E'] data['AwayTeam'] = ['E','D','A','B','C'] data['HomePoint'] = [1,3,0,1,3] data['AwayPoint'] = [1,0,3,1,0

浏览 7提问于2018-07-24得票数 0

回答已采纳

1回答

pandas dataframe数据类型比较相等

、、

如何查看pandas数据帧中哪些dtypes不相等？即找出df1.dtypes.equals(df2.dtypes)返回False的原因

浏览 12提问于2017-02-01得票数 4

回答已采纳

1回答

如何在Python/Pandas中将循环的垂直列转换为行，然后将它们堆叠在一起？

、、、、

我首先垂直生成一些数据，但希望将它们转置为行数据，然后将它们堆叠到一个类似Pandas数据帧的数组中。如何获得包含4列('fr'，'en'，'ir'，'ab')和3行的熊猫数据帧的最终结果？ # coding=utf-8 import pandas as pd from pandas import DataFrame, Series import numpy as np import nltk import re import random from random import randint import csv import

浏览 1提问于2015-10-20得票数 2

1回答

pandas:具有保留列顺序的to_csv追加模式

我正在使用： df.to_csv('file.csv', header=False, mode='a') 将多个pandas数据帧逐个写入CSV文件。我确保这些数据帧具有相同的列名集。但是，似乎列顺序将以随机顺序写入，因此我有一个chaos CSV文件。如何确保新的数据帧将按照以前数据的列顺序写入？非常感谢

浏览 21提问于2018-08-02得票数 0

3回答

Pandas Dataframe追加额外列

、、

我有一个包含以下列的pandas.DataFrame：['agent', 'agentid', 'agentname', 'agentaddress']。当我将这个数据帧与另一个具有相同基数的数据帧连接起来时，它会在末尾附加一个同名的额外列。 >>> print(df1) agent agentid agentname agentaddress 0 1 1001 test delhi >>> print(df2) agent agen

浏览 5提问于2020-03-19得票数 0

回答已采纳

1回答

无法将列关键字从mysql获取到pandas dataframe中

、、

我有一个Xampp服务器运行，我正在尝试从mysql数据库中获取一个表在一个熊猫数据帧，数据正在完美地获取，但关键字没有设置，帮助将非常感谢。 import mysql.connector import pandas as pd my_db = mysql.connector.connect( host="localhost", username="", password="", database="test", ) mycursor = my_db.cursor() mycursor.exe

浏览 13提问于2020-04-30得票数 0

回答已采纳

1回答

无法转换dataframe列数据类型

、、、、

在使用Pandas/Dask处理大数据集之后，我将结果数据帧保存到csv文件中。当我尝试使用Dask读取输出CSV时，默认情况下数据类型都是对象。每当我试图使用传统方法(例如，在读取数据时定义数据类型或阅读后重新分配数据类型)来转换它们时，我总是会遇到与转换有关的错误，如下所示： # ATTEMPT 1 import dask.dataframe as dd header = ['colA', 'colB', ...] dtypes = {'colA' : 'float', ...} df = dd.read_csv('

浏览 0提问于2018-09-19得票数 4

回答已采纳

2回答

从特定列创建数据帧

、

我正在尝试从csv文件中的AB列在Pandas中创建数据帧。(AB是第27列)。我使用的是这一行： df = pd.read_csv(filename, error_bad_lines = False, usecols = [27]) ..。这将导致以下错误： ValueError: Usecols do not match names. 我是Pandas的新手，有人能指出我做错了什么吗？

浏览 1提问于2016-09-08得票数 2

回答已采纳

2回答

为什么列名没有遍历实际的列并在dataframe中创建新列？

、、

我在pandas中将列名分配给一个数据帧，但是列名正在创建新的列，我该如何解决这个问题？现在的数据帧是什么样子的： abs_subdv_cd abs_subdv_desc 0 A0001A ASHTON ... NaN 1 A0002A J. AYERS ... NaN 2 A0003A NEWTON ALLSUP

浏览 6提问于2016-08-03得票数 1

回答已采纳

1回答

覆盖数据帧中的数据，根据最大值

、

我在Pandas数据框中存储了一组数据，其中包含部件使用位置的跟踪信息。数据看起来像这样：在上图中，我需要能够用蓝色突出显示的值覆盖以橙色突出显示的值。此覆盖需要基于be表条目号(越高越低)以及项目名称。控件是"Item“和"Project Name”。在上面的例子中，第#2、#3、#4行将被98754-48覆盖。这将基于“项目”中具有该“客户工作ID”的最大值，并且“项目名称”是相同的。这在VBA中是相当直接的，但由于涉及的卷(每天100k个条目、多达50k个部件、100台计算机和100+客户端)，这很快就会变得难以实现有没有什么快速的方法可以使用数据帧来实

浏览 8提问于2020-05-06得票数 1

回答已采纳

1回答

为什么在python中连接两个df时，使用np.hstack会丢失索引和列标题信息？

、、、

我有两个数据帧: Reprex： DF1 X Yes No Maybe DF2 Y Yes No Maybe import pandas as pd import numpy as np train = pd.DataFrame(np.hstack([DF1,DF2])) 火车 0 1 Yes Yes No No Maybe Maybe 为什么我的报头会从X和Y更改。列车df应该保留两个df的原始报头。我试着制作axis=1和headers=true，但它不起作用。pd.concat是无效的，因为我最终得到的行数比我原始df中的行数多。我也试过了 df.reset_index() 但即使

浏览 3提问于2019-11-02得票数 1

1回答

在Python Pandas中删除数据框行名称

、、

我在Pandas中有一个这样的数据帧： # https://www.datasciencemadesimple.com/reshape-long-wide-pandas-python-pivot-function/ import pandas as pd import numpy as np from platform import python_version print(python_version()) #3.7.7 #Create a DataFrame d = {'countries':['A','B','C'

浏览 75提问于2020-10-18得票数 0

3回答

Pandas CSV仅输出特定行中的数据(to_csv)

、

我只需要将pandas数据帧中的特定行输出到CSV文件。换句话说，输出只需要X行中的数据，用逗号分隔的一行中，不需要其他任何数据。我在使用to_CSV时遇到的问题是，我找不到一种只处理数据的方法；我总是收到包含列计数的额外行。 data.to_csv(filename, index=False) 给出 0,1,2,3,4,5 X,Y,Z,A,B,C 第一行只是一个列计数，是数据帧的一部分，而不是数据。我只需要数据。有没有什么方法可以简单地做到这一点，或者我是否需要跳出pandas，在python中进一步操作数据？注意:前面的示例只有1行数据，但如果也有选择行的语法就更好了。

浏览 0提问于2016-11-04得票数 3

回答已采纳

1回答

Pandas数据帧合并但创建NaN值

、、、

我有两个pandas数据帧，每个数据帧中有一列，如下所示： df1 df2 Price volume 20 200 12 50 43 10 45 5 当我尝试使用以下命令合并两个数据帧时: new_df =pd.concat(数量，价格，axis=1) Volume Price 3 20

浏览 3提问于2020-11-17得票数 0

3回答

Python Pandas -合并条件

、、、、

我在python pandas中有两个数据帧数据帧1 User_id zipcode 1 12345 2 23456 3 34567 数据帧2 ZipCodeLowerBound ZipCodeUpperBound Region 10000 19999 1 20000 29999 2 30000 39999 3 如何使用pandas merge将区域中的数据映射到条件为if(df1.zipcod

浏览 3提问于2016-10-29得票数 3

2回答

如何忽略列长度检查中的NaN

、、

我正在尝试计算数据帧中每一列的最大和最小长度，该数据帧中有一些缺失值。Pandas将这些缺失值视为"NaN“，并将长度计为3。如何在计算最大和最小长度时完全忽略缺失值？下面是我的代码： import pandas as pd columnname=[] maxColumnLenghts = [] minColumnLenghts=[] for colname in df.columns: columnname.append(colname) for col in range(len(df.columns))

浏览 51提问于2020-11-06得票数 1

回答已采纳

1回答

合并pandas数据帧上的多索引列名

、

我有一个csv文件，它的列名以不同的行分隔开，如下所示： ID,Flow,Flow ,,Type 1,21.79,1 2,1129.32,0 因此，列名是ID、Flow和FLow Type。当我将此csv作为多索引数据帧读取时： df = pandas.read_csv(path, header = [0,1]) 我最终得到了 ID Flow Unnamed: 0_level_1 Unnamed: 1_level_1 Type 1 21.79 1

浏览 4提问于2015-04-20得票数 0

1回答

Pandas数据帧在特定行上移动值

、

我目前正在开发一个糟糕的DataFrame。我循环遍历每列中的每个值，当传入某个值时，我会尝试将值向右移动。例如这是我正在处理的数据帧，对于第5列，如果传递了字符串"Pubmed reference:“，我会尝试将右侧的其余值移位一定的量。我看到有一个pandas shift函数，但它似乎是通过参数值period来移动整个列值。我想像这样改变它我能做些什么来做到这一点呢？

浏览 4提问于2020-02-11得票数 0

1回答

提取在列名或表条目中包含特定字符串的pandas数据帧

、、

我在python中有以下数据帧 dataframe_list= []## CREATE AN EMPTY LIST import pandas as pd A=pd.DataFrame() A["name"]=["A", "A", "A"] A["Query"]=["B", "B", "B"] B=pd.DataFrame() B["name"]=["A", "A", "A"] B["Co

浏览 24提问于2020-09-21得票数 1

回答已采纳

2回答

查询函数不能处理列名中的空格和圆括号

、、

我有一个列名称中包含空格和括号的数据帧，我正在尝试使用query方法来获取结果。它在处理target_names列时工作得很好，但在sepal length (cm)中出现了错误。 import pandas as pd from sklearn import datasets iris = datasets.load_iris() x = pd.DataFrame(iris['data'], columns=iris['feature_names']) y = pd.DataFrame(iris['target'], columns=[

浏览 23提问于2019-12-20得票数 0

1回答

选择多个标题会沿轴1移动值

、

我有一个excel文件，里面有一堆关于电视节目的数据。在尝试将此数据读入到pandas数据帧时，我遇到了一个问题。它目前有两个头文件，但是当我这样做的时候 data = pd.read_excel("Book2.xlsx", skiprows=[0], header=[0,1]) 数据似乎移动了1列，第一列变成了索引。所以现在所有的东西都没有原始的引用了。输入数据： Kids (10-15) Males (21-30) Females (21-30) Date Time

浏览 0提问于2019-09-16得票数 0

1回答

Pandas数据帧按索引选择行，按名称选择列

、、

有没有办法在pandas数据框中按索引(即整数)和按列名选择行？我尝试使用loc，但它返回一个错误，我知道iloc只适用于索引。这里是数据帧df的第一行。我愿意选择第一行，名为“卷”的列，并尝试使用df.loc0“卷”。 ?

浏览 12提问于2021-08-05得票数 0

1回答

尝试在DataFrame中查找空列并将其提取为Python中的列表？

、、

因此，我在我的数据帧上使用以下代码来确定哪些列具有NaN值 type(df) >>pandas.core.frame.DataFrame df.isna().any() 我得到的错误信息是 AttributeError: 'DataFrame' object has no attribute 'isna' 有什么建议吗？

浏览 15提问于2018-01-26得票数 0

回答已采纳

1回答

python pandas不能使用重复的键进行组装

、、

这段代码的目的是收集一些数据表，将它们转换为pandas数据框，删除一些不必要的列并确定日期。每个数据帧有2列，第一列在每个数据帧中被称为(‘发布日期’)，而另一列对于每个数据帧具有不同的名称。然后将这些表连接到单个统一的数据框架中，并将“发布日期”列作为索引，因此同时发生的事件必须在同一行。当我尝试这段代码时： from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from sel

浏览 0提问于2018-09-30得票数 1

3回答

索引Pandas数据帧时的KeyError

、

我正在尝试将csv文件中的数据读取到pandas数据帧中，并访问第一列'Date‘。 import pandas as pd df_ticks=pd.read_csv('values.csv', delimiter=',') print(df_ticks.columns) df_ticks['Date'] 产生以下结果 Index([u'Date', u'Open', u'High', u'Low', u'Close', u'Volume'],

浏览 0提问于2014-05-19得票数 26

回答已采纳

2回答

从dict构造数据帧并重新标记列？

、、

我试图从字典+重新标记列来构造一个数据帧，但是我得到了一个空的数据帧。请告诉我哪里做错了： import pandas as pd pd.DataFrame({'Name' : ['Ankit', 'Aishwarya', 'Shaurya', 'Shivangi'], 'Age' : [23, 21, 22, 21], 'University' : ['BHU', 'JNU', 'DU

浏览 21提问于2021-08-18得票数 0

回答已采纳