从特定列包含数字的Pandas数据帧中选择行_包含范围列的数据帧。给定数字，选择出现数字的行_从pandas数据帧中删除特定行 - 腾讯云开发者社区

python、pandas

我正在尝试导入excel并使用pandas read_excel函数创建数据帧。问题是，我只需要使用从excel开始的C到F列和第17行。如何在pandas中仅选择excel文件的那部分并将其转换为数据帧？谢谢！

浏览 0提问于2020-03-21得票数 0

2回答

Python，有没有办法把df.drop赋给一个新的变量？

python、pandas

我练习python已经有一段时间了，刚刚开始接触pandas，开始学习数据帧。我知道df.drop()会根据某些要求删除列/行，并生成一个新的df。我想知道，有没有一种方法可以将这些被删除的列/行分配给一个新的变量以用于日志记录？ import pandas as pd L = ["a","b","c","d","a","a"] df1 = pd.DataFrame(L) df1.columns = ['letter'] #print(df1) df2 = df1.drop(df1

浏览 17提问于2018-01-13得票数 2

回答已采纳

2回答

在具有特定列的python数据库中调用特定范围的行

python、pandas、indexing

我希望使用下标选项从python pandas数据帧中选择特定范围的行25:100和索引列1、3、6的特定列表。到目前为止，我使用的是以下内容 df[25:100][[1, 3, 6]]

浏览 26提问于2020-12-09得票数 1

回答已采纳

6回答

如何在Pandas中获取数据帧中的行号和列号？

python、pandas

如何使用Pandas获取包含特定值的dataframe中的行数和列数？例如，我有以下数据帧： ? 例如，我需要知道"Smith“的行和列(行1，列LastName)。

浏览 125提问于2020-12-18得票数 0

1回答

如果包含字母表(非数字)，如何从pandas数据框中删除多列？

python、pandas

我已经使用pyhive将数据从hive拉到了python中。现在，我已经从导入的数据创建了一个数据帧。数据帧中所有列的数据类型都是object。我想知道删除数据框中包含字母(非数字)的任何列的最佳方法？ Df.select_dtypes(‘dtype=object’)不起作用，因为我所有的列都是number。

浏览 11提问于2019-05-30得票数 0

回答已采纳

1回答

来自uproot的pandas数据帧中的字符串

pandas、uproot

在使用输出.root文件的Geant4进行模拟时，我很高兴地发现了uproot包。我相信数据帧是完成特定分析任务的最佳选择，所以我使用uproot.pandas.df()将TTree中的内容读取到这样的数据帧中。不幸的是，这最终成为了一个瓶颈。虽然代码可以很好地处理所有数字输入，但处理字符串似乎是一个严重的问题。该文件非常大，生成的帧有2406703行。而这段代码(Egamma和z_eu都是数字)： df = uproot.open('rootFile.root')['seco_tuple;1].pandas.df( ['Egamma','

浏览 18提问于2019-11-19得票数 1

2回答

如何处理postgresql数据库的pandas数据帧整型列中的NaNs

postgresql、pandas、null、integer、nan

我有一个包含“年份”列的熊猫数据框。但是，由于外部合并，一些行具有np.NaN值。因此，pandas中列的数据类型被转换为float64而不是integer (integer不能存储NaNs?)。接下来，我想将数据帧存储在postGreSQL数据库中。为此，我使用： df.to_sql() 一切正常，但是我的postGreSQL列现在是"double precision“类型，并且np.NaN值现在是null。这一切都是有意义的，因为输入列类型是float64而不是整数类型。我想知道是否有一种方法可以将结果存储在具有nans的整型列中。示例 Ami的回答的结果：

浏览 2提问于2018-05-18得票数 3

1回答

迭代列表以创建数据帧输出Pandas

pandas、dataframe、loops、append、iteration

亲爱的，我需要你的帮助来微调我的Python，Pandas的代码。我有一个列表: my_list = 405218,405211,309211,234589 我想迭代这个列表，使用每个元素进行细化，生成由1行25列的数据帧表示的输出。然后，我想创建一个dataframe，其中每一行代表一个输出，这样我就有了一个包含所有输出的dataframe。在本例中，由于我的列表基于4个项目，因此数据帧结果将是一个25列4行的数据帧。谢谢你的建议，

浏览 6提问于2020-09-15得票数 2

2回答

如何在一列由numpy数组组成的列上使用条件来索引数据帧？

python、pandas

我目前有一个pandas dataframe，它有一列数值是numpy数组。我正在尝试获取数据帧的行，其中列的值是一个空的numpy数组，但我不能使用pandas方法进行索引。下面是一个数据帧示例。 data = {'Name': ['A', 'B', 'C', 'D'], 'stats': [np.array([1,1,1]), np.array([]), np.array([2,2,2]), np.array([])]} df = pd.DataFrame(data) 我尝试只获取‘KeyEr

浏览 18提问于2021-08-24得票数 0

回答已采纳

2回答

从Pandas中的dataframe列中删除特定对象类型的值

pandas、dataframe、data-cleaning、drop

我有一个pandas dataframe，其中一些值是整数，另一些值是数组。我只是想在"ORIGIN_AIRPORT_ID“列中删除包含数组(我相信是对象数据类型)的所有行，但是在尝试了许多方法之后，我还没能弄清楚如何做到这一点。下面是我的数据帧的前20行的样子。像列表一样显示的值是我想要删除的值。数据集有几百万行，因此如果有意义，我只需要编写代码来删除该特定数据帧列中的所有类似数组的值。

浏览 0提问于2020-10-08得票数 0

3回答

从熊猫数据框架中选择多行，其中一个列包含一些值，如NaN

python、pandas

选择列'A‘、'B’的行，其中列'C‘的行包含python中的NaN值(Pandas) I有三列“A”、“B”、“C”的熊猫数据框架。在“C”列中有一些包含NaN值的行。现在，我想选择数据帧的列'A‘和'B’，其中'C‘列包含NaN值。如果需要选择所有列或只需要选择一个列，那么我可以在下面这样做， df['A'][df['C'].isnull()] 或 df[df['C'].isnull()] 但我不知道如何选择多个列。

浏览 6提问于2019-12-23得票数 0

回答已采纳

2回答

如何转换pandas数据框中所有列的数据类型

python、pandas

我有包含200+列的pandas数据帧。所有列都是int类型。我需要将它们转换为浮点型。我找不到做这件事的方法。我试过了 for column in X_data: X_data[column].astype('float64') 但是在for循环之后，当我打印X_data.dtypes时，所有的列都只显示为int。我也尝试过X_data = X_data.apply(pd.to_numeric)，但它没有转换为float。数据帧是从csv文件加载中构建的。

浏览 13提问于2020-03-16得票数 1

1回答

如何在熊猫切片上应用lambda函数，并返回与输入数据帧相同的格式？

python、pandas

我想应用一个函数对熊猫中每一行的数据切片进行处理，并为每一行返回一个数据片段，其中包含计算出的切片的值和数量。所以，例如 df = pandas.DataFrame(numpy.round(numpy.random.normal(size=(2, 10)),2)) f = lambda x: (x - x.mean()) 我想要的是将lambda函数f从0列应用到5列，从第5列应用到10列。 a = pandas.DataFrame(f(df.T.iloc[0:5,:]) 但这只是第一片..。如何在代码中包含第二个切片，以便我的结果输出帧看起来与输入帧完全一样--只是每个数据点被更改为其值减去

浏览 0提问于2014-11-16得票数 0

回答已采纳

1回答

基于多列条件从pandas中删除/选择行

pandas、dataframe

从pandas数据帧中，我需要根据应用于数据帧的两列的条件删除特定的行。数据帧是 0 1 2 3 0 -0.225730 -1.376075 0.187749 0.763307 1 0.031392 0.752496 -1.504769 -1.247581 2 -0.442992 -0.323782 -0.710859 -0.502574 3 -0.948055 -0.224910 -1.337001 3.328741 4 1.879985 -0.968238 1.229118 -1.044477 5 0.

浏览 13提问于2019-05-08得票数 1

回答已采纳

1回答

如何提取pandas数据框列中的数据框

python、pandas、dataframe、data-analysis、exploratory-data-analysis

从pandas数据框(3* 5)中，如何将一列(包含数据框对象的行作为值(每行数据框2* 10) )提取到单独的数据框(6* 10行) log_df['df_inside'] = log_df['input'].apply(lambda x :parser(x)) parser(x)在应用之后为每一行返回一个数据帧(2* 10)。在上述步骤之后，如何从日志条目中提取df_inside数据帧？

浏览 22提问于2021-06-22得票数 0

1回答

熊猫-只有特定的价值才能得到假人。

python、python-2.7、pandas

我有一个由10000行组成的Pandas系列，其中填充了一个字母，从A到Z。但是，我想使用Pandas get_dummies为A、B和C创建虚拟数据帧。我该怎么做？我不希望获得列中所有行值的虚拟值，然后选择特定的列，因为该列包含其他冗余数据，这些数据最终会导致内存错误。

浏览 2提问于2015-11-03得票数 8

回答已采纳

3回答

如何在Pandas数据帧中找到最大值的行和列的索引？

python、pandas、dataframe

我有一个很大的Pandas数据帧，我想找出最大值所在的列和行(在整个数据帧中)。不幸的是，df.idxmax()只返回每行/列的最高值的索引，而不是整个数据帧的索引。有没有办法做到这一点？

浏览 136提问于2021-07-28得票数 2

回答已采纳

2回答

使用read_excel读取所选数据

python、pandas、dataframe

我有一个excel文件，我想用read_excel从其中读取以下信息：列C作为索引，列D到AH和行5:15、18:21、24:75、78:80、84:92、94:95作为数据帧将包含的数据，第1行作为数据帧的列的名称。 1)如何只读特定的行？ 2)尽管我写了use_cols =“D: AH”，但它仍然读取所有列，甚至AH之后的列 3)当我设置use_col = 2以获取列C作为索引时，我得到错误“pandas.errors.ParserError:预期第2行有50个字段，看到52” 以下是我尝试过的方法： Timetable = pd.read_excel(filename, sh

浏览 0提问于2019-02-21得票数 0

1回答

使用一行访问Pandas数据帧中的数据

python、python-3.x、pandas、dataframe

我使用Pandas dataframes来操作数据，我通常将它们可视化为虚拟电子表格，由行和列定义单个单元格的位置。我对分割数据帧的方法很满意，但当数据帧只包含一行时，似乎有一些奇怪的行为。基本上，我希望从满足特定条件的大型父数据帧中选择数据行，然后将这些结果作为子数据帧传递给单独的函数进行进一步处理。有时，父数据帧中只有一条满足定义的标准的记录，因此，子数据帧将只包含一行。尽管如此，我仍然需要能够以与父数据库相同的方式访问子数据库中的数据。为了说明这一点，请考虑以下数据帧： import pandas as pd tempDF = pd.DataFrame({'group':

浏览 2提问于2016-04-23得票数 2

回答已采纳

1回答

通过将一列除以另一列来创建新列会冻结系统

pandas

我的系统冻结，风扇运行非常快，每次我创建一个新的Pandas列，通过划分一列与另一列。我也排除了包含0的行，但它总是冻结。数据帧有60077行，它在较少的行数上工作得很好。系统为i7和8 8GB 我在新专栏中使用了以下代码： df['C'] = df['A'] / df['B']

浏览 4提问于2019-05-02得票数 0

回答已采纳

2回答

列子集和过滤器Pandas

python、pandas

如何在一个命令中过滤Pandas数据帧中的行并仅获取pandas数据帧中的列的子集。我正在试着应用像这样的东西... frame[(frame.DESIGN_VALUE > 20) & (frame['mycol3','mycol6']))] 谢谢。

浏览 0提问于2015-10-02得票数 17

回答已采纳

1回答

为什么Pandas/Numpy会自动将9999999999四舍五入到1.000000e+10？

python、pandas、numpy、python-3.6

我有一个4行的Pandas数据帧，其中一列(名为limit)包含浮点值，其中任何0都必须替换为9999999999 (99999999999万)。该列被设置为float32数据类型，我使用pandas.DataFrame.where方法进行替换。但它并没有像预期的那样工作，因为Numpy的四舍五入是9999999999到10000000000 (100亿)。我在Panda3(Python3.6.8)，iPython版本0.24.2，Numpy版本1.14.0中尝试过。这是替换语句 df['limit'] = df['limit'].where(df[

浏览 35提问于2019-04-24得票数 2

回答已采纳

1回答

Pandas的`read_sql`在从包含带小数点的数字列的Oracle表读取数据时创建整数列

python、pandas、oracle、read-sql

我有一个Oracle表，其中包含类型为VARCHAR2 (即字符串)和类型为NUMBER (即带有小数部分的数值)的列。并且数值列实际上包含带有小数点的值，而不是整数值。但是，当我通过pandas.read_sql将这个表读入Pandas数据帧时，我收到的数据帧中的数字列是int64。如何避免这种情况，并接收包含完整十进制值的float列？我正在使用以下版本 python : 3.7.4.final.0 pandas : 1.0.3 Oracle : 18c Enterprise Edition / Version 18.9.0.

浏览 3提问于2020-05-28得票数 2

2回答

` pandas.core.series.Series`中的X返回True，即使其中没有这样的值

python、pandas

我有一个包含多个ID的pandas系列对象。我想通过检查它们的ID是否出现在我的pandas系列对象中来过滤掉其他数据帧的行： DATA['y'] = DATA['ID'].apply(lambda x: 1 if x in IDs else 0) 我注意到数据中的ID 279779在列'y‘中有'1’，尽管该ID不存在于我的ID系列对象中。我运行了以下代码行：279779 in IDs，它返回True，但以下代码没有打印任何内容： for id in IDs: if id == 279779: print('fo

浏览 0提问于2020-01-13得票数 0

1回答

是无效的密钥Pandas Python

python、pandas、dataframe

我在Pandas中有一个729278行190列的数据帧： df1： +----------+----------+----------+---+---+-----+---------+ | RULE_1_2 | RULE_2_2 | RULE_3_2 | … | … | smt | default | +----------+----------+----------+---+---+-----+---------+ | 0 | 0 | 0 | … | … | 2 | 0 | | 0 | 2 | 3

浏览 17提问于2020-04-30得票数 3

回答已采纳

1回答

根据一个csv列的值提取另一个csv列中的值

python、pandas、csv、dataframe

我有一个要从中提取数据的.csv文件。这个文件有四列，['time', 'apple', 'banana', 'orange']。这些列中的每列都有100行。我希望从香蕉列中提取数据，并将其插入到dataframe中，前提是时间列中的值不为零。注意:在time，t之后，time列中的值返回到零，我不希望提取这些行。我想提取time列，并将其用作我的dataframe中的列名，然后将香蕉值作为我的dataframe中的一行。我希望将其放入数据帧的原因是，我有几个.csv文件要从中提取数据。我已经有了一个数据帧，其中包含一个列

浏览 35提问于2019-09-30得票数 1

回答已采纳

1回答

Python Pandas DataFrame数据标识

python、excel、csv、pandas

我从.xlsx文件中提取数据并将其存储在数据帧中。数据帧称为df，数据帧的大小为(51,3)。51行。3列。列是未命名的，编号为0、1、2。行的索引从0到50。在python中，我将使用什么语法从带有pandas的数据帧中提取数据并将其放入csv？我知道我会使用DataFrame.to_csv("outputFile.csv" )，但是我不确定如何识别特定的数据(行/列对)，所以我可以将它放在csv表中的新位置，而不是旧的excel表。

浏览 1提问于2016-03-09得票数 0

2回答

将根据给定需求选择的某些行放入另一个数据帧中

python-3.x、pandas

我已经使用Pandas将csv文件读取到数据帧中，csv格式如下。我想把“时间列信息”在6/3/2011-10/20/2011间隔之间的行放到另一个数据帧中。我怎样才能在Pandas中高效地做到这一点？

浏览 4提问于2018-08-10得票数 0

2回答

如何在不先转换为numpy的情况下将一个数据帧划分为另一个数据帧？

python、pandas、numpy

我有一个包含两列x和y和几百行的dataframe。我有另一个只有一行和两列的数据帧，x和y。我想将大数据帧的x列除以小数据帧的x中的值，并将y列除以y列。如果我将一个数据帧除以另一个数据帧，我将得到所有的NaNs。为了让分区正常工作，我必须将小数据帧转换为numpy。为什么我不能将一个数据帧除以另一个数据帧？我遗漏了什么？下面我有一个玩具示例。 import numpy as np import pandas as pd df = pd.DataFrame() r = int(10) df['x'] = np.arange(0,r) df['y'] =

浏览 4提问于2020-02-11得票数 1

1回答

使用连接字符串过滤pandas数据帧中的行

python、pandas

我有一个pandas数据帧和一个pandas系列标识符，并希望从数据帧中过滤与该系列中的标识符相对应的行。要从dataframe中获取标识符，我需要连接它的前两列。我已经尝试了各种方法来过滤，但到目前为止似乎都不起作用。以下是我尝试过的方法： 1)我尝试向数据帧添加一列布尔值，如果该行对应于其中一个标识符，则为true，否则为false (希望能够在以后使用新列进行过滤)： df["isInAcids"] = (df["AcNo"] + df["Sortcode"]) in acids 哪里 acids 是包含标识符的序列。然而，这给了我一个

浏览 3提问于2013-07-11得票数 1

1回答

在pyspark 2.4.0中使用sampleBy的样本大小

python、dataframe、apache-spark、pyspark、sample

我在pyspark 2.4.0中有一个dataframe df，我想使用sampleBy获取它的样本。它包含一个列category，我有一个这样的dict作为示例： dict = { "cat_A" : 0.1, "cat_B" : 0.5, "cat_C" : 0.4 } 我希望我的样本有5000行，如果我像这样使用函数sampleBy：df_sampled = df.sampleBy(col = 'category', fractions = fraction, seed = 1)，得到的数据帧具有每个类别的正确比例，但似

浏览 198提问于2021-01-08得票数 1

1回答

在pandas中将多行合并为一个包含附加列的行

python、pandas

假设我有下面的数据帧： import pandas as pd rankings = {'Team': ['A', 'A', 'B', 'B', 'C', 'C', 'C'], 'Description': ['Aggressive', 'Strong', 'Passive',

浏览 16提问于2021-05-25得票数 1

3回答

如何使用for循环从dataframe中删除许多行，这些循环遍历需要删除的值？

python、pandas、loops、dataframe

我正在尝试通过它的名称删除超过数百万行，这是超过1000个唯一值。有一个主数据帧(df_summary)和另一个数据帧，其中包含必须从主数据帧中删除的行的名称。删除一些列不是问题，但是需要删除的唯一值的数量太多了，无法手动执行。因此，我尝试遍历它。 “两个数据帧的整体外观，列后面有许多列” 以下是我尝试过的方法： from pandas import read_csv import pandas as pd df_summary = read_csv ('path.csv', sep=',') rows_to_remove = read_csv ('

浏览 28提问于2019-10-25得票数 0

回答已采纳

1回答

如何将多个报头加载到Pandas数据帧中

python、excel、pandas

好了，谢谢你在我的问题上花时间！我正在使用Python3.7+ pandas将包含多列的.xlsx文件加载到一个数据帧中。我的输入是：。所需的输出(仅第一行的示例)： import pandas as pd df = pd.read_excel('file.xlsx', header=[2,3,4]) print(df.columns) 当主级标头被合并时，它返回‘unname1’，‘unname2’等。如果能帮上忙我会很感激的。祝你有愉快的一天！

浏览 2提问于2019-08-28得票数 0

1回答

删除包含NaN的Pandas数据帧的前导行

python、pandas、dataframe、nan

在清理时间序列的Pandas Dataframe之前，我想删除顶部某些列中包含NaN的行。我想遍历数据帧的开头，删除满足条件where column为NaN的行。我下面的数据框叫做“列车”，包含两列-“日期”和“最高温度(摄氏度)”。我将日期设置为索引。最初的20个奇数行包含‘最高温度(摄氏度)’中的NaN。 #Drop NaN values at start of dataframe for date,row in train.iterrows(): print(date) if train.loc[date,'Maximum temperature (Degree C)

浏览 0提问于2019-08-31得票数 0

2回答

将csv读入pandas数据帧，但避免NaN行

python-3.x、pandas、csv

我有一个csv文件，其中有73行数据和16列，我想读取它并将其传递给pandas数据帧，但当我这样做时 data_dataframe = pd.read_csv(csv_file, sep = ',') 我得到了3152行和22列，73行和16列的数据，其余的只有纯NaN值。如何告诉pandas读取有效的行和列数据，并避免所有这些额外的NaN数据？

浏览 43提问于2021-11-16得票数 0

回答已采纳

1回答

选择性读取包含混合类型列的pandas数据帧

python、python-2.7、pandas、hdf5、hdf

我有pandas表，其中的列包含有数千行的可变长度列表，例如， import pandas as pd df = pd.DataFrame({0: [[1, 2], [3, 4, 5], [7], [8, 9, 10, 11]]}, ) ###Output: df 0 0 [1, 2] 1 [3, 4, 5] 2 [7] 3 [8, 9, 10, 11] 我可以使用以下命令将文件存储在驱动器中 with pd.HDFStore('out_file', mode='w')

浏览 0提问于2018-08-28得票数 0

3回答

如何创建一个用随机字符串填充列的pandas数据帧？

python、pandas

我想创建一个包含2列x行的Pandas数据帧，其中包含随机字符串。我找到了生成带有随机int和随机字符串生成器的pandas数据帧的代码。我仍然没有看到一条清晰的路径来创建一个带有随机字符串的pandas数据框架。用于随机int数据帧的代码 import numpy as np import pandas as pd df = pd.DataFrame(np.random.randint(0,100,size=(100, 4)), columns=list('ABCD')) 随机字符串的代码 import string import random def id_gener

浏览 60提问于2019-06-01得票数 4

回答已采纳

1回答

pandas :在dataframe中索引数千行

pandas、dataframe、indexing

最初，我的数据集中有100k行。我使用pandas将csv读取到一个名为data的数据帧中。我尝试使用.loc进行51行的子集选择。我的索引标签是数值0，1，2，3等等。我试着使用这个命令- data = data.loc['0':'50']，但结果很奇怪，它从0到49999的所有行，看起来像是在取行，直到索引值从50开始。类似地，我尝试使用这个命令- new_data = data.loc['0':'19']，结果是从0到18999的所有行。这会不会是熊猫身上的一个虫子？

浏览 2提问于2018-09-20得票数 0

2回答

Pandas -将CSV读入dataframe，其中一列具有不同数量的子列

python、pandas、dataframe

在Pandas中，有没有可能有一个包含不同数量子列的列的数据帧？例如，假设我有以下CSV文件： transactionId, userName, date, itemList, totalCost 其中itemList包含可变数量的itemId;itemPrice对，这些对由管道(|)分隔。列表中的itemId;itemPrice对数量没有上限。 itemId ; itemPrice | itemId ; itemPrice 以下是行的一些示例： transactionId, userName, date, itemList, totalCost 123

浏览 1提问于2017-08-01得票数 2

11回答

如何在pandas中获取数据帧的列切片

python、pandas、numpy、dataframe、slice

我从CSV文件加载一些机器学习数据。前2列是观测值，其余列是特征。目前，我做了以下工作： data = pandas.read_csv('mydata.csv') 这给出了一些类似的东西： data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 我想将这个数据帧分成两个数据帧:一个包含列a和b，另一个包含列c、d和e。不可能写出像这样的东西 observations = data[:'c'] features = data['c':] 我不确

浏览 4提问于2012-05-19得票数 304

回答已采纳

2回答

从pandas dataframe中删除句子长度超过特定词长的行

python、string、pandas、split

我想从pandas dataframe中删除行，该数据帧包含长度大于所需长度的特定列中的字符串。例如：输入帧： X Y 0 Hi how are you. 1 An apple 2 glass of water 3 I like to watch movie 现在，假设我想从dataframe中删除包含长度大于或等于4的单词字符串的行。所需的输出帧必须为： X Y 1 An apple 2 glass of water 当列0中的字数为4和列3中的字数分别为5时，删除列'X‘中值为0、3的行。

浏览 144提问于2019-06-12得票数 9

回答已采纳

2回答

拆分行并创建新列

python-3.x、pandas、dataframe

如果之前有人问过这个问题，我深表歉意。我有一个包含2447660行的pandas数据帧。我希望将行拆分为1564，并创建新的1564列。例如，假设我在一个数据帧中有10行，如下所示： Col 0 1.860 1 -2.834 2 -2.518 3 -3.591 4 0.919 5 0.985 6 -2.465 7 0.942 8 0.945 9 -2.589 我想把它一分为二，然后创建5个新列(列名并不重要)

浏览 17提问于2020-09-23得票数 1

回答已采纳

1回答

从多个pandas数据框列绘制图形

python、pandas、plot

我有一个包含许多列(150)的Pandas数据框，其中140列(第10列到第150列)表示一段时间(通过140天)的天气度值。每列表示不同日期的学位。对于我的数据框中的两行(每行代表一个不同的城市)，我希望绘制所有气象点的趋势，从第一列(第10列)到最后一列(第150列)。我不能设法做到这一点，因为它是数据帧。我应该先创建一个透视表吗？一份清单？你知道如何以一种有效的方式来处理它吗？谢谢

浏览 2提问于2019-04-23得票数 1

3回答

比较pandas数据帧的行(行有一些重叠值)

python、pandas、dataframe

我有一个包含21列的pandas数据框架。我将重点放在具有完全相同的列数据值的行子集上，除了每行唯一的6个之外。我不知道这6个值对应的是先验的列标题。我尝试将每一行转换为Index对象，并对两行执行set操作。例如。 row1 = pd.Index(sample_data[0]) row2 = pd.Index(sample_data[1]) row1 - row2 它返回一个索引对象，其中包含row1独有的值。然后，我可以手动推断哪些列具有唯一值。如何以编程方式获取这些值在初始数据帧中对应的列标题？或者，有没有办法比较两个或多个数据帧行，并提取每行的6个不同的列值，以及相应的标题？理想

浏览 4提问于2013-05-14得票数 8

1回答

使用非连续行号的子集数据

r、dataframe

我有一个30行100列(X)的数据框。我想用较大的数据框中的特定行创建一个新的数据框(Y)。例如，我希望数据帧(Y)包含行1到5、10到14和20。我知道我可以使用下面的代码： Y<-X[1:5,] 并获得前5行，但我无法计算出类似的代码来获得1:5、10:14和20行。

浏览 0提问于2011-11-30得票数 10

回答已采纳

1回答

在Pandas和Rpy2中使用时区处理时间戳

python、pandas、rpy2

我正在尝试理解如何将包含时间戳的行添加到具有数据类型为datetime64ns的列的Pandas数据帧中。不幸的是，当我添加一行时，列数据类型更改为object，这最终中断了通过Rpy2到R数据框的转换。下面是我发现问题的几行有趣的代码，其中包含debug输出的语句，我也将分享这些语句的输出。变量observation是一个简单的python列表，它的第一个值是一个时间戳。代码： print('A: df.dtypes[0] = {}'.format(str(df.dtypes[0]))) print('observation[0].type = {}, observ

浏览 8提问于2020-05-19得票数 1

3回答

一种高效串联熊猫DataFrames的方法

python、numpy

我有10个DataFrames，它们的行数相等，每个数据帧都有自己的一组唯一列(没有在任何数据帧之间共享)。我想简单地将数据帧串行地添加在一起，这样最终的数据帧就包含了所有数据帧中包含的所有列。最终数据帧的第一行将包含第一个数据帧的第一行，然后是第二个数据帧的第一行，依此类推，直到第十个数据帧。我尝试过pandas.concat(dataframes，axis=1)，但它最终以某种方式在我的数值数据中创建了NaN值。我通过编写一个极其缓慢而丑陋的方法来解决这个问题，该方法按索引递增各行，并逐行创建最终的数据帧。熊猫做这件事的正确方式是什么？

浏览 0提问于2017-08-07得票数 0

回答已采纳

2回答

pandas中有多少列，python？

python、pandas

有没有人知道pandas，python中的所有列？我刚刚为pandas创建了一个包含超过20,000列的数据帧，但我得到了内存错误。非常感谢

浏览 5提问于2013-10-07得票数 1

2回答

如何在不占用RAM的情况下创建额外的列，然后将其用于ML算法？

python、pandas、machine-learning、dask、ram

我有一个包含3m+ (有序)行和100列的数据集，我可以使用Pandas将其加载到我的笔记本中。我想追加大约900列，这些列是使用100个现有的列计算得出的。最终目标是训练几个机器学习模型(NN，随机森林)。当我尝试使用Pandas添加列时，由于RAM不足(我有25 to )，我的机器崩溃了。因此，我尝试使用Dask，它允许我毫无问题地计算900列。然而，Dask数据帧不能用作随机森林(Sklearn)和Keras模型的输入，所以我猜在某些时候您必须将其转换回pandas数据帧。在这一点上我被卡住了。速度是相当重要的，因为我需要经常改装模型。有没有人有好的建议？

浏览 18提问于2021-05-22得票数 1