对分组的pandas数据帧中的行求和并返回NaN_pandas数据帧中特定行对之间的求和时间增量_对pandas数据帧的时间差进行分组和求和 - 腾讯云开发者社区

python、pandas

我有一些用以下代码生成的数据帧： from collections import defaultdict import pandas as pd mydict = { ('x305', 'BoxType1-1'): { 'box': 'x305', 'box#': '0', 'boxCode': 'Z8', 'version': '00.00' }, ('x305', 'BoxType1-

浏览 3提问于2018-01-23得票数 0

回答已采纳

1回答

在pandas中使用另一个数据帧快速切片数据帧

python、pandas、dataframe

浏览 2提问于2016-07-16得票数 2

1回答

如何根据groupby对dataframe中的行值进行求和？

python、pandas

我有一个使用案例，我得到了更大的csv文件，需要在三列标签上执行groupby，并且需要对特定列的匹配行值求和，如果它是一个整数，如果它是一个应该替换为“NA”的字符串，我尝试使用pandas来继续，不确定这是否需要在内存中执行任何操作。 Import pandas as pd df = pd.read_csv(“input.csv") data = df.groupby([‘X’,’Y’,’Z’])[‘ADJ’].sum() print(data) input.csv.. ? Output.csv(数据帧) ?

浏览 44提问于2020-04-29得票数 0

回答已采纳

1回答

如何将dataframe中的每一行乘以不同dataframe的不同列，并将所有行的总和作为Python中的新列？

python、pandas、dataframe

我正在尝试将一个数据帧的每一行乘以另一个数据帧中某列的值，例如，如果我有以下数据帧： df = pd.DataFrame({ 'FR': [4.0405, 4.0963, 4.3149], 'GR': [1.7246, 1.7482, 1.8519], 'IT': [804.74, 810.01, 860.13], 'F': [8.4, 10.01, 60.3]}, index=['1980-01-01', '1980-02-01', '

浏览 91提问于2021-10-10得票数 0

回答已采纳

2回答

基于另一列的pandas中类别的缺失值的补偿

python、pandas、fillna

如何在pandas数据帧中填充NaN值？我的数据是这样的 id state zone xxx AP south xxx AP xxx AP xxx AP xxx delhi north xxx delhi xxx delhi xxx delhi xxx delhi 基于已知zone只属于state的AP列，如何在south列中填充缺失的值，如何使用pandas来填充值？

浏览 4提问于2020-01-21得票数 0

1回答

提高非常大的数据帧上的迭代性能

python、pandas、dataframe、iteration、list-comprehension

我有一个pandas数据帧，它由300万行和50列组成，所有列都包含整数(正数或负数)。我想创建一个名为'feature‘的新列，它从现有的50列中提取最大的负数。例如，如果对于给定行，50列包含以下值 -25,-24,-23,...,-1,1,...,23,24,25 “feature”列应返回-1。因为我的数据帧太大了，所以我尝试的解决方案花费的时间太长了。例如，我尝试过使用列表理解，但是因为我求助于iterrows()，所以它太慢了(itertuples()的性能并没有明显的提高)： import numpy as np import pandas as pd from tq

浏览 3提问于2019-07-17得票数 1

回答已采纳

3回答

以累积方式合并具有相同索引的行

python、pandas、numpy、csv

在python pandas中，我有一个数据帧，看起来像这样： > df count date 2021-04-03 23.0 2021-04-04 12.0 2021-04-04 10.0 2021-04-05 42.0 2021-04-06 39.0 ... 有些日期是重复的，具有不同的计数值。我想将这些值合并到一行中，如下所示： > df count date 2021-04-03 23.0 2021-04-04 22.0 2021-04

浏览 20提问于2021-05-06得票数 0

回答已采纳

1回答

在pandas中对多索引数据帧使用滚动函数

python、pandas、dataframe

我在pandas中有一个多索引数据帧，其中index是ID和时间戳。我希望能够计算每个ID的时间序列滚动和，但我似乎不知道如何在没有循环的情况下做到这一点。 content = io.BytesIO("""\ IDs timestamp value 0 2010-10-30 1 0 2010-11-30 2 0 2011-11-30 3 1 2000-01-01 300 1 2007-01-01 33 1 2010-01-01 400 2

浏览 0提问于2013-10-05得票数 10

回答已采纳

1回答

如果给定列的连续nan数达到阈值N，是否找到pandas数据帧中NAN值的第一行和最后一行索引？

python-3.x、pandas、numpy

有一个80行6列的pandas数据帧。某些列中包含NaN值。比方说，如果给定列中连续的nan值的数量超过10，那么我们必须对这些nan块的值做一些处理。因此，我的问题是如何提取与这些大块nans的开始和结束相对应的行索引？

浏览 12提问于2021-10-07得票数 1

回答已采纳

1回答

创建新的Pandas分组对象

python、numpy、pandas

在某些转换中，我似乎被迫脱离Pandas dataframe分组对象，而我想要一种返回到该对象的方法。给定一个时间序列数据帧，如果按数据帧中的一个值分组，我们将获得一个从键到数据帧的底层字典。因为结构是dataframe的关键，所以不能使用.from_dict()将该结构转换回Dataframe。据我所知，返回Pandas而不进行一些繁琐的列重命名的唯一方法是将其转换回一个分组的对象。有没有办法做到这一点？如果没有，我如何将实例字典转换回数据帧，再转换回Pandas数据结构？编辑添加样本：： rng = pd.date_range('1/1/2000', periods=

浏览 0提问于2014-05-06得票数 0

2回答

以自定义格式将Pandas Dataframe导出为CSV

python、pandas

我有一个csv，我需要导入到熊猫数据帧中。然后，我需要将该pandas数据帧导出回与我导入的csv完全相同的csv (输入文件和输出文件必须完全匹配)。我遇到的问题是csv的格式非常奇怪，我无法更改这种格式(这是挑战的一部分)。csv的一些行具有不同数量的元素，并且一些行以2个分号、一个分号或没有分号结束。 input.csv scene;1 date;08.04.2019;; sky;AM;45; sky;PM;45; weight;upper;-5 到目前为止，我已经完成了最简单的部分-我已经使用以下代码将csv导入到pandas数据帧中： def csv_read(path):

浏览 49提问于2019-02-20得票数 0

回答已采纳

3回答

将python迭代器输出转换为pandas数据帧的最快方法

python、pandas

我有一个生成器，它返回未知数量的数据行，我希望将这些数据转换为索引的pandas数据帧。据我所知，最快的方法是将CSV写入磁盘，然后通过'read_csv‘解析回来。我知道创建一个空的dataframe，然后不断地追加新的行是没有效率的。我不能创建预置大小的dataframe，因为我不知道将返回多少行。有没有一种方法可以将迭代器输出转换为pandas数据帧而不写入磁盘？

浏览 1提问于2017-03-24得票数 12

2回答

比较数据帧中的每个值、列和行

python、pandas、dataframe

我有两个不同大小的数据帧，我想对四个不同列中的所有值进行比较(两组两个) 本质上，我希望看到df1'A‘== df2'A’& where df1'B‘== df2'B’并返回df1‘C’的值加上df2‘C’的值 import pandas as pd df1 = pd.DataFrame({"A": [1, 2, 3, 4, 3], "B": [2, 5, 4, 7, 5], "C": [1, 2, 8, 0, 0]}) df2 = pd.DataFrame({"A": [1, 3, 2,

浏览 0提问于2016-03-29得票数 1

1回答

NaT上的groupby优先与groupby中的NaN不同

pandas

我有一个数据帧，我想首先使用groupby方法来收集每列的第一个时间戳。 import pandas as pd from pandas import DataFrame import datetime as dt ts1 = dt.datetime.now() ts2 = dt.datetime.now() ts3 = dt.datetime.now() DFdate=DataFrame([{'timestamp1':ts1,'ID':'A'},{'timestamp2':ts2,'ID':'A

浏览 0提问于2015-07-13得票数 2

1回答

在pandas数据框中，只用数据填充选定的列，并用NaN值追加剩余的列

python、pandas、dataframe

import pandas as pd sample_dataframe = pd.DataFrame(columns = [column_1, column_2, column_3, column_4] ) sample_data = [(78, 89), (77, 45), (54, 90)] 我希望在sample_dataframe中插入sample_data，这样column_1和column_2将使用数据中的值进行填充，其余列将使用所有行的NaN值进行填充。在数据帧创建期间，我无法将数据添加到数据帧中。在定义数据帧的结构后，需要稍后添加数据。做这件事最简单的方法是什么？这

浏览 18提问于2020-09-07得票数 0

回答已采纳

1回答

在pandas中重塑表格

python、arrays、pandas、dataframe

下面是我在合并多个查询日志数据帧时创建的数据帧的摘录： keyword hits date average time 1 the cat sat on 10 10-Jan 10 2 who is the sea 5 10-Jan 1.2 3 under the earth 30 1-Dec

浏览 0提问于2013-05-23得票数 0

回答已采纳

1回答

如何将dataframe列值传递给我的自定义函数以存储总金额？

python、function、dataframe

我有一个python脚本，组织有关NHL球员的网站数据。这些值被放入一个数据帧中。我还建立了一个函数，它接受球员的名字和球队名称，以获得球员的总工资排成一列。我希望将球员的名字(F1，F2，F3)从数据帧传递给函数( names )，并将结果存储在我的excel工作表(totalSalary)中。我尝试过将iloc函数传递给函数，但我感到困惑。 from bs4 import BeautifulSoup import requests import pandas as pd import colorama import crayons import datetime import xlsx

浏览 10提问于2019-02-03得票数 0

1回答

设置Pandas Dataframe值

python、pandas、dataframe

我正在尝试遍历pandas数据帧，每次出现特定字符串时，它都会将同一行上的单元格的值设置为特定文本前一行的单元格的值。我附上了一个视觉解释，我正在尝试做什么，如果这是没有意义的。代码： for index, row in df.iterrows(): if row[3] == 'National Account Job Coordinator': row[1] = df.iloc[index-1, 3] else: continue 代码将打印出正确的值，但不会设置数据帧值...有什么想法吗？谢谢

浏览 27提问于2018-01-24得票数 0

回答已采纳

1回答

将Pandas groupby组转换为列

python、pandas、dataframe

我尝试按两个单独的组类型A_Bucket和B_Bucket对一个A_Bucket数据帧进行分组，并将每个Pandas组转换为一个列。我得到了这样的组： grouped = my_new_df.groupby(['A_Bucket','B_Bucket']) 我希望A_Bucket组在列中，B_Bucket组作为索引。'A‘大约有20个值，B大约有20个值，所以总共有大约400个组。当我打印grouped及其类型时，我得到： type of grouped2 = <class 'pandas.core.groupby.DataFrameGr

浏览 5提问于2016-09-05得票数 12

回答已采纳

2回答

在python中使用Pandas merge后如何查找丢失的数据？

python、pandas

我的数据帧如下所示:我正在使用Pandas合并函数来合并两个数据帧，并且我正在尝试查找被丢弃的行。有没有办法在Pandas或python中跟踪它？ df1=pd.DataFrame(({'Name':('A','B','C'),'Age':(34,23,90)})) df2=pd.DataFrame(({'Name':('A','B','D'),'Add':('rt','ct','pt'

浏览 35提问于2019-01-26得票数 4

回答已采纳

3回答

筛选出超过一定数量的NaN的行

python、pandas、dataframe、filter

在Pandas数据帧中，我想过滤掉所有超过2个NaN的行。本质上，我有4列，我只想保留那些至少有2列有限定值的行。有人能建议一下如何实现这一点吗？

浏览 10提问于2014-04-22得票数 9

回答已采纳

1回答

pandas:具有保留列顺序的to_csv追加模式

pandas

我正在使用： df.to_csv('file.csv', header=False, mode='a') 将多个pandas数据帧逐个写入CSV文件。我确保这些数据帧具有相同的列名集。但是，似乎列顺序将以随机顺序写入，因此我有一个chaos CSV文件。如何确保新的数据帧将按照以前数据的列顺序写入？非常感谢

浏览 21提问于2018-08-02得票数 0

2回答

忽略NaNs的两个DataFrames的元素最大值

python-3.x、math、pandas、dataframe

我有两个数据帧(df1和df2)，每个数据帧都有相同的行和列。我想逐个元素地获取这两个数据帧中的最大值。此外，任何具有数字和NaN的逐个元素最大值的结果都应该是数字。到目前为止，我实现的方法似乎效率很低： def element_max(df1,df2): import pandas as pd cond = df1 >= df2 res = pd.DataFrame(index=df1.index, columns=df1.columns) res[(df1==df1)&(df2==df2)&(cond)] = df1[(df1==df

浏览 0提问于2015-10-08得票数 14

回答已采纳

2回答

当存在多个空值时，用熊猫数据帧丢弃行

python、pandas、dataframe

我试图遍历数据帧中的每一行，并检查选定的行是否有3个以上的空值(此部分有效)，然后删除整个行。但是，在尝试从数据帧中删除上述行时，我遇到了一个错误： AttributeError：'NoneType‘对象没有属性'index' 如果这段代码效率低下，请原谅我，我只需要它来工作。 import pandas as pd df = pd.read_csv('data/mycsv.csv') i = 0 while i < len(df.index): if df.iloc[i].isnull().sum() > 3:

浏览 0提问于2021-11-23得票数 0

3回答

Pandas:在组中将值向下移动一行

python、pandas、dataframe

我有一个Pandas数据帧，我想创建一个新列，它的值是另一列的值，向下移位一行。最后一行应该显示NaN。问题是我想按组执行此操作，每个组的最后一行显示NaN。不要让组的最后一行从数据帧中碰巧相邻的组中“窃取”一个值。我尝试的实现相当可耻地崩溃了，所以我显然误解了一些基本的东西。 df['B_shifted'] = df.groupby(['A'])['B'].transform(lambda x:x.values[1:])

浏览 1提问于2014-10-09得票数 44

回答已采纳

3回答

熊猫根据另外两个“子”框架创建数据框架

python、python-3.x、pandas、dataframe

我有两个Pandas数据帧。df1有'a'，'b'，'c'，df2有'a'，'c‘，'d’列。现在，我创建了一个新的数据框架df3，列'a'，b'，'c'，'d‘。我想用来自df3和df2的所有输入来填充df1。例如，如果df1中有x行，df2中有y行，那么在df3中将有x+y行。哪个Pandas函数填充了基于部分列的新数据？

浏览 0提问于2018-12-27得票数 0

回答已采纳

3回答

Python Pandas每隔2行连接到上一行

python、pandas、dataframe、concatenation、row

我有一个类似于这个的Pandas数据帧： age name sex 0 30 jon male 1 blue php null 2 18 jane female 3 orange c++ null 我正在尝试将每隔一行连接到前一行，添加额外的列： age name sex colour language other 0 30 jon male blue php null 1 18 jane female oran

浏览 0提问于2021-06-25得票数 1

2回答

将Pandas DataFrame中的行追加到新DataFrame

python、pandas、dataframe

我有一个Pandas数据帧，它的前6行如下所示： Timestamp u1 u2 u3 0 0 0.00000 23.02712 30.46594 1 2 0.00000 22.31358 30.10915 2 4 0.00000

浏览 1提问于2014-09-30得票数 1

1回答

pandas重新定义isnull以忽略'NA‘

python、pandas

作为数据分析练习的一部分，我正在将excel表格读取到pandas数据帧中。 df = pd.ExcelFile('file.xlsx').parse(0) nullcounts = df.isnull().sum().to_frame('null_records') 为我的dataframe中的每个序列生成一个计数为null的漂亮帧。但是如果字符串'NA‘出现在一行数据中，我不希望isnull操作返回True。有没有一种简单的方法可以做到这一点，而不需要为特定的列/数据帧硬编码规则？编辑:我的源数据中的NAs在读入pandas时似乎被忽略了，因为当

浏览 14提问于2017-02-02得票数 2

回答已采纳

2回答

Pandas bin and count

python、pandas、count、histogram、bin

我是Pandas的新手，请不要太苛刻;)让我们假设我的初始数据帧是这样的： #::: initialize dictionary np.random.seed(0) d = {} d['size'] = 2 * np.random.randn(100) + 3 d['flag_A'] = np.random.randint(0,2,100).astype(bool) d['flag_B'] = np.random.randint(0,2,100).astype(bool) d['flag_C'] = np.random.randi

浏览 10提问于2016-08-18得票数 1

回答已采纳

14回答

将Pandas或Numpy Nan替换为None以与MysqlDB一起使用

python、pandas、numpy、mysql-python

我正在尝试使用MysqlDB向mysql数据库中写入一个Pandas数据帧(或者可以使用numpy数组)。MysqlDB似乎不理解' nan‘，我的数据库抛出一个错误，说nan不在字段列表中。我需要找到一种方法将'nan‘转换为NoneType。有什么想法吗？

浏览 1提问于2013-01-05得票数 206

回答已采纳

2回答

检查另一排熊猫有哪些行。

python、pandas、dataframe

我有两个不同大小的Pandas数据帧(至少500,000行)。为了简单起见，您可以将它们称为df1和df2。我感兴趣的是查找df1中没有出现在df2中的行。没有必要将任何数据帧作为另一个数据帧的子集。此外，行的顺序也不重要。例如，i在df1中的观测可能是df2中的j第四次观测，我需要考虑它是否存在(顺序不重要)。另一件重要的事情是，这两个数据帧都可能包含空值(因此操作也必须这样做)。这两个数据框架的一个简单示例是 df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 100], 'col2' : [10, 11,

浏览 0提问于2018-02-20得票数 1

回答已采纳

1回答

如何在pandas数据帧中删除所有重复出现的项或获取唯一值？

python、pandas、numpy、dataframe

我有一个具有多次出现特定值的pandas数据框。我希望删除所有重复的值或替换为NaN，并最终获得具有任意数量的唯一值的列的名称。Pandas drop_duplicates函数只删除有重复值的行，但我想删除数据框中的值/单元格。对此有解决方案吗？根据下面的输入数据帧，除了列"02“的第一行之外的所有值在数据帧中都有重复出现，所以列"02”就是我想要的。如果问题不清楚，请告诉我。谢谢。 DF: 02 03:10 03:02 03:02:09 0 6716 45355 45355 45355 1 4047 4047 7411

浏览 56提问于2019-04-02得票数 1

回答已采纳

1回答

如何在pandas dataframe中创建布尔型空列？

python、pandas、boolean

我想向给定的pandas数据帧添加一个空的布尔列。现在我已经这样做了(df是我的数据帧)： <code>A0</code> 然后，我的专栏如下所示： <code>A1</code> 这并不表示某些值可能丢失，并且该列实际上是空的。在pandas数据帧中获取boolean类型的空列是不可能的吗？

浏览 9提问于2019-03-28得票数 4

2回答

如何合并特定列中具有相同值的行？

pandas、dataframe、merge、concatenation

我已经合并了两个数据帧，并希望合并具有重复location列的值的行，但合并performances列的值，同时保留纬度和经度值。我怎么能这样做呢？ 📷

浏览 68提问于2021-11-20得票数 0

回答已采纳

4回答

pandas中所有NaN的总和是否返回零？

python、pandas

我正在尝试跨Pandas数据帧的列进行求和，当每列中都有NaN时，我得到的结果是sum =0；根据文档，我预期sum =NaN。下面是我得到的信息： In [136]: df = pd.DataFrame() In [137]: df['a'] = [1,2,np.nan,3] In [138]: df['b'] = [4,5,np.nan,6] In [139]: df Out[139]: a b 0 1 4 1 2 5 2 NaN NaN 3 3 6 In [140]: df['total'] =

浏览 0提问于2015-10-31得票数 33

3回答

如何有条件地从pandas数据帧中删除重复项

python、pandas、dataframe、duplicates

请考虑以下数据帧 import pandas as pd df = pd.DataFrame({'A' : [1, 2, 3, 3, 4, 4, 5, 6, 7], 'B' : ['a','b','c','c','d','d','e','f','g'], 'Col_1' :[np.NaN, 'A','A&#

浏览 3提问于2017-08-28得票数 14

回答已采纳

1回答

为什么在我删除选中的行后，大熊猫数据帧只显示NaN值？

python、pandas、dataframe

使用pandas库v17.1，我尝试从一个名为productDataNat的大型(882504行)数据帧中删除行，其中parName=='rt'，但随后所有其他行都变成了NaN productDataNat = pd.read_csv('https://lobianco.org/temp/productData_P0-Mi-Ei.csv',sep=';', dtype={'value': np.float64}) productDataNat = productDataNat.drop(['Unnamed: 8'

浏览 1提问于2016-03-25得票数 1

1回答

Pandas:按日期对一列进行分组，并计算另一列中特定值的累计数量

python、pandas、datetime

我尝试根据一个datetime列按日期对Pandas数据帧进行分组，并在此基础上根据特定值计算另一列中特定出现的次数。假设我有这个数据帧： df = pd.DataFrame({ "customer": [ "A", "A", "A", "A", "A", "B", "C", "C" ], "datetime": pd.to_datetime([ "20

浏览 60提问于2020-07-16得票数 4

回答已采纳

1回答

如何在所有NaN值的两行之后将一个数据帧拆分为两个

python、pandas、dataframe、data-cleaning

我有一个包含两个完全不同的数据集的数据帧。数据集由两行所有NaN值分隔。我已经提供了以下数据框的示例。 +----+--------------------------------+-------------+-----+-----+-----+-----+-----+-----+------------+-----+--------+-----+ | 13 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN | Total Fees | NaN | 653 | NaN |

浏览 9提问于2020-02-12得票数 0

回答已采纳

1回答

在pandas中合并多个数据集

python、pandas

我正在努力正确地合并pandas中的一些数据集。假设我在不同的时间测量了变量A、B和C。有时，我会同时得到A和B，有时不会。我有三个数据帧，其中数据帧的索引是测量时间，还有一列用于测量。如果我将这些数据帧连接起来，我会得到一堆没有测量的NaNs，可能是这样的 idx | A | B | C -----|-----|-----|---- 0 | 1 | NaN | NaN 0 | NaN | 2 | 3 1 | 5 | 3 | NaN 在连接时，我有非唯一的时间索引。我想要的是按时间排序，并将具有相同时间索引的行折叠在一起。这里的理想结果是 id

浏览 1提问于2015-09-04得票数 0

4回答

检查数据帧值中是否出现字符/子串的最简单方法是什么？

pandas

考虑一个具有'a - b‘值的pandas数据帧。我想检查数据帧中所有值的任何位置是否出现'-‘，而不是循环遍历各个列。显然，像下面这样的检查是不会起作用的： df.values中的if '-‘ 关于如何检查这个问题有什么建议吗？谢谢。

浏览 56提问于2017-07-06得票数 1

回答已采纳

2回答

以相同和不同的列名为混合的熊猫数据帧列表

python、pandas、indexing

我有一个数据帧列表，我想要合并到一个数据帧中。数据帧:具有相同列名的列表具有不同的索引，反之亦然。每个数据帧有1行，80列，列表的总长度为8,000个数据帧。下面是我的数据帧列表的缩小示例： import pandas as pd u = pd.DataFrame(data=[[1, 2, '111']], columns = ['a', 'b', 'id']) u = u.set_index('id') v = pd.DataFrame(data=[[3, 4, '222']], colu

浏览 0提问于2018-10-11得票数 0

回答已采纳

1回答

将二维pandas数据帧重新映射到三维xarray

python、pandas、dataframe、multidimensional-array、python-xarray

我目前有一个很大的2-d pandas时间序列值(1年或更长时间)的数据帧，我想将其重新映射到3-d xarray。pandas数据帧具有对应于另一个引用数据帧中的(经度，经度)坐标的column_id。在xarray中有什么固有的功能可以实现这一点吗？

浏览 25提问于2019-07-31得票数 0

2回答

从Pandas中的apply函数返回多个对象

python、pandas、dataframe

我正在练习将apply与Pandas数据帧一起使用。因此，我制作了一个简单的数据帧，其中包含日期和值： dates = pd.date_range('2013',periods=10) values = list(np.arange(1,11,1)) DF = DataFrame({'date':dates, 'value':values}) 我有第二个数据帧，它由原始数据帧的3行组成： DFa = DF.iloc[[1,2,4]] 因此，我想使用第二个数据帧DFa，并从每一行获取日期(使用apply)，然后查找并汇总原始数据帧中之前出现的任何

浏览 0提问于2015-06-11得票数 1

1回答

在DF端添加单个字段

python、pandas、dataframe

在包含20+行和xx+列的数据帧之后，是否可以添加一个字段，其中总计数为特定值。用户将向df添加不同的值，并且在'pandas.DataFrame.to_excel‘之前，必须添加包含某些特定数据的单个字段。如附件中的图片所示。是否可以在已经结构化的df之后添加单个字段？ ?

浏览 14提问于2020-01-09得票数 0

回答已采纳

1回答

如何匹配pandas DataFrame中的多个列，以获得一个“间隔”？

python、pandas、dataframe、match、intervals

我有以下熊猫DataFrame： import pandas as pd df = pd.DataFrame('filename.csv') print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1

浏览 1提问于2016-09-30得票数 8

回答已采纳

1回答

pandas拆分所有列表列并获取第一个值

python-3.x、pandas

我正在尝试将所有行和列的列表中的第一个元素放入单个数据帧中。所有的行和列都是列表格式。它在每个列表中包含2个元素。这是我尝试过的。我应该使用什么语法在pandas中应用整个数据帧？ import pandas as pd import numpy as np def my_function(x): return x.replace('\[','').replace('\]','').split(',')[0] t = pd.DataFrame(data={'col1': ['[b

浏览 112提问于2021-09-13得票数 0

2回答

根据列名和最后一个非NaN值压缩pandas数据帧

python、pandas、dataframe

我有一个熊猫数据框架，如下所示： col1 col2 x_1 x_2 x_3 x_4 a b 0.3 0.2 NaN NaN c d 0.4 0.3 0.2 NaN e f 0.2 0.1 NaN NaN v x NaN 0.2 NaN NaN x r NaN NaN NaN NaN 我想要做的是为每一行找到最右侧的数值，并使用两个新列重新构造数据帧，第一列包含列名，第二列包含最右侧的值，如下所示： col1 col2 col3 col4 a b x_2 0.2 c d x_3 0.2 e f

浏览 2提问于2017-03-04得票数 1

回答已采纳

2回答

在pandas中如何根据字符串列中的NaN进行过滤？

python、pandas

我使用的是pandas 0.18。我已经使用pd.read_csv()从CSV加载了一个数据帧，看起来CSV中的空单元已经加载为数据帧中的NaN。现在，我想找出特定列中具有空值的行数，但我正在努力。这是我的数据框架： ods id provider 0 A86016 NaN emis 1 L81042 463061 NaN 2 C84013 NaN tpp 3 G82228 462941 emis 4 C81083 NaN tpp 这是我从df.de

浏览 3提问于2016-05-11得票数 9

回答已采纳