在pandas数据框的列中将NaN值更改为0时出现问题_如何在pandas数据框中将特定行的值更改为NaN？_在pandas数据框中，只用数据填充选定的列，并用NaN值追加剩余的列 - 腾讯云开发者社区

python、python-3.x、pandas、dataframe

如何确定一个字段在pandas数据框中是否不为空(‘’)且不为空？我正在使用if not value and pd.notna(value): 是正确的，还是有更好的API可以直接处理这个逻辑？

浏览 249提问于2021-01-13得票数 0

1回答

如何使用pandas替换csv文件中的NaN值，然后将其存储到MySQL中？

mysql、python-3.x

我正在尝试使用python pandas将csv文件数据存储到mysql中。我的csv文件有一个"NAN“和"-INF”值，所以我想把它的值分别改为0和-999。但是，现在我被卡住了，试图将"NAN“转换为0。我已经在谷歌上搜索过了，但还是想不出怎么做。 import pandas as pd import mysql.connector import sqlalchemy df = pd.read_csv("test.csv") df1 = df.replace(to_replace="NAN&

浏览 18提问于2019-01-24得票数 1

回答已采纳

2回答

如何将Nan和负数替换为零

python、pandas、dataframe

? 在上面的数据框中，我试图使用pandas将最后一列中的NaN和负值替换为0，我在这里使用了一些建议，但这似乎也会影响其他列，并将其他列中的值替换为零。如何将其限制为只显示选定的列

浏览 211提问于2021-08-25得票数 0

2回答

psycopg2 -可接受的日期/日期时间值

datetime、pandas、psycopg2

我使用psycopg2和sqlalchemy将来自xls文件的数据插入到postgres数据库中。我以前在插入'date‘列时遇到过问题，这些列在excel中被格式化为一个数字。我们在postgres中将这些列定义为date类型。我这里有两个问题: 1.日期列中的一些值是空的。Pandas正在将这些值转换为NaT或NaN，但sqlalchemy和psycopg2无法解析。 df = pd.read_excel(full_path, encoding='utf-8') dict_items = df.to_dict(orient='records') ta

浏览 2提问于2017-01-03得票数 0

4回答

如何在DataFrame中更改某一列的数据类型？

python、pandas、dataframe

我想要更改一个数据框列的数据类型(从datetime64到object)。首先，我创建数据帧： Python 2.6.8 (unknown, Jan 26 2013, 14:35:25) [GCC 4.7.2] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import pandas as pd >>> values = pd.Series(i for i in ran

浏览 2提问于2013-10-18得票数 10

1回答

Python Pandas-根据给定的窗口并从特定值开始计算特定列的总和

python、pandas

我正在尝试在Python Pandas数据框中创建一个新列，其中包含指定范围内另一列的相加值，并从某一行开始。例如，在下面的数据框中，我希望跟踪1的值列的总和从第3行开始(使用索引行号)。但是，我还需要对跟踪2重复相同的标准。此外，我需要从每个跟踪的相同样本号开始。有什么想法吗？

浏览 7提问于2018-07-29得票数 0

回答已采纳

1回答

df.compare()如何使用align_axis=1更改自己/其他标签？

python、pandas

如果我有两个数据帧，那么从pandas 1.1.0开始，我可以沿着轴1比较它们，如下所示： import pandas as pd df1 = pd.DataFrame([[1,2,3,4], [1,2,3,4]], index=['A', 'B']) df2 = pd.DataFrame([[1,2,5,4], [5,2,3,1]], index=['A', 'B']) df1.compare(df2, align_axis=1) ? 我想将self/other标签重命名为更具描述性的标签。我知道align_ax

浏览 38提问于2021-11-15得票数 1

回答已采纳

3回答

将Pandas列拆分为多个列

python、pandas

在Pandas中有没有办法把一列分成多列？我在一个数据框中有一个列，其中的内容如下： a [c,a] b 我想把它分成： colA colB colC a nan nan a nan c a b nan 请注意原始列中第二行变量的顺序。谢谢

浏览 2提问于2017-06-14得票数 2

2回答

从列中获取字符串的第一个字母

python、pandas

我在和熊猫打架，现在我输了。我有一个类似于下面的源表： import pandas as pd a=pd.Series([123,22,32,453,45,453,56]) b=pd.Series([234,4353,355,453,345,453,56]) df=pd.concat([a, b], axis=1) df.columns=['First', 'Second'] 我想用列' first‘中的值的第一个数字将新列添加到此数据框中: a)将列’first‘中的数字改为字符串b)从新创建的字符串中提取第一个字符c) b)b)结果b另存为数据框中

浏览 1提问于2016-02-22得票数 60

回答已采纳

2回答

如何在pandas数据帧中查找包含除NaN之外的所有唯一值的列名？

pandas、unique

我想要查找包含pandas数据框中除NaN以外的所有非重复项的列。 x y z a 1 2 A b 2 2 B c NaN 3 D d 4 NaN NaN e NaN NaN NaN 列"x“和"z”具有除NaN之外的非重复值，因此我希望将它们挑选出来并创建一个新的数据框。

浏览 16提问于2020-05-14得票数 1

回答已采纳

1回答

如何在pandas数据帧中删除所有重复出现的项或获取唯一值？

python、pandas、numpy、dataframe

我有一个具有多次出现特定值的pandas数据框。我希望删除所有重复的值或替换为NaN，并最终获得具有任意数量的唯一值的列的名称。Pandas drop_duplicates函数只删除有重复值的行，但我想删除数据框中的值/单元格。对此有解决方案吗？根据下面的输入数据帧，除了列"02“的第一行之外的所有值在数据帧中都有重复出现，所以列"02”就是我想要的。如果问题不清楚，请告诉我。谢谢。 DF: 02 03:10 03:02 03:02:09 0 6716 45355 45355 45355 1 4047 4047 7411

浏览 56提问于2019-04-02得票数 1

回答已采纳

1回答

在pandas数据框中，只用数据填充选定的列，并用NaN值追加剩余的列

python、pandas、dataframe

import pandas as pd sample_dataframe = pd.DataFrame(columns = [column_1, column_2, column_3, column_4] ) sample_data = [(78, 89), (77, 45), (54, 90)] 我希望在sample_dataframe中插入sample_data，这样column_1和column_2将使用数据中的值进行填充，其余列将使用所有行的NaN值进行填充。在数据帧创建期间，我无法将数据添加到数据帧中。在定义数据帧的结构后，需要稍后添加数据。做这件事最简单的方法是什么？这

浏览 18提问于2020-09-07得票数 0

回答已采纳

2回答

熊猫-用无行取代最后的无价值

python、pandas

在pandas中，人们似乎想要做的一件常见的事情是用下一个或以前的None-value替换None-values。使用.fillna很容易做到这一点。然而，我想做一些类似但不同的事情。我有一个dataframe，df，有一些条目。每一行都有不同数量的条目，它们都是“左调整”的(如果df宽10列，而某些行有n<10条目，则第一个n列保存条目，其余的列是Nones)。我想要做的是在每一行中找到最后一个非None条目，并将其更改为一个None。这可能是从第一列到最后一列的任何一列。当然，我可以用一个for-loop来完成这个任务，但是我的df可以相当大，所以更快一些更好。有什么想法吗？

浏览 13提问于2022-08-29得票数 2

回答已采纳

1回答

如何计算pandas中列之间的百分比变化？

python、pandas、dataframe

我是Python和pandas的新手。我创建了一个数据帧，并希望计算两列之间的百分比变化。我知道pandas中的pct_change函数，但它在行之间工作。 import pandas as pd import matplotlib.pyplot as plt UKnewcars = pd.DataFrame({ 'Model': ["Diesel", "MHEV Diesel", "Petrol", "MHEV petrol","BEV", "PHEV", "

浏览 81提问于2021-10-11得票数 0

1回答

使用pandas重新排列数据帧

python、dataframe

我得到了以下数据帧： import pandas as pd test = pd.DataFrame([["Bugatti","Veyron"], ["Bugatti","Chiron"], ["VW","Golf"], ["VW","Passat"], ["VW","Polo&

浏览 7提问于2019-11-28得票数 0

回答已采纳

1回答

在pandas中将可变长度列表保存到HDF5

python、pandas、large-files、large-data

我对熊猫很陌生，所以如果我的问题很琐碎，请道歉。我想将pandas数据框保存到hdf5，其中包含一个可变长度的列表列表作为一列。我的目标是稍后以块的形式写入和读取此数据帧。这似乎只有在我以表格式存储数据帧的情况下才有可能。但是，如果我将数据框保存为表格格式，则会出现以下错误： TypeError: Cannot serialize the column [pdf] because its data contents are [mixed] object dtype 在下面的示例中，我展示了一个重现该问题的最小示例： import pandas as pd import numpy as np

浏览 1提问于2016-04-13得票数 1

2回答

如何在使用django ORM加载数据之前强制使用列数据类型

python、django、pandas、dataframe、django-orm

我们使用pandas (v0.25.3)从通过Django ORM (django v2.2.6)访问的postgres数据库中的大型数据集运行分析和数据操作。我们遇到的情况是，我们要导入到DataFrame的表包含一个存储为models.BigIntegerField的外键ID列。这个外键字段通常是一个很大的数字，但是在那些没有设置外键的行中也可以是null。当我们将记录列表从Django查询集中导入到新的pandas DataFrame中时，pandas会将ID列的dtype设置为np.float64，因为该数据包含一些空值。但是，对于那些ID不为null的行，从BigInteger

浏览 19提问于2020-12-19得票数 0

2回答

新行基于其他行的过去值到当前值

python、pandas、dataframe、conditional-statements、shift

我正在尝试创建一个名为move in df的新列，它给出了1的值(如果在x is higher中的值大于其先前的值)和0 (如果是value is lower )，因此move中的第一个值应该是NaN。 d = {'x': [1, 0, 2, 5, 4]} df = pandas.DataFrame(d) 该列应该如下所示： df['move'] = pandas.Series([NaN, 0, 1, 1, 0])

浏览 5提问于2016-06-27得票数 1

回答已采纳

1回答

如何删除具有多个条件的pandas中的列

python、pandas、dataframe

我刚接触python和pandas 在下面的数据框中，我需要删除完全为" None“的列，其中包含"blanks None"，但不删除包含值和None的列 ? 在上表中，我希望删除列A和列C，因为它们完全是“无”或“空白和无”，但是列B至少在3个单元格中有一些有效数据，它不应该被干扰如何在df.drop (pandas)中给出这个条件

浏览 48提问于2021-11-11得票数 0

回答已采纳

1回答

用整数清除Python中的百分比列(十进制+整数)

python、percentage

我有一列百分比，其中包含像0.4567 , 0.1564 , 19 , 23, 0 , 0.1234这样的数字，其中我需要对整数进行归一化，即45 , 15, 19 ,23 , 0 , 12本身。我已经复制了一个例子如下。 import pandas as pd import numpy as np n_row = 10 dicti = {'id':[coli for coli in range(1,(n_row+1))], 'perc_col':[30,0.4546,0.76543223190,10,0,0.29567,93,15,0.31,0.4

浏览 1提问于2020-04-17得票数 0

回答已采纳

2回答

Pandas Dataframe -按列值过滤数据帧行

python、pandas、dataframe、filtering

我正在尝试过滤我的pandas数据框，以便它保留这些行在任何数据框的列中具有前两个值之一的行。下面是一个示例： d = {'col1': [1, 2, 3, 0], 'col2': [4, 6, 5, 2],'col3':[9, 8 , 7, 3], 'col4':[1, 2, 1, 0]} d= 然后我希望输出是：我尝试过使用.nlargest和循环遍历列，但合并数据帧是一项任务。一定有一种更简单的方法，我还没有学会。欢迎任何帮助或指点。

浏览 0提问于2020-06-29得票数 1

2回答

如果值在Python Pandas中介于两倍之间，则将'1‘添加到单元格

python、excel、pandas

我已经将一个Excel文件导入到一个数据框中，该数据框中有一个名为“打开”的列，其中包含打开某项内容的日期和时间。我想要有一个标记为'07:01 - 09:00‘的新列，并且在这段时间内有打开时间的每一行，我想在该列的同一行上添加一个'1’。到目前为止，我有这个 Opened 2020-04-14 14:45:58 2020-04-07 17:53:49 2020-04-07 07:10:14 2020-04-06 23:11:13 我想要的是 Opened 07:01 - 09:

浏览 8提问于2020-05-05得票数 1

回答已采纳

1回答

Python -将2列CSV附加到一起

python、pandas

我正在使用pandas将csv文件加载到数据框中。下面是一个数据帧示例： X Y 1 4 2 5 3 6 我想将这两列追加到一个新的列中： X Y Z 1 4 1 2 5 2 3 6 3 4 5 6 如何使用python来实现

浏览 12提问于2020-07-27得票数 0

4回答

Pandas read csv正在移动列

python、pandas、csv

我正在尝试创建一个有4个空列的csv文件的数据帧。当我在LibreOffice或Excel上打开它时，它会正确地识别空列。但是，以pd.read_csv()开头的结果是将列的值移位1。我该如何解决这个问题呢？这似乎是pandas read_csv()方法的一个问题。我的代码非常标准： import pandas as pd df = pd.DataFrame.read_csv('csv_file.csv', sep=',') df.head() 我更改了标题，并使用了以下内容： df = pd.DataFrame.read_csv('csv_file

浏览 0提问于2017-08-13得票数 11

3回答

将一个数据框列值追加到另一个数据框

python-3.x、pandas

我有两个数据帧。df1是空的数据帧，而df2有一些数据，如下所示。在这两个dfs中，有一些列是相同的。我想将df2数据框列数据追加到df1数据框的列中。df3为预期结果。我已经推荐了Python + Pandas + dataframe : couldn't append one dataframe to another，但没有正常工作。出现以下错误: ValueError:计划形状未对齐 df1： Empty DataFrame Columns: [a, b, c, d, e] Index: [] ` df2： c e 0 11 55 1 22 66 df3

浏览 34提问于2019-04-25得票数 0

回答已采纳

1回答

如何在pandas中过滤出只是数字而不是完全数字的行？

python-3.x、pandas

我有一个Pandas dataframe列，它的数据行如下： col1 abc ab23 2345 fgh67@ 8980 我需要创建另外两个列col2和col3，如下所示： col2 col3 abc 2345 ab23 8980 fgh67@ 我使用过str.isnumeric()，但在数据框列中这对我没有帮助。有人能帮上忙吗？

浏览 0提问于2018-07-03得票数 3

2回答

如何将pandas数据框中的每个值替换为列值？

python、pandas、python-2.7

如果我有一个像这样的熊猫数据框： 0 20 30 40 50 1 5 NaN 3 5 NaN 2 2 3 4 NaN 4 3 6 1 3 1 NaN 如何将每个值替换为它的列值，这样我就可以得到一个像这样的pandas数据框： 0 20 30 40 50 1 0 NaN 30 40 NaN 2 0 20 30 NaN 50 3 0 20 30 40 NaN

浏览 3提问于2019-01-22得票数 3

3回答

如何通过分隔符拆分一列，同时考虑要分隔的项的相对位置

python、pandas、split、position

下面是我使用pandas在Python中编写的通用数据框脚本。我希望拆分数据框中的某一列，以创建新列，同时尊重原始列中项目的原始方向。为了清楚起见，请看下面。提前谢谢你！我的脚本： import pandas as pd import numpy as np df = pd.DataFrame({'col1': ['x,y,z', 'a,b', 'c']}) print(df) 这是我想要的 df = pd.DataFrame({'col1': ['x',np.nan,np.nan],

浏览 4提问于2020-03-29得票数 2

1回答

替换pandas数据框中多列的列特定范围之外的值

python、pandas、data-science、data-cleaning

我是pandas的新手，我想要清理一个包含大量列的数据框。我希望将值保持在特定于每一列的范围内，例如，对于名为“Age”的列，我希望保持值大于5小于25。如果一个值超出了这个范围，我想用NaN替换它，例如在'Age‘列中有我想要替换的值918. 在我的尝试中，我使用了字典，因为正如我所说的，我有很多列。这段代码不起作用，因为它实际上并没有改变我原始数据框中的任何值(没有错误消息)。谢谢你的帮助！ # PACKAGES import pandas as pd import numpy as np # STARTING DATA data = [[1.0, 10, 0],

浏览 28提问于2020-04-24得票数 1

回答已采纳

1回答

不同长度列的Python盒图

python、pandas、boxplot、prettyplotlib

我在Python中有以下数据格式(实际的dataframe要大得多，只是提供了一个小示例)： A B C D E F 0 0.43 0.52 0.96 1.17 1.17 2.85 1 0.43 0.52 1.17 2.72 2.75 2.94 2 0.43 0.53 1.48 2.85 2.83 3 0.47 0.59 1.58 3.14 4 0.49 0.80 我使用df.values将dataframe转换为numpy，然后将其传递给boxplot。当我

浏览 2提问于2014-04-17得票数 9

回答已采纳

1回答

如何将列表中的前两个熊猫值替换为零，其他值替换为图像高度和宽度？

python、pandas、list、dataframe、csv

我在pandas数据框上工作，我想替换列中的一些值，这些列基本上包含列表，它在一些行中既有nan值，也有一些包含边界框坐标。我附上了一个样本的数据框，请看一看DataFrame。数据框如下所示： img_id BB class w h 001 [[nan, nan, nan, nan], [nan, nan, nan, nan], [nan, nan, nan

浏览 19提问于2021-08-23得票数 0

回答已采纳

1回答

熊猫pivot_table没有按预期工作

python、pandas、dataframe、parameters、pivot-table

我正在以数据为中心来查看组内的唯一值计数。我知道一些分组列有空值，我想包括它们。我可以很容易地用一个.groupby([...], dropna=False)来完成这个任务，但是我想使用.pivot_table，因为它在一个函数中处理解堆栈、空填充、总计等等。样本数据(取自) a = [['a', 'b', 12, 12, 12], ['a', np.nan, 12.3, 233., 12], ['b', 'a', 123.23, 123, 1], ['a', 'b', 1, 1,

浏览 1提问于2021-04-23得票数 1

1回答

同时根据多个参数过滤数据帧

python、pandas、dataframe

假设我有一个数据框： df = pd.DataFrame({"a": range(1,5), "b": range(6, 10), "c": range(11, 15) , "d": range(15, 19)}) 我想根据组成坐标点的两列的值来过滤这个数据框。假设c，d分别是x和y坐标。但是，我想检查是否给定了数据框中的点列表，哪些点属于x坐标列表和y坐标列表的值。 x_coord = [4,12,13,17,19] y_coord = [16,18,25,29,32] 使用pandas的"isin“函数，我如何同时解

浏览 14提问于2019-02-26得票数 0

回答已采纳

2回答

如何合并在公共列中具有重复值的两个数据帧

python、python-3.x、pandas、dataframe

我在必须与另一个数据框合并的数据框的公共列中有重复的值。我如何才能在不复制和添加来自另一个数据框的列的情况下将它们连接起来？ df_1： df_2：由于两个数据框中的列列表相同，如何将这两个数据框合并为一个没有重复列的数据框？预期的最终数据帧：

浏览 2提问于2020-11-05得票数 0

1回答

数据科学熊猫CSV

csv、pandas

我有一个具有1461属性的csv文件。我想把它加载到一个熊猫数据框中。问题是，许多行没有尾随连续列的值。因此，pandas由于长度不规则而导致解析错误。如何一次性放置前导列的缺失值并将csv文件加载到数据框中？ Edit1我们可以看到数据集csv文件如下 a,b,c,d,e,f,g,h,i""" 1,2,4,5 1,0,9,8,7,6,5,4,7 1,3,5,6,7 6,7,8,8,9,4,5,3,5"""我想要一个像下面这样的熊猫数据框 """a b c d e f g h i 1 2 4 5 ? ? ? ? ?

浏览 1提问于2017-03-09得票数 0

回答已采纳

2回答

根据字数将列拆分为未知数量的列- Pandas

python、pandas

我有一个pandas数据框，它的一个列包含一些字符串。我想根据字数将该列拆分成未知数量的列。假设我有DataFrame df： Index Text 0 He codes 1 He codes well in python 2 Python is great language 3 Pandas package is very handy 现在，我想将text列划分为多个列，每个列包含2个单词。 Index 0 1 2 0

浏览 17提问于2020-06-29得票数 3

回答已采纳

3回答

将Pandas数据框列值合并到新列中

python、pandas、dataframe

我正在使用Pandas，我有一个数据框，我们可以在其中填充三个值之一： ID_1 ID_2 ID_3 abc NaN NaN NaN def NaN NaN NaN ghi NaN NaN jkl NaN mno NaN pqr NaN NaN 我的目标是将这三列合并到我的数据框中的一个新列中： ID_1 ID_2 ID_3 Combined_ID abc NaN NaN abc NaN def NaN def NaN N

浏览 0提问于2015-04-22得票数 12

1回答

在两列而不是一列上使用tapply

r、plyr、tapply

我想计算几个带有R的曲线图的基尼系数，取消软件包reldist中的gini()函数。我有一个数据框，我需要使用其中的两列作为基尼函数的输入。 > head(merged[,c(1,17,29)]) idp c13 w 1 19 126 14.14 2 19 146 14.14 3 19 76 39.29 4 19 74 39.29 5 19 86 39.29 6 19 93 39.29 gini函数使用第一个元素(这里是c13 )进行计算，第二个元素是对应于c13中每个元素的权重(这里是w)。所以我需要使用列c13和w，如下所示： gini(merge

浏览 5提问于2013-03-01得票数 0

回答已采纳

2回答

Pandas将列拆分为str列和int列

python、pandas、dataframe

我目前正在尝试将我的pandas数据框中的一列拆分为两列，其中一列是int，另一列是string。我理解为了能够将一列拆分为两列，可以使用以下代码(其中A是要拆分为列integer和string的列)： df[['integer','string']] = df['A'].str.split(" ",expand=True,) 然而，我的数据集的问题是，在整数和字符串之间没有空格或"-“作为划分列的指示符。我的数据框示例如下： A B 3 abc 629S def 84S ghi S72 j

浏览 0提问于2020-06-29得票数 4

1回答

计算列中连续行的工时差值

python、pandas、group-by、diff

我有一个PANDAS数据框，我想相对于'type'列执行groupby，然后计算'date'列的每一行与前一行的工作时间差。所需输出应为： type date working_hour_diff A 2020-01-02 07:07:20.963 15.0086 A 2020-01-03 07:07:51.453 NaN B 2020-01-05 10:52:38.690 26.18 B

浏览 15提问于2020-10-12得票数 0

1回答

将object类型的字段扩展为pandas中的单独字段

python、pandas

我正在尝试使用pandas清理CSV格式的数据。我的数据框如下所示： ? 我想将shot_paramters字段展开为单独的列。以下是该字段的样本值： ? 关于如何在熊猫身上做到这一点，有什么想法吗？

浏览 3提问于2020-01-01得票数 0

回答已采纳

1回答

使用pandas dataframe创建年度预测数据

python、dataframe

我最近开始使用pandas数据透视表功能，并希望在输出中添加额外的数据。我现在有下面的数据框数据帧：我想在最后一列旁边多加一列，这将给出12个月的费用预测，即平均*12。结果数据帧：提前感谢同行python专家的帮助。

浏览 2提问于2020-07-31得票数 0

1回答

为什么我不能取消(融化)这个panda数据帧(python)

python、pandas、dataframe

我有一个我制作的熊猫数据框架，我按照我想要的方式旋转了它。现在，我想要取消透视所有内容，以获得包含新形成的数据框的位置数据(行和列)，并查看是哪一个。例如，我希望第一行(在位置数据未透视的新数据框中)在" row“下有1，在"a”下有1，并将1作为值(如下所示)。有没有人能想出如何取消透视来获得行和列值？我试过使用pd.melt，但它似乎不起作用(它没有任何区别)。请尽快回复。谢谢!正下方是生成旋转数据帧的代码。 import pandas as pd row = [1, 2, 3, 4, 5] df67 = {'row':row,} df67 = pd.Da

浏览 7提问于2020-04-24得票数 1

回答已采纳

1回答

使用不同行中的值在DataFrame中创建新列

python、pandas

我正在尝试在pandas数据框中创建一个新列，它是下一年相同id的分数。原始数据示例如下： Year ID Score 2018 785 8.4 2018 770 -1.2 2017 733 3.2 2017 785 7.9 2018 733 3.9 如果没有明年的数据，应该填上安娜。所以我要找的输出应该是： Year ID Score col 2018 785 8.4 NA 2018 770 -1.2 NA 2017 733 3.2 3.9 2017 785 7.9 8.4 2018 733 3.9

浏览 10提问于2019-10-18得票数 1

回答已采纳

1回答

将mongodb集合转换为panda dataframe

python、mongodb、pandas、dataframe

我有一个mongodb集合，表示每个用户的电影收视率： [ { "movie_rate" : [ { "rate" : 4, "movie_id" : "608" }, { "rate" : 4, "movie_id" : "1246" } ] }, { "movie_rate"

浏览 11提问于2017-01-21得票数 0

1回答

比较数据帧中的两个列值

python、pandas、compare、multiple-columns

我有一个像下面这样的csv数据框，我想比较两列的值并生成第三列，如果值相同将返回True，而不是相同的返回False，如何与pandas python进行比较？ one two 1 a 2 b 3 a 4 b 5 5 6 6 7 7 8 8 9 9 10 10

浏览 1提问于2016-11-08得票数 3

1回答

在比较一列pandas数据帧和一个整数时，如何使用np.nanmin？

python、pandas、numpy

import pandas as pd import numpy as np a = np.array([[1, 2], [3, np.nan]]) np.nanmin(a, axis=0) array([1., 2.]) 我想使用相同的逻辑，但在pandas数据框列上，并将列的每个值与一个整数进行比较。使用案例： MC_cond = df['MODEL'].isin(["MC"]) df_lgd_type = df['LGD_TYPE'].isin(["FIXED"]) df_without_lgd_type = ~(df_

浏览 1提问于2020-05-12得票数 1

1回答

pandas数据框列中仿生表达式的筛选与应用

python、pandas、dataframe

我在pandas数据框中有一个名为volume的列，我想从当前列#中回顾之前的5个卷，并找到40%。卷数据-如下所示 1200 3400 5000 2300 4502 3420 5670 5400 4320 7890 8790 对于前5个值，我们没有足够的数据来回顾，但从第6个值3420中，我们应该找到前5个卷1200,3400,5000,2300,4502的百分位数(40)，并通过从当前值中获取前5个数据来继续对其余数据执行此操作。

浏览 13提问于2019-10-16得票数 2

1回答

如何匹配pandas DataFrame中的多个列，以获得一个“间隔”？

python、pandas、dataframe、match、intervals

我有以下熊猫DataFrame： import pandas as pd df = pd.DataFrame('filename.csv') print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1

浏览 1提问于2016-09-30得票数 8

回答已采纳

1回答

pandas拆分所有列表列并获取第一个值

python-3.x、pandas

我正在尝试将所有行和列的列表中的第一个元素放入单个数据帧中。所有的行和列都是列表格式。它在每个列表中包含2个元素。这是我尝试过的。我应该使用什么语法在pandas中应用整个数据帧？ import pandas as pd import numpy as np def my_function(x): return x.replace('\[','').replace('\]','').split(',')[0] t = pd.DataFrame(data={'col1': ['[b

浏览 112提问于2021-09-13得票数 0