Pandas -在屏蔽和df.where之后应用乘法_Python Pandas在groupby和aggregate之后排序_Pandas在groupby之后添加计数和列 - 腾讯云开发者社区

、

Im正在寻找一种方法来乘所有列的值，但排除值为0的列。因此，结果不应该是0(乘0)。如果有这么多列和行，这很容易，但是如果有100列和5000行呢？ import pandas as pd df = pd.DataFrame({"Col1":[6,4,3,0], "Col2":[1,0,0,3], "Col3":[2,4,3,2]}) 所以结果应该是这样的： print(df) # result should be multiplication of all colu

浏览 3提问于2020-03-04得票数 0

回答已采纳

2回答

熊猫的功能与我所期望的相反

、

我试图在Pandas DataFrame列中将NaN转换为0，而"where“函数的行为与我所期望的相反。下面的代码将创建一个数据框架，其中包含一个列，其中NaN位于索引4、5、6和7。 from collections import Counter import pandas as pd x = Counter(pd.np.random.choice(24,2000)) df = pd.DataFrame({'x':x}) df.loc[4:7,'x'] = pd.np.nan df 我用过 df.where(df.isnull() == True

浏览 2提问于2017-07-20得票数 3

回答已采纳

1回答

获取Pandas Dataframe中特定值的索引和列名

、、

我有以下Pandas DataFrame： A B 0 Exporter Invoice No. & Date 1 ABC PVT LTD. ABC/1234/2022-23 DATED 20/08/2022 2 1234/B, XYZ, 3 ABCD, DELHI, IN

浏览 2提问于2022-08-20得票数 2

回答已采纳

2回答

在Pandas dataframe中将NaN更改为None

我尝试将pandas dataframe中的Nan替换为None。它使用df.where(df.notnull(),None)是可行的。下面是这个方法的线程。Use None instead of np.nan for null values in pandas DataFrame 当我尝试在另一个数据帧上使用相同的方法时，它失败了。新的数据帧如下A NaN B C D E，数据帧的打印输出如下： Unnamed: 1 Unnamed: 2 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6 0 A NaN

浏览 221提问于2021-03-23得票数 2

1回答

如何在Pandas dataframe中返回搜索项的loc/index (行和列)

、、、、

我在Pandas dateframe中寻找一个子字符串。 tmp = Metadata_sheet_0.apply(lambda row: row.astype(str).str.contains('sRNA spacer'), axis=1) 它返回相同大小的数据，每个元素都是True或False。我想要所有Trues的索引，而不是Trues/False的另一个数据。如何在不使用for循环的情况下实现这种Pandas的方式？谢谢!

浏览 3提问于2022-05-11得票数 1

1回答

如何使用Oracle表中的Nans更新pandas数据帧，使Nans变为NULL？

、、、

我的pandas数据帧有NAN值..我正在使用'df.dropna‘方法从我的数据帧中删除所有缺少的值，这样我就可以将它写回我的Oracle Database Table。但在DB表中，NAN值将被替换为0，我希望它们保持为空。或者，是否可以使用包含缺少的/NaN值的数据帧来更新Oracle表。在数据库中，NaNs应该变为Null。请帮助，因为我是第一次接触蟒蛇和熊猫。

浏览 7提问于2019-11-08得票数 0

1回答

python熊猫添加了新列，其值为分组计数

、

我想增加一个新的专栏，上面的点数超过700次，在2014年之后。 import pandas as pd ipl_data = {'Year': [2014,2015,2014,2015,2014,2015,2016,2017,2016,2014,2015,2017], 'Points':[876,789,863,673,741,812,756,788,694,701,804,690]} df = pd.DataFrame(ipl_data) grouped = df.groupby('Year') df.loc[(d

浏览 1提问于2021-03-08得票数 0

回答已采纳

3回答

对Dataframe中每列的零和负值进行计数和打印

、、、

我想打印一个语句，在每个Dataframe列中显示零和负值计数。我的意见应该是： import pandas as pd df = pd.DataFrame({'a': [-3, -2, 0], 'b': [-2, 2, 5], 'c': [-1, 0, 7], 'd': [1, 4, 8]}) 其中的指纹： a b c d 0 -3 -2 -1 1 1 -2 2 0 4 2 0 5 7 8 我希望的产出是： Negatives Found: a 2 b 1 c 1 d 0

浏览 1提问于2019-02-27得票数 0

回答已采纳

1回答

熊猫:查找包含任意分布在列上的几个值的行

、、

我正在寻找一个很好的解决以下问题的方法:我有一个熊猫DataFrame，我只知道其中一个行包含几个值，这些值任意分布在列上。我想找到那排。示例:以下两个数据格式都有一行，其中包含值为“嘿嘿”、“这里”和“我是”： df = pd.DataFrame({"a": (np.nan, 1, "hey", 5, 100), "b": ("testing", np.nan, "here", "what", -3), "c": (1, "two&#

浏览 3提问于2021-09-01得票数 1

回答已采纳

2回答

如何使用嵌套的for循环和熊猫的iloc定位具有1的行和列

、、

我对蟒蛇和熊猫比较陌生。我想复制一个战舰游戏。我的目标是定位有1的行和列，并将该位置存储为战舰位置。我创建了一个CSV文件，它看起来如下 col0,col1,col2,col3,col4,col5 0,0,0,0,0,0 0,0,0,0,0,0 0,0,0,0,0,0 0,1,0,0,0,0 0,0,0,0,0,0 0,0,0,0,0,0 这是将创建的CSV文件作为DataFrame读取的代码。 import pandas df = pandas.read_csv('/content/pandas_tutorial/My Drive/pandas/myBattleshipmap.

浏览 3提问于2020-08-13得票数 3

回答已采纳

1回答

熊猫:如果索引和列相同，则将值更改为NA

、

我有一个，如果索引和列名相同，我希望将值更改为NA。有一个优雅的方法来实现这一点吗？我只能想到一个乏味的应用和功能的解决方案。 import pandas as pd df = pd.DataFrame({'a': [1, 1], 'b': [1, 1], 'c': [1, 1]}) df.index = ['a', 'b'] df +---+---+---+---+ | | a | b | c | +---+---+---+---+ | a | 1 | 1 | 1 | | b | 1 | 1 | 1 | +-

浏览 3提问于2017-04-28得票数 1

回答已采纳

1回答

ValueError在大熊猫DataFrame.where法中的应用

、、、、

我正在编写以下代码，我希望使用pd.where方法只获取值的前3分钟，但是我得到以下错误: ValueError:数组条件必须与self相同的形状 import pandas as pd import numpy as np index = pd.date_range(start = '2017-06-01 00:00', end='2017-06-01 01:00', freq='1min') values = np.arange(0, len(index)) df = pd.DataFrame(values, index = index)

浏览 5提问于2017-08-24得票数 3

回答已采纳

2回答

Python/Pandas:查找n个最大的索引，并只保留那些大于某个值的索引

、

我想检索对应于列集的n个列名，其中是n个最大的值。然后，只有当值高于给定的阈值时，这些名称才会保留在列表中。例如，给定三列'Paul'，'Eric'，'Marc'，假设我想要最多2个列名，阈值是0.5。然后，我将获得列'Best‘，如下所示： import pandas as pd import numpy as np start = '2020-01-01 00:00+00:00' end = '2020-01-01 05:00+00:00' pr1h = pd.period_range(start

浏览 35提问于2020-05-23得票数 2

回答已采纳

1回答

熊猫用df.loc保留原始行索引

、

我希望过滤一个表，并选择几个列，使用它们，然后与原始表合并(左联接)。原始df如下所示： (pandas index) source destination freq 0 source_path1 destination_1 day 1 source_path2 destination_2 hour 2 source_path3 destination_3 day 然后，我使用df.loc过滤和选择一些列： df_cop

浏览 0提问于2021-04-23得票数 1

回答已采纳

1回答

Pandas、Dataframe、每行列的条件和

、

我是python的新手，正在尝试将我的一些工作从excel转移到python，并希望在pandas中使用excel SUMIFS等效项，例如： SUMIFS(F:F, D:D, "<="&C2, B:B, B2, F:F, ">"&0) 在我的例子中，我有6列，一个唯一的交易ID，一个发行者，一个交易日期，一个发布日期，一个交易者和一个数量。我想得到一个列，显示每一行可释放的可用数量的总和。如下所示： A B C D E F G ID Issue

浏览 22提问于2020-03-06得票数 1

1回答

熊猫中的DataFrame布尔索引--用条件为真的级数元素替换列

、

我有个数据： >>>df=pd.DataFrame(np.random.randn(3,3)) >>>df 0 1 2 0 -0.685692 0.180900 0.652838 1 0.484584 -0.441004 -1.617281 2 -0.665110 1.196987 -0.133439 我希望替换行中所有大于0的元素，例如，用长度为s的df.shape[0]序列的对应元素替换。 >>>s = pd.Series((3,4,5)) >&

浏览 1提问于2016-03-05得票数 4

回答已采纳

1回答

向pandas.DataFrame中的随机单元分配零

、、、

我试图将0分配给一维pandas.DataFrame中的随机单元。下面的代码是我所能想到的最好的方法，但是我相信可能有一种更清晰的方法来解决这个问题。 import numpy as np import pandas as pd from random import randint df = pd.DataFrame(np.random.randint(20, size=(10, 1)), columns=list('A')) col_size = len(df.columns) row_size = len(df.index) df[df.columns[randint(

浏览 0提问于2018-12-07得票数 1

回答已采纳

1回答

pandas DataFrame的迭代子集及计算方法

、

我有一个相当大的DataFrame (大约30k行，大约30k列)，我尝试基于每个列值迭代地创建两个子集，并存储每列的比率数组： for col in df.columns: high_subset = df.query(col>cutoff_vals['high'][col]).mean(axis=0) low_subset = df.query(col<cutoff_vals['low'][col]).mean(axis=0) ratios = high_subset / low_subset /// s

浏览 19提问于2021-10-15得票数 0

1回答

如何使用pandas.dataframe.where()更改值？

、

我在做这件事上遇到了麻烦。在清理我的数据时，其中一列，也就是所谓的‘马力’，可以有一个介于48.0到288.0之间的整数。数据中的一个数字已输入为1100，我将假定是人为错误，并希望将其更改为110。使用pandas，我该怎么做，我已经尝试了这么多不同的代码。这是我之前尝试运行的代码：df.where(df['horsepower']<288, '110')

浏览 0提问于2021-04-13得票数 0

3回答

如何在Pandas <NA>中用NaN替换DataFrame？

、

我的DataFrame中的一些列具有<NA>的实例，这些实例的类型为pandas._libs.missing.NAType。我想用NaN替换它们，使用np.nan。我看到了一些问题，在使用<NA>时，可以替换pd.read_csv()的实例。但是，由于我的Pandas DataFrame是从火花DataFrame创建的，所以我不使用pd.read_csv()函数。请指点。

浏览 4提问于2021-09-27得票数 5

1回答

FInd数据帧中的第一个非零元素

、、

我正在处理一个pyspark dataframe，并尝试查看是否有一种方法可以提取spark dataframe中第一个非零元素的索引。我自己添加了索引列，因为pyspark不支持它，而不是pandas。

浏览 29提问于2021-10-08得票数 0

2回答

熊猫:南->零

、、、

将nan转换为nan，null转换为None。正如在中解释的那样，这有时不是最优的。有办法将所有nan转换为None吗？(在pandas或以后的Python中) 例如， >>> df = pd.DataFrame({"a":[1,None],"b":[None,"foo"]}) >>> df a b 0 1.0 None 1 NaN foo >>> df.to_dict() {'a': {0: 1.0, 1: nan}, 'b':

浏览 1提问于2018-01-25得票数 7

回答已采纳

3回答

如何保持只有“单元格”有一个特定的文本在一个数据？

、、

我很想知道是否可能只保留在dataframe中有特定文本的“单元格”，例如，如果我有以下数据格式： import pandas as pd import numpy as np df = pd.DataFrame(np.array([['12hello2', '12hey2', 'hello', '12hey2', '1hello'], ['12hey2', '12hey2', 'hello', '1hello', '1hello'

浏览 4提问于2020-04-27得票数 3

回答已采纳

1回答

计数具有一定数量的NaN可接受的连续值

、、

对于计算满足条件的连续值，有几个很好的答案，但我似乎找不到一个也允许一定数量的NaN的答案。例如，采用以下数据帧： Date Val1 1900-01-01 NaN 1900-01-02 10 1900-01-03 11 1900-01-04 13 1900-01-05 NaN 1900-01-06 NaN 1900-01-07 17 1900-01-08 2 1900-01-09 NaN 1900-01-10 NaN 1900-01-11 2 1900-01-12 5 19

浏览 10提问于2020-04-16得票数 1

回答已采纳

1回答

如何在熊猫数据框中进行分组t-test？

、、

我有一个相当大的熊猫数据框，有很多列。数据帧包含两个组。它的基本设置如下： import pandas as pd csv = [{"air" : 0.47,"co2" : 0.43 , "Group" : 1}, {"air" : 0.77,"co2" : 0.13 , "Group" : 1}, {"air" : 0.17,"co2" : 0.93 , "Group" : 2} ] df = pd.DataFrame(csv) 我想对air和co2

浏览 8提问于2017-07-10得票数 4

回答已采纳

2回答

Pandas:通过创建索引来加速过滤？

、

我想把像SQL这样的pandas应用程序用于web应用程序(而不是将数据保存在pSQL中，而只是将其保存在pandas DataFrame中，因为数据不到1 1GB，并且不会经常变化)。如果我基于列上的多个过滤器进行查找(例如，age > x，age < y，income > p，income < q)有什么方法可以加快过滤速度吗？或者它已经在下面完成了。在SQL中，一个人会声明一个关于年龄和收入的索引来加速这样的查询，我想知道pandas做这件事的方式是什么。

浏览 0提问于2013-02-06得票数 3

回答已采纳

1回答

将熊猫数据中的最后2个数值逐行替换为NAN的

、、、

我的每一行数据中的最后两个实数都是用误差测量的。我想用np.NAN替换它们。实数的数目随行而异(也就是说，每行已经有不同数量的NAN)。列标题表示测量号，索引是一个在单元格中的实验trial.Values，等于测量读数。有些试验的测量读数比其他的要多；因此，有些行的测量读数比其他的多。下面的代码创建了一个类似于我的数据框架。 import pandas as pd import numpy as np data = np.array(([1,2,3,4,5,2,np.NaN], [2,2,3,2,3,np.NaN,np.NaN],[4,4,5,1,np.NaN,np.

浏览 0提问于2018-04-24得票数 2

回答已采纳

1回答

使用Dask DataFrame loc更改列值

、、、

我有一个巨大的数据库，我需要根据一定的条件更改列的值。在Pandas中，我执行以下代码来完成我想要的： df.loc[ (df['ID_CRITERIO_APURACAO'] == TipoDestinatario.RESIDENCIAL.value) & (df['CODG_GRUPO_TENSAO'] == 8) & (df['CONSUMO'].between(0, 30)), 'DESCONTO' ] = 35 我如何在Dask中做类

浏览 1提问于2019-08-08得票数 0

1回答

从pandas df中删除值并向上移动剩余的值

、

我有一个包含分类数据的数据帧。我提供了一个过程，只保留所需的类别，同时在删除的值的空单元格中向上移动剩余的类别。但如果可能的话，我想在没有列表中介的情况下这样做。 import pandas as pd mydf = pd.DataFrame(data = {'a': [9,6,3,8,5], 'b': [4, 3,5,6,7], 'c': [5, 3,6,9,10] }

浏览 46提问于2021-06-07得票数 0

回答已采纳

1回答

如何将pyspark数据帧拆分成多个记录数相等的数据帧

我有一个pyspark数据帧，我想把它分成多个相等记录的数据帧。我在AWS EMR上执行此任务，不支持pandas或numpy。

浏览 22提问于2019-12-22得票数 0

1回答

Read_json填充空列表；如何删除这些行

、

我已经用pd.read_json()创建了一个Pandas。当我读到它时，我会得到一些只有空列表或空列表的单元格，并且我希望在某些列中检测到那些[]行，没有行。例如： feat 1 feat 2 feat 3 0 [] [] 5 1 6 8 3 2 None 10 NaN 我希望删除行0和2，因为它们没有/NaN/空列表。我怎么能和潘达斯一起这么做？

浏览 7提问于2014-03-02得票数 5

回答已采纳

2回答

Python/Pandas替换列函数中的值

、

**使用Pandas 1.4.2，Python 3.9.12 我有一个数据集，其中列值表示为0或1，分别代表“否”和“是”。 Scholarship Hipertension Diabetes Alcoholism SMS_received 0 0 1 0 0 0 1 0 0 0 0 0 2 0 0

浏览 9提问于2022-07-07得票数 1

14回答

将Pandas或Numpy Nan替换为None以与MysqlDB一起使用

、、、

我正在尝试使用MysqlDB向mysql数据库中写入一个Pandas数据帧(或者可以使用numpy数组)。MysqlDB似乎不理解' nan‘，我的数据库抛出一个错误，说nan不在字段列表中。我需要找到一种方法将'nan‘转换为NoneType。有什么想法吗？

浏览 1提问于2013-01-05得票数 206

回答已采纳

7回答

为具有特定值的单元格获取Pandas中的行和列

、、

我正在尝试读取使用Pandas未格式化的Excel电子表格。在一个工作表中有多个表，我希望将这些表转换为dataframes。由于它还没有按传统方式进行“索引”，因此没有有意义的列或行索引。是否有一种方法可以搜索特定的值并获取该行、列所在的位置？例如，假设我想为包含字符串"Title“的所有单元格获取行、列号。我已经尝试过像DataFrame.filter这样的东西，但是只有在有行和列索引的情况下才能起作用。

浏览 0提问于2018-12-19得票数 7

回答已采纳

1回答

Python和C为算法返回不同的值

、、

我正在尝试用python为Tausworthe随机数生成器实现以下c代码。代码需要生成0到1范围内的随机数，c代码如下： #include <stdint.h> #include <stdio.h> /**** VERY IMPORTANT **** : The initial seeds z1, z2, z3, z4 MUST be larger than 1, 7, 15, and 127 respectively. ****/ #define SEED 987654321 static uint32_t z1 = SEED, z2 = SEED,

浏览 15提问于2019-08-10得票数 0

回答已采纳

1回答

用修改后的DataFrame ()行替换原始.copy()行:将.copy()结果与原始DataFrame合并

、、、、

我使用了一个大型DataFrame (称为'df')的一部分，其中包含了.copy() (命名为'df_copy')，并应用了某些函数来创建一个新列‘df_copy’。但是，我也给出了一个名为“类别”的列，并为该列分配了一些其他值。“df_copy”中的所有其他值/列都与‘df’中各自的值/列相同:唯一的区别是“类别”列。为了理解，原始DataFrames： df为100行，有3列。 df_copy是df中的5行，具有相同的列。处理后： df为100行，4列(新列为“类别”)，其中5行为“类别”列的“NaN” df_copy是5行

浏览 0提问于2019-07-11得票数 0

回答已采纳

1回答

Python/Pandas向列中包含特定次数字符的行添加字符串

、、、、

我有一个Pandas DataFrame(data)，它的“持续时间”列作为'object‘类型，它的时间持续时间为'H:%M:%S’，比如'1:47:54‘，有7个字符，但也有几分钟的’'%M:%S‘’，比如'45:20‘或'03:20’，有5个字符。，我想将本专栏转换为Pandas 。但是，我似乎需要在列中有相同长度字符的所有行，因为当我尝试这样做时： data['Duration'] = pd.to_timedelta(data['Duration']) 我得到："ValueError:预期的hh

浏览 4提问于2022-04-28得票数 1

回答已采纳

3回答

如何通过查找和替换带条件的数据帧中的值进行更新？

、、

我的目标是根据其他列中的条件查找和替换特定列中的值。并根据具体行进行替换。让我们举个例子： import pandas data = [['red', 'not done'], ['red', 'not done'], ['green', 'not done']] df = pandas.DataFrame(data, columns = ['color', 'status']) print(df) 我们有自己的输出DataFrame： color

浏览 6提问于2019-12-11得票数 1

回答已采纳

2回答

如果'value‘在pandas Python列表中，则获取列名

、、

如果列名包含COMPLETE、UPDATED和PARTIAL中的一个，我需要查找列名这是我的代码，不能工作。 import pandas as pd df=pd.DataFrame({'col1': ['', 'COMPLETE',''], 'col2': ['UPDATED', '',''], 'col3': ['','PARTIAL','']

浏览 10提问于2020-04-21得票数 0

回答已采纳

1回答

基于单行输入的熊猫df中的连续循环

、、

我有一个相当大的数据，包含的数据是‘已知’和‘未知’。我正在尝试创建一个for-循环(或一个不同的解决方案)，它迭代一个特定的dataframe列，并在每次找到“已知”值时填充一个值。找到该值后，循环必须填充该值，直到找到下一个已知值为止。在找到这个新的已知值之后，循环填充这个新的已知值等等。我不能删除未知的数据。我目前拥有的for循环能够将已知值追加到其in行，但直到下一个已知值并重复此步骤，我才知道如何填充该值。 import pandas as pd example = [{'A':"Value_01"}, {'A':"unkno

浏览 8提问于2019-10-17得票数 0

回答已采纳

3回答

使用一行交换pandas数据框中所选行的列值，正确的语法是什么？

、

我使用的是版本0.14.1和Python2.7.5，并且我有一个包含三列的数据帧，例如： import pandas as pd d = {'L': ['left', 'right', 'left', 'right', 'left', 'right'], 'R': ['right', 'left', 'right', 'left', 'right', 'left

浏览 0提问于2014-09-12得票数 29

回答已采纳

1回答

系列Vs DataFrame上需要对where()函数进行解释

、

df有A、B、C、D、E列，假设"A“列是一个字符串，其余的是数字。当"B“的值大于100时，返回列"A”的df["A"].where(df[B] > 100).dropna() 我的问题是，df["A"] (它是原始df的视图)没有列" B "，那么如何将"where“子句与B列一起应用。[where()子句应用于df["A"]，而不是整个"df"] df["A"]的类型是一个熊猫系列，即使列"B“上的where()子句如何应用也有点令人困惑。

浏览 0提问于2021-11-21得票数 1

2回答

当通过Pandas中的函数替换NaNs时，索引超出界限

、、、、

我已经创建了一个函数，它用相应列的方法替换了Pandas中的NaNs。我用一个小的dataframe测试了这个函数，它起了作用。但是，当我将它应用到一个更大的数据rows (30,000行，9列)时，我得到了错误消息: IndexError:索引超出界限职能如下： # The 'update' function will replace all the NaNs in a dataframe with the mean of the respective columns def update(df): # the function takes one argument,

浏览 5提问于2017-01-06得票数 2

回答已采纳

2回答

psycopg2 -可接受的日期/日期时间值

、、

我使用psycopg2和sqlalchemy将来自xls文件的数据插入到postgres数据库中。我以前在插入'date‘列时遇到过问题，这些列在excel中被格式化为一个数字。我们在postgres中将这些列定义为date类型。我这里有两个问题: 1.日期列中的一些值是空的。Pandas正在将这些值转换为NaT或NaN，但sqlalchemy和psycopg2无法解析。 df = pd.read_excel(full_path, encoding='utf-8') dict_items = df.to_dict(orient='records') ta

浏览 2提问于2017-01-03得票数 0

3回答

在pandas DataFrame中查找字符串值的索引

、

如何识别DataFrame中包含特定字符串'foo'的列示例DataFrame： >>> import pandas as pd >>> df = pd.DataFrame({'A':[10,20,42], 'B':['foo','bar','blah'],'C':[3,4,5], 'D':['some','foo','thing']}) 我想在这里找到B和D。我可以搜索数字：如

浏览 0提问于2017-09-28得票数 5

回答已采纳

1回答

基于一列将pyspark.sql dataFrame拆分为多个表

、、、

给定一个pyspark.sql.dataframe.DataFrame x：name day earnings revenue Oliver 1 100 44 Oliver 2 200 69 John 1 144 11 John 2 415 54 John 3 33 10 John 4 82 82 是否可以根据名称列(作为索引)将表拆分为两个表，并将这两个表嵌套在同一个对象下(不确定要使用的确切术语)。因此，在上面的示例

浏览 0提问于2018-10-09得票数 0

1回答

如果dataframe元素不同，则分配值

、、、

以下R命令的等效Python/Pandas是什么？ matrix1[!matrix2] <- 0 目标是比较两个矩阵，如果元素是不同的，应该分配一个零。

浏览 5提问于2014-03-18得票数 2

回答已采纳

1回答

熊猫只在至少有一个非南值的行上填充。

、、、

假设我有一个像这样构造的DataFrame： import pandas as pd import numpy as np df = pd.DataFrame(data = {"col1":[3, np.nan, np.nan, 21], "col2":[4, np.nan, 12, np.nan], "col3":[33, np.nan, 55, np.nan]}) 看起来是这样的： col1 col2 col3 0

浏览 0提问于2018-05-24得票数 0

回答已采纳

1回答

如何遍历df的每一行/列以查看0或“”是否存在？

、、

我有一个主df，我想遍历每一行和每一列，检查0和''。我需要输出出现这种情况的行。问题是，一个是int，另一个是str。因此，我为所有的cols列和str分别设置了调用int和str的子集。我是否可以同时检查整个df中的str和int，还是需要单独检查？这是我的密码： cols = ['ID', 'Line Manager Id', 'Project ID'] df_strings = ['Email', 'Name', 'Department'] i = 0 k = 0 for

浏览 1提问于2019-05-19得票数 2

2回答

用None的元组替换Pandas数据框架中的所有None

、

因此，我正在为NLP应用程序编写一些代码。堆栈溢出上的从不等长度的列表中创建数据。从该解决方案中提取代码，并在输入中使用元组： import pandas as pd import itertools aa = [('aa1',4), ('aa2',3), ('aa3',2), ('aa4',2), ('aa5',1)] bb = [('bb1',8), ('bb2',6), ('bb3',4), ('bb4',4)] cc = [('cc1

浏览 4提问于2017-12-05得票数 2

回答已采纳