Pandas df:当条件为真时对整行求幂_Python:当条件为真时添加键值对_当条件为真时，Pandas将数据帧拆分为多个 - 腾讯云开发者社区

python、pandas、dataframe

? 在上面的数据框中，我试图使用pandas将最后一列中的NaN和负值替换为0，我在这里使用了一些建议，但这似乎也会影响其他列，并将其他列中的值替换为零。如何将其限制为只显示选定的列

浏览 211提问于2021-08-25得票数 0

2回答

根据条件删除dataframe中的行，dataframe vs list boolean？

python、pandas

import pandas as pd data = [['a',1],['b',2],['c',3]] df = pd.DataFrame(data, columns = ['letter', 'number'] exclude_list = [2, 4, 6] 我想将df中的第2行(其中“==”为2)更改为空/nan。我希望通过将"number“列与排除列表进行比较来实现此目的，如果存在匹配，则排除该行。

浏览 0提问于2020-08-24得票数 2

1回答

如何保留熊猫羊羔的原始细胞价值？

python、pandas

我是刚认识潘达斯的。如果不满足条件，我将尝试保留每行的原始单元格值。代码： import pandas as pd df = pd.read_csv('file.txt', sep = '\t') df['New_Value'] = df['Old_Value'].apply(lambda x : 'OK' if x == 'Low' else x[df.Old_Value])

浏览 1提问于2022-01-20得票数 0

3回答

熊猫numpy错误:ValueError:带有基数10的int()的无效文字

python、pandas、dataframe、numpy

我有一个dataframe，您可以通过以下代码获得它： import numpy as np import pandas as pd from io import StringIO pd.set_option('display.max_columns', None) pd.set_option('display.max_rows', None) df4s = """ contract RB BeginDate 0 A00118 46 20120705 1 A00118 47 2012

浏览 6提问于2022-01-05得票数 0

回答已采纳

1回答

循环遍历熊猫数据框架并创建新的列值

pandas

我试图循环一个csv文件，我把它转换成一个熊猫数据帧。我需要循环遍历每一行，并检查我拥有的纬度和经度数据(两个单独的列)，并根据lat、长数据是否在某个范围内，将代码(0、1或2)附加到同一行。我对python有点陌生，我希望您能提供任何帮助。这让我犯了不少错误。 book = 'yellow_tripdata_2014-04.csv' write_book = 'yellow_04.csv' yank_max_long = -73.921630300 yank_min_long = -73.931169700 yank_max_lat = 40.832

浏览 1提问于2015-11-16得票数 1

回答已采纳

2回答

Python Pandas to_csv有最大行数吗？

python、pandas、export-to-csv

我正在尝试将文本文件导出到csv。该文件非常大(160万行)以制表符分隔的文件。当我使用to_csv导出文件时，它只导出1048576行。to_csv导出的行数是否有最大值？我应该以不同的方式导出数据吗？我真的希望能够把它放到csv中。下面是我的代码示例。 import pandas as pd import numpy as np import os from pandas import Series, DataFrame pathDataEDM = "C:/Users/FILE.txt" dataEDM = pd.read_csv(pathDataEDM, sep

浏览 0提问于2017-04-25得票数 1

3回答

计算托管价值的最有效方法

python、python-2.7、pandas、numpy、scalability

我根本不是熊猫专家。我是个普通的开发人员。我想计算一个托管值。我有一个df，它是每天的市场价格(以日期为索引)和dfTrend，它是0和1，具有相同的指数。我希望将这两个数据帧发送到函数并获得管理值，这意味着当趋势为零时，我希望管理值保持不变，而当趋势为1时，我希望值增加并跟随市场价格。例如：我的代码运行良好，但速度非常慢： def getManagedValue(df, dfTrend): dfReturn = df.pct_change(1) dfManaged = df for col in df: for i in range(1

浏览 1提问于2017-05-18得票数 1

2回答

与Pandas行操作相关的查询

pandas、data-cleaning、numpy

我有一个关于Pandas数据操作的查询。假设我有一个具有以下结构的dataframe，df。 A B C 1 1 7 5 3 3 3 3 2 7 5 2 5 NaN 2 我们在数据A，B& C中有3列。 B列由平均值wrt A组成。例如, B在第3行(即3)是A (9/3)的前3行的平均值，同样，B在第4行的值=(A的第2、第3和第4行的值之和)/3 现在，假设B中有许多NaN值，而A中没有NaN值，那么如何按照上面讨论的逻辑编写函数或代码来填充NaN值呢？我试过使用loc和iloc，但我想我犯了一些错误。

浏览 0提问于2020-11-09得票数 0

回答已采纳

3回答

删除pandas数据帧中不满足条件的行

python、pandas

我有一个pandas数据帧，需要清理Status列。我的数据如下所示： id Status 123 100% 124 0% 125 1% 126 100% 127 0.25% 我想排除所有不是100%或0%的行。该列的类型为object 我希望我的数据是这样的： id Status 123 100% 124 0% 126 100% 我尝试过以下几种方法： df = df.drop(df[(df.Status == '100%') & (df.Sta

浏览 9提问于2020-03-04得票数 2

回答已采纳

2回答

尽管指数看起来是正确的，但熊猫应用了返回索引错误

python、pandas、indexing、apply

我得到了一个索引错误，我不知道如何修复它：IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match).，我不明白它为什么要抛出这个错误，因为display()调用中显示的索引是一致的。我尝试了答案中的双括号，但没有起作用。下面的可重复示例基于一个严重简化的真实代码版本。在最后一行中抛出错误。使用Python 3.7。 import pandas as pd def myfcn(row,

浏览 5提问于2021-02-09得票数 1

回答已采纳

1回答

潘达斯中的".apply()“对第k次论证

python、pandas、dataframe

我想应用我自己的多参数函数到Pandas数据帧(或内部的一个系列)，使用数据帧条目作为我的N-参数函数中的第k个参数。只有当我将dataframe作为第一个参数传递时，它才会起作用。我希望能够通过另一个参数传递数据。 # A simple 3 argument function: def my_func(a, b, c): return (a/b)**c # Data-Frame: d1 = { 'column1': [1.1, 1.2, 1.3, ], 'column2': [2.1, 2.2, 2.3, ] } df = pd.D

浏览 1提问于2019-09-17得票数 0

2回答

在ES7中使用求幂运算的逆蕴涵逻辑？

javascript、boolean-logic、boolean-expression、short-circuiting、ecmascript-2016

根据这个，我们知道 console.log(false ** false == true); // true console.log(false ** true == false); // true console.log(true ** false == true); // true console.log(true ** true == true); // true 我认为我们可以在ES7中通过exponentiation operator实现。给定函数的返回值，f()和g()为boolean。所以我们可以使用这个简单的代码 if (g() ** f()) { // }

浏览 0提问于2015-11-23得票数 1

1回答

不可哈希类型:系列时，使用modin与熊猫？

python、pandas、dask、modin

我在Windows 10上的Anaconda中；我通过以下方式安装： conda install -c anaconda dask conda install -c conda-forge modin conda update conda conda update anaconda conda update dask conda install -c conda-forge pandas=1.0.5 # this will also download modin 0.7.4-py_0 --> 0.8.0-py_0 因此，考虑以下示例： #!/usr/bin/env python3

浏览 20提问于2020-10-26得票数 0

回答已采纳

1回答

无法删除数据集中的列

python、pandas、dataframe

当我试图从我的数据框中删除列"Header=“时： #import data for path in filepaths: df = pd.read_csv(r"{}".format(path), header=6, sep="delimiter", engine="python") #delete column "Header=" del df['Header='] 我得到了这个错误： File "pandas\_libs\index.pyx", line 111

浏览 76提问于2020-07-17得票数 1

回答已采纳

7回答

修改pandas数据帧中的行子集

python、pandas

假设我有一个包含两列的pandas DataFrame，A和B。我想修改这个DataFrame (或者创建一个副本)，这样每当A为0时，B总是NaN。我该如何做到这一点？我尝试了以下几种方法 df['A'==0]['B'] = np.nan 和 df['A'==0]['B'].values.fill(np.nan) 没有成功。

浏览 0提问于2012-09-07得票数 168

回答已采纳

1回答

如何使用筛选器跨和str_detect一起过滤多列的条件

r、dplyr、tidyverse、stringr、across

我有这样的数据： df <- structure(list(col1 = c("Z2", "A2", "B2", "C2", "A2", "E2", "F2", "G2"), col2 = c("Z2", "Z2", "A2", "B2", "C2", "D2", "A2", "F2" ), col3 = c("A2"

浏览 2提问于2021-09-08得票数 1

回答已采纳

1回答

如何使用Python根据另一列中的某些值在Pandas DataFrame中创建新列？

python、pandas、dataframe、if-statement

我仍然在学习Python和Pandas，可能需要一些帮助。我想在现有的DataFrame中创建一个新列。当前DataFrame： bballData = {'Name':['Joel', 'Cole', 'Duncan'], 'Team':['PHI', 'ORL', 'MIA'], 'Home':['PHI', 'PHI', 'MIA'], 'A

浏览 4提问于2022-01-20得票数 0

回答已采纳

1回答

熊猫数据“全真实”标准

python、pandas

Python 2.7，Pandas 0.18。我有一个DataFrame，还有一些方法可以通过一个条件参数来选择行的子集。我想知道一种更惯用的方法来编写与所有行匹配的条件。下面是一个非常简单的例子： import pandas as pd def apply_to_matching(df,criterion): df.loc[criterion,'A'] = df[criterion]['A']*df[criterion]['B'] df = pd.DataFrame({'A':[1,2,3,4],'B

浏览 3提问于2016-10-27得票数 1

回答已采纳

2回答

否则使用Numpy和Pandas

python、numpy、pandas

在搜索了几个类似问题的论坛后，似乎有一种快速迭代条件语句的方法是在Pandas上使用Numpy的np.where()函数。我在执行以下任务时遇到了问题：我有一个数据集，它看起来像几行： PatientID Date1 Date2 ICD 1234 12/14/10 12/12/10 313.2, 414.2, 228.1 3213 8/2/10 9/5/12 232.1, 221.0 我正在尝试创建一个条件语句，以便： 1. if strings '313.2' or '414.

浏览 3提问于2016-01-05得票数 4

1回答

从另一个文件中获取大熊猫的价值

python、pandas

我有一个小样本数据集： import pandas as pd df = {'ID': ['H576','H577','H578','H600', 'H700'], 'CD': ['AAAAAAA', 'BBBBB', 'CCCCCC','DDDDDD', 'EEEEEEE']} df = pd.DataFrame(df) 看上去： Out[76]: CD ID 0 AAAAAA

浏览 3提问于2016-06-03得票数 1

回答已采纳

1回答

求布尔表达式

java、computer-science

我很难理解这个问题的答案，并希望得到更有经验的Java从业者的意见。只有当布尔表达式 A、B、和 C 都为false?时，以下哪一项才能计算为真？ (A) !A && !(B && !C) (B) !A || !B || !C (C) !(A || B || C) (D) !(A && B && C) (E) !A || !(B || !C) 我的答案是D，因为我觉得所有的布尔表达式都是假的，但答案是C。答案解释 (C)为了使!(A || B || C)为真，(A || B || C)必须计算为false。只有在A、B和C都是

浏览 0提问于2013-11-28得票数 0

回答已采纳

1回答

获取数据帧熊猫的索引值

python、pandas

我正在尝试获取pandas中数据帧中元素的索引值。我从数据库中获取两个值(日期和价格)，并使用pandas放入dataframe。我找到了如何找到价格的最小和最大值，但是对于那些我想知道的值，打印出来是哪一天。我试着使用numpy where函数，但我无法理解它。我很抱歉。这是我的代码。谢谢。。 import sqlite3 import pandas as pd import numpy as np conn = sqlite3.connect('price_daily.sqlite') cur = conn.cursor() tables_prices='

浏览 8提问于2018-02-19得票数 1

2回答

pandas用函数返回的值替换0

python、pandas

我的熊猫数据帧中有一堆零。我想用函数返回的值替换它们。我正在使用fillna做类似的事情。以下是我的代码的一个简化版本，以实现可重复性： import pandas as pd import numpy as np def replace(x): v = x * 2 return v df = pd.DataFrame({'col1': [1,np.nan,0], 'col2': [1,2,3] }) df['col1'].replace(0, valu

浏览 1提问于2021-11-15得票数 0

2回答

用python中的迭代器范围进行迭代

python、pandas

在这个数据文件中，我想迭代3行。 df = pd.DataFrame(index=range(0, 43), columns=['slow', 'fast', 'p']) df.slow = 5 df.fast = [ 2,2,2,3,3,3,3,3,4,4, 5,6,6,4,5,6, 6,5,4,5,6,6,7, 7,7,6,5,5,4,5,6,6,7, 8,8,9,8,7,7,7,7,7,7 ] df.p = [ 1,1,1,1,2,

浏览 2提问于2021-06-17得票数 1

回答已采纳

1回答

从va_arg宏理解"(sizeof(t) & (sizeof(t) - 1)) != 0“

c、types、binary、sizeof

当查看va_arg宏的代码(使用MSVC)时，我看到了这个if va_arg部分。 ((sizeof(t) > sizeof(__int64) || (sizeof(t) & (sizeof(t) - 1)) != 0) ? ... : ... 虽然我理解第一部分的含义，根据我对二进制和尺寸的理解，第二部分似乎总是错误的。是否有满足此子表达式条件的数据类型： (sizeof(t) & (sizeof(t) - 1)) != 0

浏览 2提问于2022-06-06得票数 2

1回答

如何从数据帧中删除异常值？

python、statistics、data-science、outliers

我有一个(268X4) df，并找到了一列的异常值(22,1)。我想从df中删除这些异常值。我该怎么做？ > df=df_nonull import pandas as pd # to manipulate dataframes import > numpy as np # to manipulate arrays > > # a number "a" from the vector "x" is an outlier if > # a > median(x)+1.5*iqr(x) or a < median

浏览 0提问于2017-05-26得票数 0

2回答

DataFrame应用中的Lambda函数

pandas、dataframe、apply

我在Pandas中有以下DataFrame： import pandas as pd import numpy as np df = pd.DataFrame([(1, 1, 1, 0), (2, 0, 0, 2), (3, 0, 1, 3), (4, 5, 3, 0)], columns=list('abcd')) 我需要在该DataFrame中实现以下函数： ? 我正在尝试使用下面的apply()函数： dfs =

浏览 57提问于2021-11-10得票数 0

1回答

如何计算任意24小时内列值的最大增量？

python、pandas

我有一个Pandas DataFrame，其中包含一组患者的实验室测试：对于每个患者，我想要计算在任何24小时内实验室值的最大增长。我正在寻找一种很好的方式来使用Pandas来做这件事。在上面的示例中，CHARTIME列是datetime对象(不一定按排序顺序)，而VALUE列是我感兴趣的实验室测试(假设所有单元都相同)。对于上面示例中的SUBJECT_ID = 3，可以在下面看到上面给出的每个时间的实验室测试值的增加，并且在任何24个周期内的最大增加将是0.2。 BASELINE | INCREASE (24hr) --------------------+

浏览 9提问于2019-10-26得票数 0

1回答

使用pandas dataframe查询sql

python、pandas、dataframe

我尝试使用pandas dataframe来检索结果，以获得相同的结果这是我的SQL查询： SELECT strftime('%m', date_report) as month, count(*) as total_infector from cases where has_travel_history = 't' and age >= '50' group by month order by total_infector desc limit 2 使用pandas数据帧： import pandas as pd df = pd

浏览 4提问于2020-09-01得票数 0

2回答

为什么任何()和pd.any()返回不同的值？

python、pandas、built-in、any

最近我发现内置函数any()对熊猫数据不起作用。 import pandas as pd data = pd.DataFrame([True, False]) print("base: " + str(any(data))) print("pandas: " + str(data.any())) 结果： base: False pandas: 0 True dtype: bool 有人能解释一下这种行为背后的逻辑吗？

浏览 5提问于2020-09-24得票数 1

回答已采纳

2回答

根据条件在潘达斯系列中分配值？

python、pandas、dataframe、series

我有一个数据格式的df就像 A B 1 2 3 4 然后我想要创建两个新的系列 t = pd.Series() r = pd.Series() 我能够使用条件t为cond赋值，如下所示 t = "1+" + df.A.astype(str) + '+' + df.B.astype(str) cond = df['A']<df['B'] team[cond] = "1+" + df.loc[cond,'B'].astype(str) + '+' + df.loc[cond,

浏览 2提问于2016-02-13得票数 2

回答已采纳

1回答

Pandas -如何根据列之间的逻辑创建新列

python、pandas

我有一个熊猫DataFrame的能源价格在一个国家的天数，在能源购买的价格取决于能源的报价，即如果有一个低报价价格将增加，反之亦然。为了避免能源股票市场的崩溃，政府定义了一些称为激活价格的值，这些值是根据国家过去几天生产的能源的平均值计算出来的，如果能源股票市场的价格超过了这个激活价格，那么购买能源的价格就是所谓的短缺价格，这意味着出价真的很低。我需要创建一个pandas列，其中包含出售能源的真实价格，这意味着检查能源的能源股票市场价格是否高于激活价格，以将价格设置为短缺价格，或者如果价格低于激活价格，则实际价格将是能源股票市场。pandas数据帧如下所示： Fecha Precio

浏览 13提问于2021-10-06得票数 0

回答已采纳

1回答

对数据帧中的一行条件进行外部处理

python、pandas、dataframe

我慢慢地发现，当我在数据帧中工作时，一切都变得更快了，我必须计算新的值，也必须在数据帧中。但是，如果我想用if语句逐行遍历dataframe中的一列，并打印出该行，如果该语句为真，该怎么办？那么我是否必须使用for循环，或者我也可以在dataframe上这样做。 3.我还没有解出来，所以我再试一次 for ticker in tickers: df = pd.read_csv('calcuatet_daily_stock_dfs/' + ticker + '.csv') df = df.tail(1)

浏览 2提问于2019-12-16得票数 1

3回答

如何有条件地从pandas数据帧中删除重复项

python、pandas、dataframe、duplicates

请考虑以下数据帧 import pandas as pd df = pd.DataFrame({'A' : [1, 2, 3, 3, 4, 4, 5, 6, 7], 'B' : ['a','b','c','c','d','d','e','f','g'], 'Col_1' :[np.NaN, 'A','A&#

浏览 3提问于2017-08-28得票数 14

回答已采纳

2回答

Python转换列数据类型

python、python-2.7、csv、pandas

我知道这样的问题已经问了无数类型，但到目前为止我还没有找到这个问题的答案。我已经将两个.csv文件与Pandas连接在一起，现在我想在新的.csv文件中添加更多的列，并根据已经可用的数据计算值。但是，我一直收到这样的错误： "The truth value of a is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all()." 显然，这似乎是我的列(全部是整数)的数据类型的问题，但我还没有找到一种将该列设置为整数的方法(有效)。这是我的代码： import pandas def nscap(ns)

浏览 1提问于2016-09-26得票数 1

回答已采纳

1回答

loc方法来更新现有列一致性中的值？

python-3.x、pandas、dataframe

我有一个数据帧的玩具示例： import pandas as pd df = pd.DataFrame({'a':[1, 2, 3, 4, 5], 'b':['aa', 'bb', 'cc', 'dd', 'ee']}) 下面是我正在做的事情： df.loc[df.a < 3, 'a'] = df.a * 0.95 请建议熊猫如何“知道”将df.a调整为仅前2行(输出将是a列的前2行(0.95，1.90)？ a b 0 0.95

浏览 9提问于2021-03-30得票数 1

回答已采纳

1回答

为什么条件子句比较dataframe列会导致错误，即使条件子句本质上是布尔的？

python-2.7、pandas、if-statement、dataframe

在验证了一些逻辑之后，我试图构建一个比较数据some中两列的逻辑。这是我的代码，它从gdax.com中提取加密货币数据的历史利率。我申请的测试条件是‘如果df.column 4大于df.column4和df.column3之和，那么购买10%的帐户。’ import GDAX import pandas as pd import numpy as np public_client = GDAX.PublicClient() ticker_call = public_client.getProductHistoricRates(product='LTC-USD') df =

浏览 0提问于2017-07-04得票数 0

回答已采纳

1回答

循环遍历指定范围内的python日期时间( TypeError )。

python、python-2.7、datetime、for-loop、typeerror

我希望在t_list指定的时间段内每10分钟创建一个散点图。我在行TypeError: cannot compare a dtyped [datetime64[ns]] array with a scalar of type [bool]中得到了错误df_t = df[(df['datetime']>=t & df['datetime']<t_end)]，但是t和t_end的类型都是datetime。这些变量中的非类型为bool。 import pandas as pd import matplotlib.pyplot as

浏览 4提问于2019-10-17得票数 0

回答已采纳

1回答

基本Python查询

python、pandas

有人能在下面的语法方面帮助我吗？我有一个pandas.DataFrame df，希望执行： if (df['Contract_Stage'] == "Stage 1"): df['DaysToContractEnd'].fillna(600, inplace=True) elif(df['Contract_Stage']=="Stage 2"): df['DaysToContractEnd'].fillna(350, inplace=True) elif(df['Contract_

浏览 3提问于2017-03-03得票数 1

回答已采纳

3回答

按列值求行索引

python、pandas

我有以下数据： date value 0 2016-01-01 gfhgh 1 2016-01-02 acgb 2 2016-01-03 yjhgs 我需要得到一个行的索引，其中日期是一个预定义的值。例如，2016-01-02，我需要得到一个。每个日期都是独一无二的。

浏览 2提问于2016-01-12得票数 4

回答已采纳

1回答

For循环for dataframe，使用更有效的方法

python、dataframe、loops、for-loop

如果第2列为False，我想用i-1转换列1，然后逐行迭代。如何在不使用for循环的情况下以有效的方式完成这一操作，下面可以看到for循环的示例： import pandas as pd data_lamination = pd.DataFrame() data_lamination['loss'] = [0.1,0.2,0.3,0.4,0.5] data_lamination['nominal_wall_thickness'] = 1 data_lamination['flaw_distance'] = [10,0.2,0.3,0.4,0.

浏览 0提问于2020-11-20得票数 0

回答已采纳

1回答

熊猫DataFrame的t检验独立性

python、pandas、statistics

我想用二进制目标变量计算熊猫scipy.stats.ttest_ind()中的数字列的DataFrame。 import pandas as pd from scipy import stats def calculate_tStatistic(df, target, numeric_cols): """ Calculate the t-test on TWO RELATED samples of scores, a and b. This is a two-sided test for the null hypothesis that 2

浏览 0提问于2021-03-10得票数 1

回答已采纳

1回答

创建自定义参数以查找pandas数据帧中的异常值

python、pandas、dataframe、outliers

我有2个数据帧是我用熊猫构建的。如果你看下面的图表，你可以看到我的两个数据框遵循几乎相同的数据模式。当我的数据超出某个参数时，我想让pandas告诉我。例如:假设我想知道x轴上的数据何时低于2，或者y轴上的数据何时大于4。我知道我可以让pandas使用标准偏差曲线消除异常值，我还可以将异常值打印到excel文件中。但这对这些数据不起作用，我不想删除任何数据，我只想知道所有异常值在哪里。我试过创建一个像这样的df4[(df4 < 2) | (df4 > 4)]布尔索引，但这只是擦除了小于2和大于4的数据值。我的问题是:我如何设置自己的参数来确定使用pandas而不删除数据的异常值？

浏览 3提问于2017-08-07得票数 0

回答已采纳

2回答

如何通过列值唯一地标识csv中的行，然后检查另一列中的“已通过”关键字并将其打印出来

python、pandas、python-2.7、csv、parsing

我有一份CSV文件 APIName_UniqueId,TC_Status,Comment 123456,PASSED,API "123456_Get Download Credential_1" is PASSED 123457,PASSED,API "123457_Get Upload Credential_1" is PASSED 我想检查APIName_UniqueId和注释是否有"Passed“关键字。如果这两个条件都符合，我想打印注释，否则打印失败的语句。我试着使用这个脚本，但它不起作用， import pandas as pd df

浏览 0提问于2019-09-05得票数 1

2回答

检查Pandas中的单个单元格值是否为NaN

python、pandas、nan

我只想检查Pandas序列中的单个单元格是否为空，也就是检查某个值是否为NaN。所有其他答案都适用于序列和数组，但不适用于单个值。我试过pandas.notnull，pandas.isnull，numpy.isnan。是否有仅针对单个值的解决方案？

浏览 50提问于2015-01-03得票数 40

回答已采纳

2回答

Pandas:按分隔符拆分列，并根据其他列重新排列

python、pandas、filter、group-by、split

假设df是一个数据帧。 In [1]: import pandas as pd ...: df = pd.DataFrame(columns = ['Home', 'Score', 'Away']) ...: df.loc[0] = ['Team A', '3-1', 'Team B'] ...: df.loc[1] = ['Team B', '2-1', 'Team A'] ...: df.loc[2] = ['Te

浏览 14提问于2020-07-12得票数 2

回答已采纳

3回答

如果假在熊猫中，则为布尔值系列

python、pandas、if-statement、boolean、logic

我刚接触过python，我发现我的很多问题都已经得到了解答。在7年的各种语言编码中，我从来没有在这里发布过一个问题，所以这次我真的很困惑。我在用python 3.6 我有一只熊猫数据，它的列就是布尔值。我有一些代码，只有当本列中的所有行都是True时，才执行这些代码。在我的代码的其他地方，我使用了： if True not in df.column: 要识别df中的一个行(如果不是一个行)，则为True。这个很好用。但是，由于某种原因，逆流不起作用： if False not in df.column: 标识df中的所有行是否为True。即使这样也会返回False： import pa

浏览 0提问于2018-01-21得票数 0

回答已采纳

2回答

和熊猫相比，我是否必须背离PEP 8风格的惯例？

python、pandas、pep8

在根据条件更改dataframe列时，我习惯于这样做(在本例中，每个妇女的工资为200英镑)。 import pandas as pd df = pd.DataFrame([[False,100],[True,100],[True,100]],columns=['female','wage']) df.loc[df['female'] == True,'wage'] = 200 PEP 8样式的约定检查器(在Spyder中)建议在第3行中：与True的比较应该是'if cond is True:‘或'if co

浏览 2提问于2018-07-12得票数 2

回答已采纳

1回答

Numpy.where使用pandas列提升KeyError

python、pandas、dataframe、numpy

我正在处理不完整的数据，这些数据围绕着不同数据结构的文件进行拆分。因此，我用np.where编写了一个脚本来检查列名中是否有键，以及是否在df中写入em。我在np.where中使用了pandas，它提高了KeyError。示例： df['col_result'] = np.where('col1' in df.columns, df['col1'], 'None') KeyError Traceback (most recent call last) ~\ana

浏览 29提问于2021-10-13得票数 0

2回答

根据标签集合中的成员资格过滤pandas DataFrame

python、pandas、filter

假设我有一个包含一个标签列表或一组标签的DataFrame，我想根据某个标签是否是此行的一部分来过滤这个DataFrame，使用pandas实现这一点最常用的方法是什么？ import pandas as pd df = pd.DataFrame({ 'amount': [15, 20, 40], 'tags': [["Food", "Eating Out"], ["Food", "Groceries"], ["Clothes"]], 'descri

浏览 28提问于2015-01-07得票数 5

回答已采纳