带有else条件的Pandas数据帧.loc_pandas数据帧: loc与查询性能_带有条件的Pandas数据帧操作 - 腾讯云开发者社区

python、pandas

我有一个数据帧，其中包含一个带有日期的列。一些日期丢失(空)，一些日期在1500年。我只想获取日期在过去10年内或缺少日期的那些行。由于Pandas的时间范围是584年，我这样做是为了避免引发错误： import arrow as ar import pandas as pd df[(pd.to_datetime(df['date'], errors = 'coerce') >= ar.utcnow().shift(days=-3650).date())] 但是，这也删除了缺少日期的行，而我不希望这样。是否有一种方法可以排除超过10年的日期，但不排

浏览 17提问于2019-02-28得票数 0

回答已采纳

1回答

从python函数的dataframe中删除空行

python、pandas、dataframe

我希望在一个巨大的数据帧中找到特定的行，并在满足条件的情况下分配一个注释。我使用的代码部分如下： def check_car(x): if x['CAR'] == 'FERRARI' and x['COUNTRY'] != 'ITALY': return 'This is wrong' else: x.drop() 之后，我使用此函数来创建新的数据框，其中包含ID和注释。新数据帧包含带有“This is wrong”和None值的ID

浏览 1提问于2019-06-12得票数 0

2回答

列子集和过滤器Pandas

python、pandas

如何在一个命令中过滤Pandas数据帧中的行并仅获取pandas数据帧中的列的子集。我正在试着应用像这样的东西... frame[(frame.DESIGN_VALUE > 20) & (frame['mycol3','mycol6']))] 谢谢。

浏览 0提问于2015-10-02得票数 17

回答已采纳

2回答

Pandas条件删除

python、pandas、if-statement、dataframe、conditional-statements

我正在尝试有条件地从pandas数据帧中删除行，使用如下语法： if ((df['Column_1'] == 'value_1') & (df['Column_2'] == 'value_2')): df['Columns_3'] == df['Column_4'] else: df.drop() 提前感谢你的帮助。

浏览 1提问于2017-09-30得票数 0

2回答

在pandas dataframe python上使用应用函数时如何中断？

python、python-3.x、pandas

有没有一种方法可以使用apply函数来计算pandas dataframe的新列，但又根据某些条件“中断”它？假设我有一个有2000行的数据帧，我的标准在第1000行变成了false，这取决于之前计算的应用值。计算下一个1000是一种浪费，我希望pandas在第1000个之后停止“申请”，并返回到目前为止计算的结果。这有可能吗？

浏览 1提问于2019-05-07得票数 2

1回答

合并回原始pandas数据帧中的新计算

python、pandas

假设我有一个名为'df‘的Pandas数据帧，如下所示： X Y Z 0 -3 6 -7 1 -4 -10 -1 2 9 -10 -9 3 5 0 -8 4 -2 1 -8 我想在df中的一些行之外创建一个新的框架： new_df = df.loc[(df['X'] == -3) & (df['X'] == 9)] 然后我修改新的数据框： new_df.Y = 150 有没有一种简单的方法可以将我的新数据帧重新插入到旧帧中，只替换我在新帧中修改的那些值？所以最后，我会得到原始的'df‘，它看起来像这样：

浏览 0提问于2016-12-10得票数 1

2回答

Python Pandas - loc创建fortran有序数值数组

python、pandas、numpy

例如： nrow = 10 ncol= 10 a = np.arange(nrow*ncol,dtype=np.int32).reshape(nrow,ncol) a = pd.DataFrame(a) ix_list = np.arange(nrow,dtype=np.int32) print np.isfortran(a.values) # False print np.isfortran(a.loc[ix_list,:].values) # True 为什么.loc要用fortran有序数组来创建pandas数据帧？我能强制它用C有序的numpy数组创建pandas数据帧吗？

浏览 0提问于2017-09-15得票数 3

2回答

设置用MultiIndex索引的pandas子数据帧

python、pandas、multi-index

我有一个带有多个的pandas.DataFrame，如下所示： In [298]: pd.DataFrame(index=pd.MultiIndex.from_tuples([['a', 1], ['a', 2], ['b', 1], ['b', 3]]), data={'x': 1}) Out[298]: x a 1 1 2 1 b 1 1 3 1 当我想重新分配子数据帧(df.loc['a'])时，我得到了一个奇怪的输出： In [300]: df.loc['

浏览 2提问于2016-06-04得票数 1

2回答

如何从数据帧中删除任何行中包含特定值的列

python、pandas、dataframe、filtering

在pandas数据帧中，我需要找到任意行中包含零的列，并删除整个列。例如，如果我的数据帧看起来像这样： A B C D E F G H 0 1 0 1 0 1 1 1 1 1 0 1 1 1 1 0 1 1 我需要删除列A、B、D和F。我知道如何删除这些列，但是以编程方式识别带有零的一列让我摸不着头脑。

浏览 17提问于2018-12-27得票数 2

回答已采纳

1回答

循环遍历熊猫数据框架并创建新的列值

pandas

我试图循环一个csv文件，我把它转换成一个熊猫数据帧。我需要循环遍历每一行，并检查我拥有的纬度和经度数据(两个单独的列)，并根据lat、长数据是否在某个范围内，将代码(0、1或2)附加到同一行。我对python有点陌生，我希望您能提供任何帮助。这让我犯了不少错误。 book = 'yellow_tripdata_2014-04.csv' write_book = 'yellow_04.csv' yank_max_long = -73.921630300 yank_min_long = -73.931169700 yank_max_lat = 40.832

浏览 1提问于2015-11-16得票数 1

回答已采纳

1回答

从其他列之间的逻辑操作生成pandas dataframe列

python、pandas

我正在尝试从其他三个列的元素之间的逻辑操作生成一个pandas数据帧列。我知道我可以一行一行地吃力地完成它，但我相信有一种更简洁的方法来实现这一点。下面是如果标准操作在dataframe列之间工作的话我会怎么做(显然这段代码不能工作)。该操作依赖于访问该列中的前一个值，因此最后一行中的.shift()。 if dataframe['C'] > dataframe['H']: dataframe['Result'] = 1 else: if dataframe['C'] < dataframe['

浏览 3提问于2021-02-28得票数 0

1回答

删除索引的两个时间戳之间的行

python、pandas

如果索引在两个时间戳之间，我正在尝试删除数据帧行。我有以下数据帧 pandas_data[c['key']] Price Timestamp 2021-08-03 14:02:44.284 19.8753 2021-08-03 14:02:44.994 19.8756 2021-08-03 14:02:45.703 19.8750 2021-08-03 14:02:46.721 19.8716 2021-08-03 14:02:47.453 19.8709 2021

浏览 10提问于2021-08-03得票数 2

1回答

从稀疏数据集中删除列和行

python、pandas

我有一个包含许多空值的稀疏Pandas数据帧，我希望对其进行过滤，以便在最终数据集中只保留具有超过10个浮点型条目的行和列。我尝试使用现有的代码片段，但似乎不起作用： df.drop([col for col, val = df.count(axis=1, numeric_only='float') if val < 10], axis=1, inplace=True) 谁能告诉我在我的数据帧中删除稀疏列的最好方法是什么？

浏览 16提问于2020-06-29得票数 3

1回答

打印pandas dataframe的内容，不带索引

python、pandas、dataframe

我正在尝试从没有索引的pandas dataframe中提取内容。数据帧： L_No Exp_date LC_139 12/01/2019 当我执行L_No = df["L_No"]时，我得到的是带有索引的输出，而不仅仅是L_No。当前输出： 83919 LC_139 预期输出： LC_139

浏览 1提问于2018-07-01得票数 2

2回答

基于某些行值的子集Pandas数据帧

python、pandas、subset

我有一个带有“动态”列的Pandas数据框架(这意味着，在从各种数据库检索数据之前，我不知道列名是什么)。数据帧是一个单行，如下所示： Make Date Red Blue Green Black Yellow Pink Silver 89 BMW 2016-10-28 300.0 240.0 2.0 500.0 1.0 1.0 750.0 请注意，'89‘是数据帧中的特定行。我有以下代码： cars_bar_plot = df_cars.loc

浏览 0提问于2016-10-30得票数 0

回答已采纳

1回答

如何从Watson语音到文本输出重建对话？

python、pandas、ibm-watson、speech-to-text

我有来自Watson的语音到文本服务的JSON输出，我已经将其转换为列表，然后转换为Pandas数据帧。我正在尝试确定如何重建对话(带有计时)，类似于以下内容：演讲者0: Said this 00.01 - 00.12 演讲者1:说00.12 - 00.22 演讲者0:说了别的话00.22 - 00.56 我的数据帧对每个单词有一行，对单词、它的开始/结束时间和扬声器标记(0或1)有列。 words = [['said', 0.01, 0.06, 0],['this', 0.06, 0.12, 0],['said', 0.12, 0.15

浏览 12提问于2019-10-09得票数 0

回答已采纳

1回答

Pandas for Loop Optimization(向量化)时查看前一行的值

python、pandas、dataframe、for-loop、vectorization

我希望使用for循环优化函数所用的时间。下面的代码对于较小的数据帧是可以的，但是对于较大的数据帧，它花费的时间太长了。该函数基于使用其他列值和参数的计算有效地创建了一个新列。计算还会考虑其中一列的前一行的值。我读到最有效的方法是使用Pandas矢量化，但我很难理解当我的for循环正在考虑1列的前一个行值来填充当前行上的新列时，如何实现这一点。我是一个完全的新手，但是环顾四周，找不到任何适合这个特定问题的东西，尽管我是从一个相对无知的位置进行搜索的，所以可能遗漏了一些东西。下面是函数，我已经创建了测试数据帧和随机参数。如果有人能给我指出正确的方向来缩短处理时间，那就太好了。提前谢谢。 def

浏览 11提问于2021-02-09得票数 0

回答已采纳

1回答

从dataframe中删除前n天

python、pandas、dataframe

我有一个带有datetime索引的pandas数据帧(30分钟频率)。我想去掉最后几天的"n“。我的数据帧不包括周末，所以如果最后一天是星期一，我想删除星期一、星期五和星期四(从末尾)。所以，我指的是观察日，而不是日历。最具蟒蛇色彩的方式是什么？谢谢。

浏览 0提问于2019-06-04得票数 0

1回答

Pandas根据布尔条件选择行和列

python、pandas、dataframe、conditional

我有一个大约50列、>100行的pandas数据帧。我想选择列'col_x'，'col_y' where 'col_z' < m。有没有一种简单的方法可以做到这一点，类似于df[df['col3'] < m]和df[['colx','coly']]，但组合在一起？

浏览 2提问于2017-12-30得票数 3

回答已采纳

1回答

复制一排乱七八糟的熊猫列数据类型，如何避免？

python、types、pandas

如果在生成带有布尔列的Pandas数据帧之后，我将为列获得适当的数据类型。 >>> individuals = pandas.DataFrame([[True, 1],[False, 1]], ... columns = ["female","fitness"]) ... >>> print(individuals["female"]) 0 True 1 False Name: female, dtype: bool 但是，当我通过复制一个已经存在的行来添加另一个行时，这会中断： >&

浏览 1提问于2014-09-04得票数 4

回答已采纳

1回答

将loc应用于2列值Pandas

python、pandas、loc

我正在使用2列参数来锁定一个数据帧:如果我这样做了，paises_cpm = df.loc[a]正在工作，但是如果我这样做了，paises_cpm = df.loc[a,b]就会收到一个错误：IndexingError: Unalignable boolean Series provided as indexer (index of the boolean Series and of the indexed object do not match import pandas as pd import time fecha = time.strftime(str((int(time.strf

浏览 0提问于2018-01-24得票数 3

回答已采纳

2回答

如何将负指数与熊猫多重指数一起使用？

python、pandas、multi-index

我将通过以下方式创建一个带有Multiindex的pandas数据帧 import pandas as pd import numpy as np df = pd.DataFrame(columns=['time','features','A','B','C']) df['time'] = np.repeat(np.arange(5), 3) df['features'] = np.tile(['p','q','r'],5) df

浏览 23提问于2019-01-30得票数 1

回答已采纳

1回答

在数据帧中的索引之后删除特定行

python、pandas、dataframe

我有一个数据帧，如下所示： colA colB colC entry entry1 0 0 0 entry2 1 3 5 entry3 0 0 0 entry4 0 5 5 entry5 0 2

浏览 22提问于2021-08-13得票数 0

回答已采纳

1回答

可以使用SQL操作通过Pandas创建的数据帧吗？

python、sql、dataframe、sqlalchemy

因此，我正在尝试创建一个python脚本，该脚本允许我在使用pandas创建的数据帧(masterfile)上执行SQL操作。数据帧从特定文件夹中找到的csv文件中提取其内容。我能够成功地创建其他所有内容，但我在SQL操作部分遇到了麻烦。我正在尝试使用数据帧作为“数据库”，在这里我将使用我的SQL查询来拉取数据，但是我得到了一个"AttributeError：' dataframe‘object has no attribute 'cursor’“错误。我没有看到很多pandas.read_sql_query()的例子，所以我很难理解我将如何在其中使用我的数据帧。

浏览 12提问于2020-06-28得票数 0

2回答

如何在数据框某些行的所有列上使用pandas apply函数

python、pandas、data-manipulation

我有一台dataframe。我想要将某些行的所有列的值替换为默认值。有没有办法通过pandas apply函数做到这一点？这是数据帧 import pandas as pd temp=pd.DataFrame({'a':[1,2,3,4,5,6],'b':[2,3,4,5,6,7],'c':['p','q','r','s','t','u']}) mylist=['p','t'] 如何将列a和b中的值替换为默认值0，其中

浏览 13提问于2016-07-21得票数 2

回答已采纳

1回答

如何删除Pandas中的索引？

python、pandas、jupyter

我正在尝试做一个简单的调度程序与熊猫的数据。当为数据帧中的特定元素调用pandas.loc函数时，它会输出带有索引的元素。 df.loc[df['days'] == 'tuesday','task'] 这是输出 '0 Go for a run' 当我想将输出作为字符串使用时，有没有方法可以删除索引。或者使用不同的函数。我想要的输出只是- 'Go for a run'

浏览 0提问于2021-03-04得票数 0

1回答

从多索引Pandas DataFrame中导出/writing到Excel标签

python、excel、list-comprehension、pandas-groupby

我想通过第一个索引'0‘将多索引数据帧拆分/切片为第一个索引的每个级别的数据帧(例如，下面将有4个数据帧)。然后，我想将每个数据框导出到EXCEL中的单独选项卡中。我希望得到帮助的最重要的问题是如何编写循环或列表理解，将多索引数据帧拆分成单独的数据帧。示例Dataframe： import pandas as pd import numpy as np arrays = [ np.array(['bar', 'bar', 'baz', 'baz', 'foo', 'foo',

浏览 17提问于2019-01-27得票数 0

回答已采纳

3回答

Python -使用pandas设置excel单元格的格式

python、excel、pandas、dataframe、format

我有一个pandas数据帧，如下所示。我想将“通过/失败”列的格式设置为if Fail --> red background, else green background，如下所示：我曾尝试使用Pandas进行格式设置，但它无法为excel添加颜色。代码如下： writer = pandas.ExcelWriter(destination,engine = 'xlsxwriter') color = Answer.style.applymap(lambda x: 'color: red' if x == "Fail"

浏览 4提问于2017-05-24得票数 9

回答已采纳

2回答

pandas:如何使用字符串和字符串进行分组

python、pandas、pandas-groupby

我有一个带有换行分隔符的csv文件，我将其读入到一个pandas数据帧中。 df = pd.dataframe("data.csv", delimiter="\n", header=None) 这将返回类似如下的内容 marker1 10 20 30 marker2 40 50 marker3 60 70 80 90 100 ..... 我想生成一个数据帧，如下所示 marker1 10 marker1 20 marker1 30 marker2 40 marker2 50 marker3 60 marker3 70

浏览 28提问于2019-02-11得票数 0

回答已采纳

2回答

如何在数据框中存储字典列表中的特定键值

python、python-3.x、pandas、list、dictionary

我一直在尝试将特定键的值存储到pandas数据帧中，该数据帧来自具有字典列表的另一个数据帧。有人能教我怎么做吗？？ source data frame result data frame

浏览 11提问于2021-02-08得票数 0

1回答

如何在python中绘制具有置信度区间和在x轴上变化的图例的线图

python、python-3.x、seaborn

我有一个数据帧，看起来像这样： import pandas as pd foo = pd.DataFrame({'time':[1,2,3,4], 'value':[2,4,6,8], 'group':['a', 'a', 'b', 'b'], 'top_ci':[3,5,7,9], 'bottom_ci': [1,3,5,7]}) 我想创建一个线条图，所以我使用以下代码： ax =

浏览 31提问于2020-06-15得票数 0

回答已采纳

3回答

根据条件打印行

python、arrays、pandas、dataframe、numpy

我有以下代码： import pandas as pd df = {'sport' : ['football', 'hockey', 'baseball', 'basketball'], 'league': ['NFL', 'NHL', 'MLB', 'NBA'], 'number': [1,2,3,4]} df = pd.DataFrame(df) df if df['number'] >=

浏览 6提问于2022-07-12得票数 0

回答已采纳

1回答

我如何用python，最好是用熊猫来写这篇文章呢？(假设我正在处理一个dataframe)。

python、sql、pandas、dataframe、analytics

这是我试图转换为Pandas的代码： select geo, region, sum(case when year(txn_date)>=2020 then revenue else 0 end) as ytd_rev, sum(case when year(txn_date)=2019 then revenue else 0 end) as py_ytd_rev, sum(profit) as total_profit from table group by 1,2 假设输入数据框架的列如下: geo _ 输出数据帧中的列: geo \ ytd_rev \##.‘> py_yt

浏览 0提问于2021-01-14得票数 1

回答已采纳

2回答

如何在某些条件下用均值封顶pandas列

python、pandas

我在pandas中有以下数据帧 ID Quantity Rate Product 1 10 70 MS 2 10 70 MS 3 100 70 MS 4 10 100 MS 5 700 65 HS 6 1100 65 HS 7 700

浏览 1提问于2019-02-06得票数 1

2回答

如何将群集从特定列中切片

python、pandas、dataframe、slice

df['clusters']包含带有4个集群0,1,2,3的数据框架。我使用csv格式阅读了pandas格式的数据帧，并实现了k均值聚类，并生成了4个集群。星系团位于df['clusters']中。假设有4个带有标签0,1,2,3的集群。现在如何分割一个列并获取属于集群1的列

浏览 0提问于2019-03-01得票数 0

回答已采纳

1回答

用python 3抓取多个页面？

python-3.x、pandas、dataframe、web-scraping、iteration

我拿到了csv文件，里面有很多网址。为了方便起见，我把它读到了一个熊猫数据框中。我稍后需要做一些统计工作-熊猫很方便。它看起来有点像这样： import pandas as pd csv = [{"URLs" : "www.mercedes-benz.de", "electric" : 1}, {"URLs" : "www.audi.de", "electric" : 0}] df = pd.DataFrame(csv) 我的任务是检查网站是否包含某些字符串，如果包含，则使用1和0添加额外的列。例如

浏览 9提问于2017-06-15得票数 1

回答已采纳

1回答

获取MultiIndex系列的整数行索引

python、pandas、series

我有一个带有MultiIndex的pandas Series，我想要获得属于MultiIndex的一个级别的整数行号。例如，如果我有示例数据s s = pandas.Series([10, 23, 2, 19], index=pandas.MultiIndex.from_product([['a', 'b'], ['c', 'd']])) 它看起来像这样： a c 10 d 23 b c 2 d 19 我想要获取与level b对应的行号。因此，在这里，我将获

浏览 0提问于2014-09-19得票数 0

2回答

Pandas:根据搜索行查找列值

python、pandas、dataframe

假设我在Pandas中有一个数据帧： import pandas as pd import numpy as np df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(), 'B': 'one one two three two two one three'.split(), 'C': np.arange(8), 'D': np.arange(8)

浏览 1提问于2021-05-10得票数 0

2回答

将根据给定需求选择的某些行放入另一个数据帧中

python-3.x、pandas

我已经使用Pandas将csv文件读取到数据帧中，csv格式如下。我想把“时间列信息”在6/3/2011-10/20/2011间隔之间的行放到另一个数据帧中。我怎样才能在Pandas中高效地做到这一点？

浏览 4提问于2018-08-10得票数 0

1回答

实列名称的python pandas.column索引号

python、pandas

我正在尝试处理用html(或xml )编写的xls数据。IDK)我试过这样做 df = pandas.read_html(r"filename.xls", skiprows=0) 它不是数据帧，而只是列表。所以我就这么做了 df = df[0] 在这之后，我可以做， print(df) 结果如下所示 0 1 2 0 name age gender 1 john 18 male 2 ryan 20 male 以前，我用其他xlsx文件做过类似的工作，它们工作得很好，但不能用这个文件。例如, for index, row in d

浏览 4提问于2017-12-19得票数 3

2回答

Python，有没有办法把df.drop赋给一个新的变量？

python、pandas

我练习python已经有一段时间了，刚刚开始接触pandas，开始学习数据帧。我知道df.drop()会根据某些要求删除列/行，并生成一个新的df。我想知道，有没有一种方法可以将这些被删除的列/行分配给一个新的变量以用于日志记录？ import pandas as pd L = ["a","b","c","d","a","a"] df1 = pd.DataFrame(L) df1.columns = ['letter'] #print(df1) df2 = df1.drop(df1

浏览 17提问于2018-01-13得票数 2

回答已采纳

1回答

使用双索引的Pandas查询

python、pandas、dataframe

我在使用双列索引的数据帧的pandas查询中的布尔索引时遇到了问题。我有以下数据帧： df2 = val1 val2 mean size mean size col1 c 2.5 2 5 2 d 4.5 2 9 2 e 0.5 2 1 2 其中，val1和val2是一级列索引，mean和size是二级索引。然后，我想使用如下语法选择第一列('val1'，'

浏览 0提问于2019-06-04得票数 0

2回答

有没有一种很好的方法来在dask数据帧上对许多条件进行条件选择？

python、dask

我正在从Pandas切换到Dask，并希望在数据帧上执行条件选择。我想提供一个条件列表，最好是布尔数组/序列，然后得到一个应用了所有这些条件的数据帧。在Pandas中，我只是做了np.all(BoolSeries1，BoolSeries2，...)并将结果应用于数据帧。 import dask.array as da import dask.dataframe as dd import numpy as np import pandas as pd df = pd.DataFrame({'A' : np.random.rand(1000) , 'B':

浏览 10提问于2019-06-27得票数 2

回答已采纳

1回答

如何在一系列行的熊猫数据栏上矢量化？

python、pandas、numpy、dataframe

所以我有一个带有y行的x列的Pandas DataFrame。DataFrame中的数据是float64值。我试图计算两列之间的斜率相关性，但是对于单个列的范围(例如，列有25000行，我只想要介于5-10之间的值，这些值恰好在2000-4000行中)。为了做到这一点，我将以下面的psuedocode演示的方式进行迭代： for i in range(i, len(df['Column 1'])) if df.loc[i, 'Column 1'] <= 10.0 & df.loc[i, 'Column 1'] >= 5

浏览 2提问于2020-06-29得票数 0

回答已采纳

1回答

如何根据另外两列中满足的条件对最后一列中的pandas DataFrame元素进行索引？

python、pandas、dataframe、indexing

pandas数据帧有4列： df.columns = ['col1', 'col2', 'question', 'answer'] 如何根据满足第一列的标准对数据帧进行索引，从而为'answer'列的单个条目编制索引？即： df['col1'=='apple' and 'col2'=='guitar'].answer

浏览 10提问于2021-01-11得票数 0

1回答

pd.read_csv中的字符串行索引导致错误“标签[1]不在[索引]中”

python、pandas、csv、indexing

我正在将CSV导入到pandas数据帧中。当我这样做时，我将索引列设置为0，这是列出的索引(0到10)。我收到错误键错误:标签%1不在索引中。我已经多次检查数据，以确保第一列是数字列表。有什么关于我如何解决这个问题的提示吗？ from __future__ import division import pandas as pd import random import math #USER VARIABLES #GAME VARIABLES Passengers = 500 data = pd.read_csv("Problem2/data.csv", index_

浏览 0提问于2015-11-08得票数 3

回答已采纳

2回答

是否删除pandas数据框中除一列以外的所有列？

python、pandas

我有一个pandas数据帧，我想删除所有列，保存索引和名为'bob‘的列我该怎么做呢？

浏览 1提问于2013-09-28得票数 25

回答已采纳

3回答

将不同长度的列表作为新列添加到数据框中

python、python-3.x、pandas

我愿意在数据帧中添加或插入列表值。数据帧长度为49，而列表id为47的长度。在实现代码时，我得到了以下错误。 print("Lenght of dataframe: ",datasetTest.open.count()) print("Lenght of array: ",len(test_pred_list)) datasetTest['predict_close'] = test_pred_list 错误是： -------------------------------------------------------------------

浏览 1提问于2018-07-19得票数 17

回答已采纳

1回答

Pandas根据具有多个条件的另一列的求值创建列

pandas、conditional

我想创建一个布尔值列，基于另一个使用pandas的列的计算结果。理想情况下，我希望使用与我复制的语法相似的语法，但如果这是不可能的，我愿意接受其他建议。 df是一个熊猫数据帧。AggRow是一列包含整数的数据。所以，我有一个AggRow的数据，它有一个值范围。如果我想让conditionmet在AggRow小于或等于6001的地方为True，我可以基于一个标准成功地创建一个新列conditionmet，如下所示： conditionmet = df['AggRow'] <= 6001 但是，如果我希望在AggRow为<= 6001或10001和10009之间(包括

浏览 0提问于2018-02-24得票数 4

1回答

Pandas如果列包含字符串，则从另一列获取唯一值并从dataframe中删除行

python、pandas、dataframe

我有个小问题。我有这个有7列的数据帧。其中两个是'IP‘和'URL’。这是一个网络日志数据集，所以我尝试获取行的唯一IP，其中URL包含字符串"robots.txt“，然后如果应用此条件，则从dataframe中删除唯一IP的行。我费了好大劲才解决这个问题。我尝试过pandas groupby，但还是解决不了。在下面的代码中，我能够获得url包含字符串"robots.txt“的唯一ip： robots = data2[data2.url.str.contains('robots.txt', regex=True)] len(robots[[

浏览 2提问于2021-03-13得票数 0