Pandas -更改少于n个后续值相等的行_Pandas -突出显示列中的第n个后续相等值_根据上面行中的值删除时间索引的Pandas数据帧中的n个后续行 - 腾讯云开发者社区

、

我有一个相当大的dataframe (几百列)，我想对它执行以下操作。下面我使用了一个简单的条件来说明我需要什么。对于每一行:条件#1:检查两个列的值为零(0)。如果这是真的，请保留该行，然后转到下一行。如果任一列的值为零(0)，则条件为True。如果条件#1为False (第1列或第4列中没有零)，则检查行中的所有其余列。如果其余任何列的值为零，则删除该行。我希望将过滤后的数据作为一个新的、单独的数据返回。到目前为止我的代码是： # https://codereview.stackexchange.com/questions/185389/dropping-rows-from-a-p

浏览 1提问于2019-11-10得票数 1

回答已采纳

1回答

迭代pandas列中的字典列表并创建新列

、、、

我想从pandas dataframe列解析json字典，遍历字典并将它们赋给新的列值。这里有一列数据帧：df['Column'][0] [{'Name': 'Vacant', 'Value': 3904000, 'Unit': 'Qty'}, {'Name': 'Vacant', 'Value': 11.7, 'Unit': 'Pct'}, {'Name': 'Absorption

浏览 57提问于2020-11-09得票数 0

1回答

熊猫pd.apply函数不能使用python缓存进行散列。“

、、、、

我有一个df，您可以通过运行以下代码来获得它： import pandas as pd from io import StringIO from functools import lru_cache df = """ contract EndDate A00118 123456 A00118 12345 """ df = pd.read_csv(StringIO(df.strip()), sep='\s+') 产出如下： contract EndDa

浏览 9提问于2022-04-01得票数 0

回答已采纳

1回答

如何将lambda函数应用于PANDAS中满足条件的行

、

我正在尝试将一个函数逐行应用到一个pandas数据帧中，如下所示 df.loc[df.var1==123,'coltoChange']=df.apply(lambda row: myfunc(row.var1, row.var2),axis=1) 其思想是仅将该函数应用于var1的值为123的行。但是当我运行这条语句时，它仍然尝试运行数据帧中的每一行。

浏览 9提问于2018-01-07得票数 1

回答已采纳

1回答

基于条件在Pandas DataFrame中创建新行

、、

我希望迭代数据帧中的每一行，如果它符合特定条件，则创建另一行。例如 A B C Both 999 LP London 1002 KI Manchester 1005 BV Both 1001 IG 将导致： A B C Both

浏览 10提问于2021-03-04得票数 1

1回答

根据列值删除数据框行

、

我创建了一个基于网站(https://thispointer.com/python-pandas-how-to-drop-rows-in-dataframe-by-conditions-on-column-values/)的代码，用于根据列值删除数据框中的行。列'zone_type‘可以有5个值之一(response_button_text、response_button_image、fixation、timelimit_screen或continue_button)。除非行的值是'response_button_image'，否则我想从数据框中删除该行。 # sel

浏览 23提问于2019-12-23得票数 0

回答已采纳

1回答

Pandas Index.droplevel()在0.25.3中有效，但在1.2.4中不起作用

在我从0.25.3 Pandas迁移到1.2.4之后，一些以前可以工作的代码失败了。下面是一个可重复使用的示例： import numpy as np import pandas as pd print(f"pandas: {pd.__version__}") !python --version cols = pd.MultiIndex.from_product([['coz',], ['alpha', 'beta', 'gamma']], names=['health', 'p

浏览 183提问于2021-08-09得票数 0

3回答

遍历列以将每个列与Python中的特定列进行比较

、、

我正在尝试使用python中的pandas来解决这个问题。我有一个将近1000列的数据框。对于每一列，我想返回一个用于数学运算的布尔值--具体地说是Column A - Column n => 0。 "ID" "Column A" "Column B" "Column C" "Column D" "A" 100 200 300 50 "B" 75 20 74 500 让

浏览 5提问于2016-07-27得票数 2

1回答

两个数据帧的每一行之间的自定义距离函数

我有两个数据帧，我想要使用自定义距离度量(例如，第一列的欧几里德，第二列的出租车，等等)来计算一个数据帧中每一行与另一数据帧中每一行之间的“距离”。有没有一种方法可以用广播快速做到这一点？

浏览 9提问于2021-09-14得票数 0

2回答

根据条件创建新的Pandas列，但这些值不会生成

、、

我正在尝试完成一个简单的任务:根据其他列的条件在Pandas dataframe中创建一个新列。我曾咨询过其他帖子(例如，，但也有其他采用不同方法的帖子)，但都没有成功。我现在遇到的问题是，在新列中只返回函数中定义的最后一个值。例如：我有以下一栏： x 1 2 3 我想添加一个新的标签栏： x size 1 Small 2 Medium 3 Large 下面是最新的尝试代码： import pandas as pd import numpy as np df = pd.read_csv('blah.csv') def size (row

浏览 1提问于2019-03-04得票数 3

回答已采纳

2回答

如何将和if语句合并到lambda函数中以排除空白值？

、、、

在使用下面的lambda function时，我想尝试排除任何空白值，这将防止输出中出现额外的逗号。如果我在没有if语句的情况下运行代码，那么在comb_words列的值中会得到额外的逗号。如何合并if语句以排除空白值并防止输出中的任何额外逗号？代码： # dataframe df = pd.DataFrame(data ={'col1':[123,123, 456, 456, 789, 789],'col2':["",'I eat cake.','We run fast.', 'We eat cake

浏览 10提问于2022-02-23得票数 0

回答已采纳

3回答

对于每一行，找到包含不是NaN的第n个元素的列的最快方法是什么？

、、、、

我有一个Python熊猫DataFrame，其中每个元素都是一个浮点或NaN。对于每一行，我将需要找到包含第n行号的列。也就是说，我需要让列保存不是NaN的行的第n个元素。我知道第n列总是存在的。因此，如果n为4，而一只名为myDF的熊猫数据则如下： 10 20 30 40 50 60 70 80 90 100 'A' 4.5 5.5 2.5 NaN NaN 2.9 NaN NaN 1.1 1.8 'B' 4.7 4.1 NaN NaN NaN 2.0 1.2 NaN NaN NaN '

浏览 0提问于2015-08-12得票数 6

回答已采纳

1回答

熊猫:将函数应用于行，将其写入新列

、、、

函数在数据挖掘中的应用我目前有以下数据：数据 url visitors http://somedomain.com 200000 http://someotherdomain.com 150000 http://somenewdomain.com 11000 对于dataframe中的每一行，我喜欢将两个函数应用到url列，然后将每个结果写成两个不同的列“meta”和“content”。函数： def metacrawler(url) ... return data def co

浏览 0提问于2018-10-17得票数 0

回答已采纳

1回答

如何将方法/函数应用于python中的数据

、、

函数是： def combine(row): count = 0 stage = "" if (str(row.doggo) == "doggo"): stage = "doggo" count += 1 if row.floofer == "floofer": stage = "floofer" count += 1 if row.pupper == "pupper": st

浏览 6提问于2019-12-15得票数 1

回答已采纳

1回答

在pandas数据帧中存储处理过的文本

、、

我在Python中使用gensim进行文本摘要。我希望我的汇总输出存储在同一个dataframe的不同列中。我使用了下面的代码： for n, row in df_data_1.iterrows(): text=df_data_1['Event Description (SAP)'] print(text) *df_data_1['Summary']=summarize(text)* print(df_data_1['Summary']) 错误出现在这段代码的第4行，它指出: TypeError:

浏览 3提问于2018-06-27得票数 0

1回答

熊猫数据串接

、、

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

1回答

熊猫申请:第一排阐述了两次

、、

Pandas 1.0.5Python 3.8.0Numpy 1.19.0 这段代码的行为很奇怪： import pandas as pd def calc(row): print(f"Row: {row.to_list()}") result = pd.Series({ "sum1": row.col1 + row.col2, "sum2": row.col2 + row.col3, "sum3": row.col1 + row.col3, }) r

浏览 3提问于2020-07-14得票数 1

回答已采纳

2回答

多条件下的数据分割Python

、、、

我有一个有3列的dataframe： df: x y z 334 290 3350.0 334 291 3350.5 334 292 3360.1 335 292 3360.1 335 292 3360.1 335 290 3351.0 335 290 3352.5 335 291 3333.1 335 291 3333.1 . . 根据以下几个条件，我想检查从row = n到row = n+7的每一行的值并将其解析为新的dataframe：

浏览 1提问于2019-05-27得票数 3

回答已采纳

3回答

将dataframe与从apply函数创建的另一个dataframe合并？

、、、

我有一份关于工资数据的数据，df： State,Annual Salary New York, 132826 New Hampshire,128704 California,127388 Vermont,121599 Idaho,120011 还有一个函数，get_taxes_from_api，它调用API并返回输入状态和年薪的税号，作为只有1行的数据框架，如下所示： State,annual.fica.amount,annual.federal.amount,annual.state.amount North Carolina,8918,40334,6364 它的类型：<class &

浏览 3提问于2021-04-02得票数 2

回答已采纳

2回答

如何为dataframe中的各个列创建基于不同布尔条件的新列

、、

我想创建一个二进制列，如果dataframe中恰好有一列满足逻辑条件A，而dataframe中的另一列满足逻辑条件A或逻辑条件B，则该列标记为yes。因此，如果两个单独的列满足上述条件，新列将只有1。每一列都是每年的单独产品计数。条件A:如果一个产品(即"c1")在本年度卖出了8个产品，则前一年的1-6个产品和前一年(2年前)的1-6个产品满足条件A。条件B:如果任何其他产品(例如，不是"c1“，即"c3")满足上述条件A，或者在本年度售出8件，前一年售出8件，两年前售出8件，则满足条件B。因此，只有当特定年份中的任意2列满足上述条件时，成功才能为1

浏览 39提问于2019-04-29得票数 1

回答已采纳