如何根据列中特定的值序列来标记df中的组

文章/答案/技术大牛

发布

2回答

、、、

我有一个dataframe，其中的id和value列如下所示，但是希望根据value列中的值，按id组来确定Status列。0 Not fluctuating30 3 10 0 Not fluctuating 在这里，如果三个或更多的1紧跟3个或更多(0或-1)，紧跟3个或更多的1，则一个<e

浏览 29提问于2020-06-23得票数 1

回答已采纳

2回答

在时间序列中找出到达特定点的时间

、、

我有一组时间序列数据，在这里我试图找出它们达到特定值的时间点。我尝试过这样做，得到了答案，但是生成了整个列，而不是time列中的特定值，我不知道如何迭代几个列。num = df['Time column'].where(df['Data Column'] >Value of inte

浏览 5提问于2022-10-19得票数 0

3回答

标识哪个组包含非零值序列。

我试图识别列中的哪些组包含非零数字的特定序列长度。在下面的基本示例中，目标是查找序列长度为5的组，只有组b才是正确的。set.seed(123) id = seq(1:40), x = c( ccumsum来

浏览 7提问于2022-11-15得票数 2

回答已采纳

1回答

如何将if...else子句应用于Python3中的整个列？

、、

我想在df列中取一组值，并根据单独列的值应用校正因子。我想运行一个if...else子句，它根据第一列中的值添加不同的金额。我尝试过以下几种方法： if df['A'] > 5: df['B'] = df['B&

浏览 11提问于2019-06-17得票数 0

回答已采纳

1回答

从一个帧到另一个帧的数据帧行和列复制

、、

我希望将DF1的列A的特定列值x分组为组名称，并将列B中存在的相同行值聚合为序列或列表然后，这些列B的值的序列/列表在第一次出现时替换DF2列A的值x，并复制序列/

浏览 13提问于2019-01-09得票数 0

1回答

如何定义pandas qcut标签的功能？

、

我使用pandas.qcut将数据划分为5个组，并希望根据最小和最大分数标记每个组。例如，我尝试了数据框列中的"age“数据。df['age group'] = pd.qcut(df['age'], 5) 它的结果是 Categories (5, interval[float64]): [(37.999, 61.0] < (61.0, 67.0] < (

浏览 19提问于2019-04-16得票数 1

回答已采纳

3回答

在r中的数据帧列中输入没有特定结束的序列号

、、、、

我想给一个新列到一个数据框架的数字序列。但是这个序列将根据另一列中的值重复几次。(也就是说，它从1开始，直到该特定值将更改为其他值)。 V1 V2(ne

浏览 3提问于2014-04-11得票数 0

回答已采纳

1回答

Python标签组中的最大值、75%、50%和最小值

、

如何检查一个组内的值是75%还是50%？我有一个带有分数的df，对于每个组，我想创建新的变量来标记该组中的最大、最小、75%和50%的分数。因此，如果组中的值是最大值，则应该有一列' max‘为1，如果值位于第7

浏览 47提问于2021-04-15得票数 0

回答已采纳

1回答

使用数据相关标记和颜色绘制三维散点图

、、

我有一个包含5列的dataframe df：f1，f2，f3，f4，y，其中所有列中的所有值都来自一组有限的整数，实际上，所有列都是类别列，转换为整数。我想要做的是绘制一个3d散点图，在轴上有f1，f2，f3，标记样式应该由f4决定，最后颜色应该由y列决定。下面的代码处理轴和颜色。['f1'], df[&#

浏览 5提问于2020-02-04得票数 0

回答已采纳

1回答

如何选择每个组中求和到最小值的行窗口，并在R中进行绘图？

、、

--我希望将df中的列划分为组，并对列(Online_h)中的每个列(Online_h)中的每36行运行rollsum()，并选择这些行，其中和是组内的最小和(与组内其他行的总和相比)。这意味着，对于每一组，我应该得到36行与其他组相比的最小总和。 My dataframe包

浏览 1提问于2021-11-02得票数 2

回答已采纳

1回答

Pandas中多列的映射元素

、

我试图在Pandas中的DataFrame中根据值本身来标记一些值。df = pd.read_csv('data/extrusion.csv')columns = [c forthat returns the class based on value ser.map

浏览 3提问于2021-11-24得票数 1

回答已采纳

1回答

Excel条件数据和文本操作

、、

我有一个Excel电子表格，其中包含许多列，其中最重要的是"sequence"、"modifications"和"signal"。名为"sequence"的列包含许多条目，只要存在不同的"modification"，就会重复这些条目。每个特定的序列与给定的“修改”分配了一定的“信号”值。，得到这个<e

浏览 0提问于2016-02-09得票数 2

回答已采纳

1回答

Pandas使用groupby和mask减去列

、

对于一个“序列号”下的组，我想减去每个组的三个绩效指标。一组边界是序列号SN和掩码中的顺序布尔值True。(因此在一个序列号下可以存在多个True sequances )。我想要的第一个指示器是，Csub，它减去列'C‘中每个组的第一个和最后一个值。第二，Bmean，是“B”

浏览 22提问于2019-12-23得票数 1

回答已采纳

1回答

熊猫错误组合条款的条件

、

我有一个带有二进制标志值的列，如果有错误，我将试图清除它。如果一个特定的组同时包含0和1，则会出现错误。我的原则是，这一列只能包含组内的0或1。我正在尝试使用一个np.where()子句来测试具有单个重复值的列的组，以及组中该列的第一个<e

浏览 0提问于2018-03-15得票数 1

回答已采纳

2回答

根据Azure ML Studio中的条件替换列中的值

、

如何根据Azure ML Studio中的条件将特定列中的值替换为特定值。我可以使用python中的pandas作为笨蛋来做到这一点： df.loc[df['col_name'] > 1990, 'col_name'] = 1 我正在尝试在Azure Machine

浏览 25提问于2019-05-07得票数 2

回答已采纳

1回答

用平日颜色的标记和图例绘制时间序列

、、

我有一个以索引为日期的数据框架。这些列是不同的时间序列，我添加了另一列来标记特定观测属于哪个工作日。就像这样：( a)绘制一个时间序列，例如系列1，在图中添加标记，并在平日对其进行着色。我有两个使用plt.scatter和plt.plot的地块： plt.scatter(x = df.index, y = df['

浏览 0提问于2018-04-05得票数 1

回答已采纳

1回答

按五分位数选择和排序复杂数据帧

、、

我有一个复杂的数据帧(orig_df)。在这25列中，有5列是我希望用作分组标准的描述和特征。其余的是时间序列。有成千上万的行。我在初步分析和数字总结中注意到，在一些特定的分组标准中，异常观察存在重大问题。我使用了"group by“，并查看了这些组中的五分位数结果。我想要消除相对于(基于分组的五分位

浏览 12提问于2018-01-07得票数 0

2回答

datetime索引组循环中的Pandas计算列

、、

我有一个带有Datetime索引的Pandas df。我想根据索引日期值(不同时间段的不同strike )，使用不同的strike值遍历以下代码。这是我的代码，它在整个时间序列中产生我想要的1个strike：import numpy as np dist = mean_payoff.d

浏览 5提问于2017-09-25得票数 2

1回答

是否有一个R函数来按块中值组的位置向大数据帧添加索引(数字或字符ID)列？

我一直试图创建代码，以便按照块中的连续ID位置向大数据帧(平均21000行，划分为400个块和10个列)添加特定的索引。这些区块是根据基因组中基因组范围的位置给出的。我也在网上寻找相关的话题。("*", seq(1:8)) cont_ID <- c("001","001","004","004"

浏览 0提问于2019-04-10得票数 1

回答已采纳

1回答

根据条件删除熊猫群

、、

我有一个包含几个组的pandas数据框，我想排除那些不满足某些条件(在特定列中)的组。例如，删除这里的组B，因为它们在列"crit1“中有一个非数字的值。我可以根据条件df.loc[:, (df >< 0).any(axis=0)]删除特定的列，但不会删

浏览 5提问于2016-08-18得票数 6

回答已采纳

点击加载更多