首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何创建一个dataframe列,其中包含已经存在的列中最近3次出现True的索引的列表?

要创建一个包含已经存在的列中最近3次出现True的索引的列表的DataFrame列,可以按照以下步骤进行操作:

  1. 导入必要的库:
代码语言:txt
复制
import pandas as pd
  1. 创建一个示例DataFrame:
代码语言:txt
复制
df = pd.DataFrame({'A': [False, True, False, True, True, False, False]})
  1. 使用rolling和sum函数创建一个新的列,该列包含最近3次出现True的索引的列表:
代码语言:txt
复制
df['B'] = df['A'].rolling(3).apply(lambda x: list(df.index[x]), raw=True).sum()

这将创建一个新的列'B',其中包含最近3次出现True的索引的列表。如果不足3次出现True,则列表将包含所有已经出现True的索引。

以下是对上述代码的解释:

  • df['A']:选择要检查的列'A'。
  • rolling(3):创建一个滚动窗口,窗口大小为3。
  • apply(lambda x: list(df.index[x]), raw=True):对滚动窗口中的每个窗口应用lambda函数,该函数将窗口中的索引转换为列表。
  • sum():将所有窗口中的列表连接成一个大列表。

最后,你可以打印DataFrame来查看结果:

代码语言:txt
复制
print(df)

完整的代码示例如下:

代码语言:txt
复制
import pandas as pd

df = pd.DataFrame({'A': [False, True, False, True, True, False, False]})
df['B'] = df['A'].rolling(3).apply(lambda x: list(df.index[x]), raw=True).sum()

print(df)

这是如何创建一个包含已经存在的列中最近3次出现True的索引的列表的DataFrame列的完整答案。

相关搜索:python :在python dataframe中创建两列的组合,其中包含列表作为它们的值基于列表中的数值列和索引从pandas DataFrame创建新列如何解析DataFrame中的列(包含列表数据)?从两个现有列创建一个包含字典的新Dataframe列,每个列都包含列表dataframe之间的比较:检查其中一个dataframe的列的值是否在另一个dataframe的列的列表中创建一个表,其中包含给定列表中的所有潜在组合,该列表包含两列(excel)如何在groupby中包含Pandas DataFrame中不存在的列对Pandas Dataframe中的列使用列表理解时出现索引错误如何将列表列表转换为带索引的dataframe中的列?如何使用列表中包含的另一列中的单词创建pandas列如何使用dataframe列中的唯一值创建列表列表?如何将包含其他列中的值出现次数的列附加到现有的Dataframe?MySQL -如何从包含多个列的表中获取一行,其中包含true或false在dataframe中创建一个列,其中两个级别随机分布在列的行中如何根据Pyspark中的列名列表检查dataframe是否包含列?如何从Python3中具有特定索引和列的列表的字典中创建Pandas DataFrame?创建一个表,其中包含值列表中的一列作为存储过程的输入如何从spark scala dataframe中包含列名的列表中获取列值如何在pyspark中创建包含两个dataframe列的字典?如何创建一个列,其中包含另一列给定范围内的所有值
相关搜索:
页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

Pandas Sort:你 Python 数据排序指南

行和都有索引,它是数据在 DataFrame 位置数字表示。您可以使用 DataFrame 索引位置从特定行或检索数据。默认情况下,索引号从零开始。您也可以手动分配自己索引。...因此,如果您计划执行多种排序,则必须使用稳定排序算法。 在多列上对 DataFrame 进行排序 在数据分析,通常希望根据多值对数据进行排序。想象一下,您有一个包含人们名字和姓氏数据集。...下一个示例将解释如何指定排序顺序以及为什么注意您使用列名列表很重要。 按升序按多排序 要在多个列上对 DataFrame 进行排序,您必须提供一个列名称列表。...Y Manual 5-spd 1993 [100 rows x 10 columns] 您已经创建一个使用多个值排序 DataFrame。请注意行索引如何没有特定顺序。...探索高级索引排序概念 在数据分析中有很多情况您希望对分层索引进行排序。你已经看到了如何使用make和model在MultiIndex。对于此数据集,您还可以将该id用作索引

14.2K00

python数据分析——数据选择和运算

一、数据选择 1.NumPy数据选择 NumPy数组索引包含内容非常丰富,有很多种方式选中数据子集或者某个元素。...正整数用于从数组开头开始索引元素(索引从0开始),而负整数用于从数组结尾开始索引元素,其中最后一个元素索引是-1,第二个到最后一个元素索引是-2,以此类推。...数据获取 ①索引取值 使用单个值或序列,可以从DataFrame索引一个或多个。...True表示按连结主键(on 对应列名)进行升序排列。 【例】创建两个不同数据帧,并使用merge()对其执行合并操作。 关键技术:merge()函数 首先创建两个DataFrame对象。...代码和输出结果如下所示: (3)使用“how”参数合并 关键技术:how参数指定如何确定结果表包含哪些键。如果左表或右表中都没有出现组合键,则联接表值将为NA。

17010
  • python对100G以上数据进行排序,都有什么好方法呢

    行和都有索引,它是数据在 DataFrame 位置数字表示。您可以使用 DataFrame 索引位置从特定行或检索数据。默认情况下,索引号从零开始。您也可以手动分配自己索引。...因此,如果您计划执行多种排序,则必须使用稳定排序算法。 在多列上对 DataFrame 进行排序 在数据分析,通常希望根据多值对数据进行排序。想象一下,您有一个包含人们名字和姓氏数据集。...下一个示例将解释如何指定排序顺序以及为什么注意您使用列名列表很重要。 按升序按多排序 要在多个列上对 DataFrame 进行排序,您必须提供一个列名称列表。...Y Manual 5-spd 1993 [100 rows x 10 columns] 您已经创建一个使用多个值排序 DataFrame。请注意行索引如何没有特定顺序。...探索高级索引排序概念 在数据分析中有很多情况您希望对分层索引进行排序。你已经看到了如何使用make和model在MultiIndex。对于此数据集,您还可以将该id用作索引

    10K30

    在 Python ,通过列表字典创建 DataFrame 时,若字典 key 顺序不一样以及部分字典缺失某些键,pandas 将如何处理?

    当通过列表字典来创建 DataFrame 时,每个字典通常代表一行数据,字典键(key)对应列名,而值(value)对应该行该数据。如果每个字典中键顺序不同,pandas 将如何处理呢?...顺序:在创建 DataFrame 时,pandas 会检查所有字典中出现键,并根据这些键首次出现顺序来确定顺序。...DataFrame df = pd.DataFrame(data, dtype=np.float64) # 输出结果查看 df 这段代码主要目的是创建一个 DataFrame其中包含一些具有不同键顺序和缺失键字典...:这行代码定义了一个列表其中包含多个字典。每个字典都有一些键值对,但键顺序和存在键可能不同。...总的来说,这段代码首先导入了所需库,然后创建一个包含多个字典列表,最后将这个列表转换为 DataFrame,并输出查看。

    11300

    整理了 25 个 Pandas 实用技巧,拿走不谢!

    有很多种实现途径,我最喜欢方式是传一个字典给DataFrame constructor,其中字典keys为列名,values为取值。 ?...为了避免这种情况,我们需要告诉concat()函数来忽略索引,使用默认整数索引: ? 10. 按从多个文件构建DataFrame一个技巧对于数据集中每个文件包含行记录很有用。...从剪贴板创建DataFrame 假设你将一些数据储存在Excel或者Google Sheet,你又想要尽快地将他们读取至DataFrame。 你需要选择这些数据并复制至剪贴板。...将一个列表组成Series扩展成DataFrame 让我们创建一个示例DataFrame: ? 这里有两,第二包含了Python由整数元素组成列表。...我们现在隐藏了索引,将Close最小值高亮成红色,将Close最大值高亮成浅绿色。 这里有另一个DataFrame格式化例子: ?

    3.2K10

    针对SAS用户:Python数据分析库pandas

    可以认为Series是一个索引、一维数组、类似一值。可以认为DataFrames是包含行和二维数组索引。好比Excel单元格按行和列位置寻址。...SAS数组主要用于迭代处理如变量。SAS/IML更接近模拟NumPy数组。但SAS/IML 在这些示例范围之外。 ? 一个Series可以有一个索引标签列表。 ?...另外,如果你发现自己想使用迭代处理来解决一个pandas操作(或Python),停下来,花一点时间做研究。可能方法或函数已经存在! 案例如下所示。...它将.sum()属性链接到.isnull()属性来返回DataFrame缺失值计数。 .isnull()方法对缺失值返回True。...公司执行面临角色度过他职业生涯。从技术架构师开始,最近担任顾问,他建议企业领导如何培养和成本有效地管理他们分析资源组合。最近,这些讨论和努力集中于现代化战略,鉴于行业创新增长。

    12.1K20

    整理了25个Pandas实用技巧

    从剪贴板创建DataFrame 假设你将一些数据储存在Excel或者Google Sheet,你又想要尽快地将他们读取至DataFrame。 你需要选择这些数据并复制至剪贴板。...让我们再复制另外一个数据至剪贴板: ? 神奇是,pandas已经将第一作为索引了: ? 需要注意是,如果你想要你工作在未来可复制,那么read_clipboard()并不值得推荐。...这里有两,第二包含了Python由整数元素组成列表。...我们可以通过链式调用函数来应用更多格式化: ? 我们现在隐藏了索引,将Close最小值高亮成红色,将Close最大值高亮成浅绿色。 这里有另一个DataFrame格式化例子: ?...它会返回一个互动HTML报告: 第一部分为该数据集总览,以及该数据集可能出现问题列表 第二部分为每一总结。

    2.8K40

    整理了25个Pandas实用技巧(下)

    从剪贴板创建DataFrame 假设你将一些数据储存在Excel或者Google Sheet,你又想要尽快地将他们读取至DataFrame。 你需要选择这些数据并复制至剪贴板。...: 神奇是,pandas已经将第一作为索引了: 需要注意是,如果你想要你工作在未来可复制,那么read_clipboard()并不值得推荐。...DataFrame: 这里有两,第二包含了Python由整数元素组成列表。...但是,一个更灵活和有用方法是定义特定DataFrame格式化(style)。 让我们回到stocks这个DataFrame: 我们可以创建一个格式化字符串字典,用于对每一进行格式化。...它会返回一个互动HTML报告: 第一部分为该数据集总览,以及该数据集可能出现问题列表 第二部分为每一总结。

    2.4K10

    一个数据集全方位解读pandas

    Series是根据列表创建一个新对象,一个Series对象包含两个组件:值和索引 >>> revenues = pd.Series([5555, 7000, 1980]) >>> revenues 0...我们知道Series对象在几种方面与列表和字典相似之处。也就意味着我们可以使用索引运算符。现在我们来说明如何使用两种特定于pandas访问方法:.loc和.iloc。...五、查询数据集 现在我们已经了解了如何根据索引访问大型数据集子集。现在,我们继续基于数据集值选择行以查询数据。例如,我们可以创建一个DataFrame包含2010年之后打过比赛。...仅包含其中值"year_id"大于行2010。...接下来要说如何在数据分析过程不同阶段操作数据集

    7.4K20

    最全面的Pandas教程!没有之一!

    以及用一个字典来创建 DataFrame: ? 获取 DataFrame 要获取一数据,还是用括号 [] 方式,跟 Series 类似。...这个方法将把目标 DataFrame 索引存在一个叫 index ,而把表格索引变成默认从零开始数字,也就是 [0, ..., len(data) - 1] 。比如下面这样: ?...你可以从一个包含许多数组列表创建多级索引(调用 MultiIndex.from_arrays ),也可以用一个包含许多元组数组(调用 MultiIndex.from_tuples )或者是用一对可迭代对象集合...下面这个例子,我们从元组创建多级索引: ? 最后这个 list(zip()) 嵌套函数,把上面两个列表合并成了一个每个元素都是元组列表。...其中 left 参数代表放在左侧 DataFrame,而 right 参数代表放在右边 DataFrame;how='inner' 指的是当左右两个 DataFrame 存在不重合 Key 时,

    25.9K64

    Pandas图鉴(三):DataFrames

    创建一个DataFrame已经存储在内存数据构建一个DataFrame竟是如此超凡脱俗,以至于它可以转换你输入任何类型数据: 第一种情况,没有行标签,Pandas用连续整数来标注行。...还有两个创建DataFrame选项(不太有用): 从一个dict列表(每个dict代表一个行,它键是列名,它值是相应单元格值)。...如果该已经索引,你可以使用join(这只是merge一个别名,left_index或right_index设置为True,默认值不同)。...现在,如果要合并已经在右边DataFrame索引,请使用join(或者用right_index=True进行合并,这完全是同样事情): join()在默认情况下做左外连接 这一次,Pandas...在上面的例子,所有的值都是存在,但它不是必须: 对数值进行分组,然后对结果进行透视做法非常普遍,以至于groupby和pivot已经被捆绑在一起,成为一个专门函数(和一个相应DataFrame

    39720

    【Python】这25个Pandas高频实用技巧,不得不服!

    有很多种实现途径,我最喜欢方式是传一个字典给DataFrame constructor,其中字典keys为列名,values为取值。...按从多个文件构建DataFrame一个技巧对于数据集中每个文件包含行记录很有用。但是如果数据集中每个文件包含信息呢?...从剪贴板创建DataFrame 假设你将一些数据储存在Excel或者Google Sheet,你又想要尽快地将他们读取至DataFrame。 你需要选择这些数据并复制至剪贴板。...':[[10, 40], [20, 50], [30, 60]]}) df 这里有两,第二包含了Python由整数元素组成列表。...它会返回一个互动HTML报告: 第一部分为该数据集总览,以及该数据集可能出现问题列表; 第二部分为每一总结。

    6.6K50

    Pandas最详细教程来了!

    其中最常用DataFrame,下面我们先来学习一下DataFrame。 01 DataFrame入门 DataFrame一个表格型数据结构。...▲图3-3 如果某存在,为其赋值,会创建一个。我们可以用这种方法来添加一个: df['D']=10 df 运行结果如图3-4所示。 ?...▲图3-7 loc方法将在后面的内容详细介绍。 索引存在,使得Pandas在处理缺漏信息时候非常灵活。下面的示例代码会新建一个DataFrame数据df2。...▲图3-9 可以看到,df只接受索引已经存在值。由于df2没有索引e,所以是NaN值,而且df2索引为z已经丢失了。...下面介绍一下如何基于时间序列生成DataFrame。为了创建时间序列数据,我们需要一个时间索引

    3.2K11

    直观地解释和可视化每个复杂DataFrame操作

    每种方法都将包括说明,可视化,代码以及记住它技巧。 Pivot 透视表将创建一个“透视表”,该透视表将数据现有投影为新表元素,包括索引和值。...包含将转换为两:一用于变量(值名称),另一用于值(变量包含数字)。 ? 结果是ID值(a,b,c)和值(B,C)及其对应值每种组合,以列表格式组织。...在表上调用堆栈后再调用堆栈不会更改该堆栈(原因是存在“ 0 ”)。 ? 堆叠参数是其级别。在列表索引索引为-1将返回最后一个元素。这与水平相同。...作为另一个示例,当级别设置为0(第一个索引级别)时,其中值将成为,而随后索引级别(第二个索引级别)将成为转换后DataFrame索引。 ?...请注意,concat是pandas函数,而不是DataFrame之一。因此,它接受要连接DataFrame列表。 如果一个DataFrame另一包含,默认情况下将包含,缺失值列为NaN。

    13.3K20

    数据处理利器pandas入门

    import pandas as pd s=pd.Series([5,4,3,2,1], index=['a', 'c', 'e', 3, 1]) ⚠️ 创建时给定了一个列表: [5,4,3,2,1...除了使用传入列表或numpy数组之外,也可以通过字典方式创建: s=pd.Series({'a':5, 'b':4, 'c':3, 'd':2, 'e':1}) DataFrame DataFrame...:由于数据包含了时间信息(date和hour),为了方便操作,我们可以使用以下命令将时间设置为索引。...即获取每个站点时,可以直接获取当前站点所有要素数据,而且时间索引也按照单个时刻排列,索引不会出现重复值,而之前存储形式索引出现重复。索引重复会使得某些操作出错。...索引切片: 可以理解成 idx 将 MultiIndex 视为一个 DataFrame,然后将上层索引视为行,下层索引视为,以此来进行数据查询。

    3.7K30

    pandas

    1961/1/8 0:00:00 4.pandasseries与DataFrame区别 Series是带索引一维数组 Series对象两个重要属性是:index(索引)和value(数据值)...DataFrame任意一行或者一就是一个Series对象 创建Series对象:pd.Series(data,index=index)   其中data可以是很多类型: 一个列表----------...) 与Series不同是,DataFrame包括索引index和表头columns:   其中data可以是很多类型: 包含列表、字典或者Series字典 二维数组 一个Series对象 另一个DataFrame...] = value instead 问题:当向列表增加一时,需要先将变量复制一份,再添加才可以 a=a.copy() a['column01']= column pandas添加索引列名称..._append(temp, ignore_index=True) pandas数据转置 与矩阵相同,在 Pandas ,我们可以使用 .transpose() 方法或 .T 属性来转置 我们DataFrame

    12310

    数据分析篇 | PyCon 大咖亲传 pandas 25 式,长文建议收藏

    操控缺失值 把字符串分割为多 把 Series 里列表转换为 DataFrame 用多个函数聚合 用一个 DataFrame 合并聚合输出结果 选择行与 重塑多重索引 Series 创建透视表...创建 DataFrame 创建 DataFrame 方式有很多,比如,可以把字典传递给 DataFrame 构建器,字典 Key 是列名,字典 Value 为列表,是 DataFrame 值...用这种方式转换第三会出错,因为这包含一个代表 0 下划线,pandas 无法自动判断这个下划线。...把字符串分割为多 创建一个 DataFrame 示例。 ? 把姓名列分为姓与名两,用 str.split() 方法,按空格分割,并用 expand 关键字,生成一个 DataFrame。 ?...把 Series 里列表转换为 DataFrame 创建一个 DataFrame 示例。 ? 这里包含了两,第二包含是 Python 整数列表

    7.1K20

    精品教学案例 | 金融贷款数据清洗

    查看数据缺失值数量所占总数据量百分比,从而使结果更加直观,以便进一步处理缺失值。 创建一个DataFrame数据表来存储每数据缺失值所占百分比。...首先创建一个字典用于存储填补缺失值所需要传入字典。 因之前已经计算完毕了填补各所需值,此处就直接使用计算得到值即可。...首先简单查看缺失值在该位置,方便之后进行对比,此处选取索引为253到259几行来作为对比。...3.1 Python自带文件写入函数存储 Python自带函数写入文件较为简单,首先需要将文件作为对象读取,也就是使用open()函数将文件载入到内存创建一个对应对象,其中一个字符串代表着文件路径...()函数可以传入列表作为写入内容,需要在列表添加换行符进行换行。

    4.6K21

    解决KeyError: “Passing list-likes to .loc or [] with any missing labels is no long

    , 'C']df.loc[labels]在上述示例,标签列表包含一个缺失标签​​'C'​​,因此会引发​​KeyError​​。...我们使用列表推导式和​​.columns.isin()​​方法来过滤标签,仅选择存在DataFrame有效标签。...然后,我们使用​​.reindex()​​方法来重新索引DataFrame,仅选择存在于有效标签。...假设我们有一个订单数据DataFrame包含了订单号、商品名称和商品价格等信息。现在我们需要根据一组订单号列表,筛选出对应订单数据。...)在上述示例代码,我们首先创建一个示例订单数据DataFrame,并定义了一个订单号列表​​order_ids​​。

    34310
    领券