如何让Pandas从下一行开始在新列中创建sumsum？

要让Pandas从下一行开始在新列中创建sumsum，可以使用shift()函数来实现。shift()函数可以将数据向下移动指定的行数，然后可以使用sum()函数对移动后的数据进行求和。

以下是实现的步骤：

导入Pandas库：

import pandas as pd

创建一个DataFrame对象，假设数据存储在名为df的DataFrame中：

df = pd.DataFrame({'A': [1, 2, 3, 4, 5]})

使用shift()函数将数据向下移动一行：

df['sumsum'] = df['A'].shift(1)

使用sum()函数对移动后的数据进行求和：

df['sumsum'] = df['sumsum'].fillna(0) + df['A']

完整的代码如下：

import pandas as pd

df = pd.DataFrame({'A': [1, 2, 3, 4, 5]})
df['sumsum'] = df['A'].shift(1)
df['sumsum'] = df['sumsum'].fillna(0) + df['A']

print(df)

输出结果如下：

   A  sumsum
0  1     0.0
1  2     3.0
2  3     5.0
3  4     7.0
4  5     9.0

在这个例子中，我们创建了一个名为A的列，并使用shift()函数将数据向下移动一行，然后将移动后的数据与原始数据相加，得到新的sumsum列。第一行的sumsum值为0，因为没有前一行的数据。

相关·内容

8个Python高效数据分析的技巧。

1 一行代码定义List 定义某种列表时，写For 循环过于麻烦，幸运的是，Python有一种内置的方法可以在一行代码中解决这个问题。下面是使用For循环创建列表和用一行代码创建列表的对比。...Lambda表达式用于在Python中创建小型，一次性和匿名函数对象，它能替你创建一个函数。 lambda表达式的基本语法是： lambda arguments: expression 注意！...具体来说，map通过对列表中每个元素执行某种操作并将其转换为新列表。在本例中，它遍历每个元素并乘以2，构成新列表。（注意！...在Pandas中，删除一列或在NumPy矩阵中求和值时，可能会遇到Axis。...如果你想在Python中对其进行索引，则行数下标为0，列数下标为1，这很像我们如何声明轴值。 6 Concat，Merge和Join 如果您熟悉SQL，那么这些概念对你来说可能会更容易。

2.2K1 0

8 个 Python 高效数据分析的技巧

一行代码定义List 定义某种列表时，写For 循环过于麻烦，幸运的是，Python有一种内置的方法可以在一行代码中解决这个问题。 ? 下面是使用For循环创建列表和用一行代码创建列表的对比。...Lambda表达式用于在Python中创建小型，一次性和匿名函数对象。它能替你创建一个函数。...具体来说，map通过对列表中每个元素执行某种操作并将其转换为新列表。在本例中，它遍历每个元素并乘以2，构成新列表。请注意，list()函数只是将输出转换为列表类型。...在Pandas中，删除一列或在NumPy矩阵中求和值时，可能会遇到Axis。...如果你想在Python中对其进行索引，则行数下标为0，列数下标为1，这很像我们如何声明轴值。 Concat，Merge和Join 如果您熟悉SQL，那么这些概念对您来说可能会更容易。

2.7K2 0

这 8 个 Python 技巧让你的数据分析提升数倍！

，幸运的是，Python有一种内置的方法可以在一行代码中解决这个问题。...Lambda表达式用于在Python中创建小型，一次性和匿名函数对象。它能替你创建一个函数。...具体来说，map通过对列表中每个元素执行某种操作并将其转换为新列表。在本例中，它遍历每个元素并乘以2，构成新列表。请注意，list()函数只是将输出转换为列表类型。...---- ---- 在Pandas中，删除一列或在NumPy矩阵中求和值时，可能会遇到Axis。...如果你想在Python中对其进行索引，则行数下标为0，列数下标为1，这很像我们如何声明轴值。

2K1 0

8个Python高效数据分析的技巧

一行代码定义List ? 下面是使用For循环创建列表和用一行代码创建列表的对比。...Lambda表达式用于在Python中创建小型，一次性和匿名函数对象。它能替你创建一个函数。...具体来说，map通过对列表中每个元素执行某种操作并将其转换为新列表。在本例中，它遍历每个元素并乘以2，构成新列表。请注意，list()函数只是将输出转换为列表类型。...---- 在Pandas中，删除一列或在NumPy矩阵中求和值时，可能会遇到Axis。...如果你想在Python中对其进行索引，则行数下标为0，列数下标为1，这很像我们如何声明轴值。

2.1K2 0

Python科学计算之Pandas

当你在Pandas中查找列时，你通常需要使用列名。这样虽然非常便于使用，但有时候，数据可能会有特别长的列名，例如，有些列名可能是问卷表中的某整个问题。把这些列名变短会让你的工作更加轻松： ?...在Pandas中，一个条目等同于一行，所以我们可以通过len方法获取数据的行数，即条目数。 ? 这将给你一个整数告诉你数据的行数。在我的数据集中，我有33行。...在返回的series中，这一行的每一列都是一个独立的元素。可能在你的数据集里有年份的列，或者年代的列，并且你希望可以用这些年份或年代来索引某些行。这样，我们可以设置一个（或多个）新的索引。 ?...这将会给’water_year’一个新的索引值。注意到列名虽然只有一个元素，却实际上需要包含于一个列表中。如果你想要多个索引，你可以简单地在列表中增加另一个列名。 ?...例如，如果你有一列年份的数据而你希望创建一个新的列显示这些年份所对应的年代。Pandas对此给出了两个非常有用的函数，apply和applymap。 ? 这会创建一个名为‘year‘的新列。

2.9K0 0

Pandas实现分列功能（Pandas读书笔记1）

首先介绍什么是pandas panda我们很熟悉！蠢萌蠢萌，让人想抱起来捏两下的国宝！ pandas是什么啦！遥记英文老师曾讲S是复数的意思！那pandas就是！！！！好吧！...pandas的主人貌似是熊猫爱好者，或者最初是用来分析熊猫行为的！不管怎样，Pandas是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。...打开文件用了1分钟，我不太舍得让大家盯着圆圈看一分钟，所以还是略过打开的截图了！我自己一行一行的数，数了四个小时，一共有57万多行！ ? 如何按照K列镇区的非重复值拆分为独立文件呢！...刚刚演示了普通劳动人民是如何按照某列拆分一列的！考虑K列有三十多种可能，勤劳如我也没有操作完！你们感兴趣可以弄一下！方法二、Excel达人！ Excel强如我的！肯定不会手动筛选然后粘贴了！...,sep=',') #存储至新的文件夹，并且按照筛选条件命名文件知道有的朋友看到这些代码很头疼！

3.6K4 0

如何把时间序列问题转化为监督学习问题？通俗易懂的 Python 教程

本教程包含：如何创建把时间序列数据集转为监督学习数据集的函数；如何让单变量时间序列数据适配机器学习如何让多变量时间序列数据适配机器学习现在我们开始。时间序列 vs....我们通过在顶端插入新的一行，用一个时间步（time step）把所有的观察降档（shift down）。由于新的一行不含数据，可以用 NaN 来表示 “无数据”。 Shift 函数能完成该任务。...我们能看到，如果在 shift 2、3 …… 重复该过程，要如何创建能用来预测输出值 y 的长输出序列（X）。 Shift 操作器可以接受一个负整数值。这起到了通过在末尾插入新的行，来拉起观察的作用。...对于一个监督学习问题，在一个有输入、输出模式的时间序列里，我们可以看到如何用正负 shift 来生成新的 DataFrame 。...函数返回一个单个的值： return: 序列的 Pandas DataFrame 转为监督学习。新数据集创建为一个 DataFrame，每一列通过变量字数和时间步命名。

2.5K7 0

开发 | 如何把时间序列问题转化为监督学习问题？通俗易懂的 Python 教程

本教程包含：如何创建把时间序列数据集转为监督学习数据集的函数；如何让单变量时间序列数据适配机器学习如何让多变量时间序列数据适配机器学习现在我们开始。时间序列 vs....我们通过在顶端插入新的一行，用一个时间步（time step）把所有的观察降档（shift down）。由于新的一行不含数据，可以用 NaN 来表示“无数据”。 Shift 函数能完成该任务。...我们能看到，如果在 shift 2、3 ……重复该过程，要如何创建能用来预测输出值 y 的长输出序列（X）。 Shift 操作器可以接受一个负整数值。这起到了通过在末尾插入新的行，来拉起观察的作用。...对于一个监督学习问题，在一个有输入、输出模式的时间序列里，我们可以看到如何用正负 shift 来生成新的 DataFrame 。...函数返回一个单个的值： return: 序列的 Pandas DataFrame 转为监督学习。新数据集创建为一个 DataFrame，每一列通过变量字数和时间步命名。

1.6K5 0

Python与Excel协同应用初学者指南

在处理数据时，需要在某个时候处理电子表格；然而，直接处理电子表格有时会让人恼火，尤其当你是一名开发人员的时候。...电子表格数据的最佳实践在开始用Python加载、读取和分析Excel数据之前，最好查看示例数据，并了解以下几点是否与计划使用的文件一致：电子表格的第一行通常是为标题保留的，标题描述了每列数据所代表的内容...然而，把这作为第一步，会让事情变得更简单，并确保有一个良好的开端。验证代码库目录是否与Python的工作目录相同。在终端中工作时，可以首先导航到文件所在的目录，然后启动Python。...从下面的代码中可以看到，还可以从工作簿中加载另一张工作表：图11 虽然一开始会认为这些Worksheet对象没有用处，但你可以用它们做很多事情。...5.用值填充每行的所有列后，将转到下一行，直到剩下零行。

17.4K2 0

对比Excel，更强大的Python pandas筛选

如果不需要新数据框架中的所有列，只需将所需的列名传递到.loc[]中即可。例如，仅需要选择最新排名、公司名称和营业收入，我们可以执行以下操作。注意，它只返回我们指定的3列。...上面的代码行翻译为：对于每一行，如果“总部所在国家”是“中国”，则评估为Ture，否则为False。为了更好地形象化这个思想，让我展示一下在Excel中它是什么样子。...看看下面的Excel屏幕截图，添加了一个新列，名为“是否中国”，还使用了一个简单的IF公式来评估一行是否“总部所在国家”为中国，该公式返回1或0。实际上，我正在检查每一行的值。...上面的代码行创建了一个列表，该列表的长度与数据框架本身相同，并用True或False填充。这基本上就是我们在Excel中所做的。...在现实生活中，我们经常需要根据多个条件进行筛选，接下来，我们将介绍如何在pandas中进行一些高级筛选。

3.9K2 0

通宵翻译Pandas官方文档，写了这份Excel万字肝货操作！

在 Pandas 中，您使用特殊方法从/向 Excel 文件读取和写入。让我们首先基于上面示例中的数据框，创建一个新的 Excel 文件。 tips.to_excel("....在 Pandas 中，您需要更多地考虑控制 DataFrame 的显示方式。默认情况下，pandas 会截断大型 DataFrame 的输出以显示第一行和最后一行。...pandas 可以创建 Excel 文件、CSV 或许多其他格式。数据操作 1. 列操作在电子表格中，公式通常在单个单元格中创建，然后拖入其他单元格以计算其他列的公式。...在 Pandas 中，您可以直接对整列进行操作。 pandas 通过在 DataFrame 中指定单个系列来提供矢量化操作。可以以相同的方式分配新列。...我们将使用 =IF(A2 < 10, "low", "high")的公式，将其拖到新存储列中的所有单元格。使用 numpy 中的 where 方法可以完成 Pandas 中的相同操作。

19.5K2 0

用在数据科学上的 Python：你可能忘记的 8 个概念

为了巩固我对这些理念的理解和便于你们在 StackOverFlow 进行搜索，这里我整理出了我在使用 Python，Numpy，Pandas 中的一些知识点。...Lambda 函数在 Python 中通常被用来构建应用次数比较少的的匿名函数。也就是让你构建一个了不带名字的函数。...具体的说，map 函数通过对列表中的每一个元素进行操作，将列表转换成一个新的列表。在下面的这个例子中，map 函数将每一个元素乘以 2，变成一个新的元素。...如果你熟悉 Microsoft Excel，那你可能已经在某些方面听说过数据透视表。Pandas 内置的 pivot_table 函数可以将电子表格样式的数据透视表创建为 DataFrame。...需要注意的是，数据透视表中的级别存储在创建的 DataFrame 层次索引和列中。

1.2K1 0

pandas | 使用pandas进行数据处理——DataFrame篇

首先，我们先从最简单的开始，如何创建一个DataFrame。从字典创建 ?...当我们在jupyter输出的时候，它会自动为我们将DataFrame中的内容以表格的形式展现。...展示前若干条数据的方法叫做head，它接受一个参数，允许我们制定让它从头开始展示我们指定条数的数据。 ? 既然有展示前面若干条自然也有展示最后若干条的api，这样的api叫做tail。...返回的结果是这些新的列组成的新DataFrame。 ? 我们可以用del删除一个我们不需要的列： ?...我们要创建一个新的列也很简单，我们可以像是dict赋值一样，直接为DataFrame赋值即可： ? 赋值的对象并不是只能是实数，也可以是一个数组： ?

3.5K1 0

用Python将时间序列转换为监督学习问题

本教程包含：如何创建把时间序列数据集转为监督学习数据集的函数；如何让单变量时间序列数据适配机器学习如何让多变量时间序列数据适配机器学习时间序列 vs....t 0 0 1 1 2 2 3 3 4 4 5 5 6 6 7 7 8 8 9 9 我们通过在顶端插入新的一行，用一个时间步（time step）把所有的观察降档（shift down...由于新的一行不含数据，可以用 NaN 来表示“无数据”。 Shift 函数能完成该任务。我们可以把处理过的列插入到原始序列旁边。...对于一个监督学习问题，在一个有输入、输出模式的时间序列里，我们可以看到如何用正负 shift 来生成新的 DataFrame 。...函数返回一个单个的值： return: 序列的 Pandas DataFrame 转为监督学习。新数据集创建为一个 DataFrame，每一列通过变量字数和时间步命名。

3.8K2 0

来看看数据分析中相对复杂的去重问题

如果重复的那些行是每一列懂相同的，删除多余的行只保留相同行中的一行就可以了，这个在Excel或pandas中都有很容易使用的工具了，例如Excel中就是在菜单栏选择数据->删除重复值，然后选择根据哪些列进行去重就好...，pandas中是有drop_duplicates()函数可以用。...抽象一下，相当于把下面的表df根据uid去重，但是每个uid对应的name整合在一行里（暂且不管date列），从下图中左边的变成右边效果： ?...一个个比对是O(n^2)，我目前的思路时用除name之外的列合并形成一个字符串型的新列，拿这列做主键，用上面的代码片段。合并之后再删掉之前建的新列保持数据的格式。...指定根据哪些列去重，默认是根据所有列，也就是当两行的所有列都一样时满足去重条件； keep有三种选择：{‘first’, ‘last’, False}，first和last分别对应选重复行中的第一行、最后一行

2.4K2 0

如何用 Python 执行常见的 Excel 和 SQL 任务

我们从基础开始：打开一个数据集。导入数据你可以导入.sql 数据库并用 SQL 查询中处理它们。在Excel中，你可以双击一个文件，然后在电子表格模式下开始处理它。...每个括号内的列表都代表了我们 dataframe 中的一行，每列都以 key 表示：我们正在处理一个国家的排名，人均 GDP（以美元表示）及其名称（用「国家」）。...使用一行代码，我们已经将这些数据分配并保存到 Pandas dataframe 中 - 事实证明是这种情况，字典是要转换为 dataframe 的完美数据格式。 ?...在 Pandas 中，这样做的方式是rename 方法。 ? 在实现上述方法时，我们将使用列标题「gdppercapita」替换列标题「US $」。...我们为一个新的 dataframe 分配一个布尔索引的过滤器，这个方法基本上就是说「创建一个人均 GDP 超过 50000 的新 dataframe」。现在我们可以显示gdp50000。 ?

10.8K6 0

【每日一读】pandas的apply函数介绍及用法详解

Pandas 的 apply() 方法是用来调用一个函数(Python method)，让此函数对数据对象进行批量处理。...语法结构 apply函数是`pandas`里面所有函数中自由度最高的函数。...Apply Multiprocessing Apply Multiprocessing 通过上面的使用案例我们已经大概知道apply在日常开发中如何使用了，但上面1000条数据处理时长就8秒左右，那一万条岂不是更多...apply_parallel() 函数中使用了 Python 内置的 multiprocessing 模块创建了一个进程池，并将每一行数据都传递给一个函数进行处理。...在这个函数中，将 DataFrame 的neirong进行分词，然后将结果保存到新的列表中。

1.4K2 0

Python使用pandas读取excel表格数据

格式：直接print(df)得到的结果：对比结果和表格，很显然表格中的第一行（黄色高亮部分）被定义为数据块的列下标，而实际视作数据的是后四行（蓝色高亮部分）；并且自动在表格第一列之前加了一个行索引...用df.ix[i,j]读取数据并复制入二维数组中，其中for i in range(0,height)循环表示从下标0到下标height-1（不包含height），得到的输出如下：对代码做一些补充说明...：从DataFrame结构的数据中取值有三种常用的方法： #第一种方法：ix df.ix[i,j] # 这里面的i,j为内置数字索引，行列均从0开始计数 df.ix[row,col] # 这里面的row...比如我上述例子中列索引为表格的第一行{1，2，3，4}，而行索引为读取时自动添加的。经过实验这种情况将会优先使用表格行列索引，也就对应了上面代码中得到的结果。...在表格中自定义行列索引的情况如果表格是下面这样的形式：想要让读取得到的DataFrame行索引为{‘one’,‘two’,‘three’,‘four’}，列索引为{‘一’,‘二’,‘三’,

3.1K1 0

pandas 提速 315 倍！

其次，它使用不透明对象范围(0，len(df))循环，然后再应用apply_tariff()之后，它必须将结果附加到用于创建新DataFrame列的列表中。...一、使用 iterrows循环第一种可以通过pandas引入iterrows方法让效率更高。这些都是一次产生一行的生成器方法，类似scrapy中使用的yield用法。....iterrows为DataFrame中的每一行产生（index，series）这样的元组。在这个例子中使用.iterrows，我们看看这使用iterrows后效果如何。...那么这个特定的操作就是矢量化操作的一个例子，它是在pandas中执行的最快方法。但是如何将条件计算应用为pandas中的矢量化运算？...在下面代码中，我们将看到如何使用pandas的.isin()方法选择行，然后在矢量化操作中实现新特征的添加。

2.8K2 0

1000+倍！超强Python『向量化』数据处理提速攻略

这是一个非常基本的条件逻辑，我们需要为lead status创建一个新列。我们使用Pandas的优化循环函数apply()，但它对我们来说太慢了。...看下面的例子： numpy.where()它从我们的条件中创建一个布尔数组，并在条件为真或假时返回两个参数，它对每个元素都这样做。这对于在Dataframe中创建新列非常有用。...1、字符串假设你需要在一系列文本中搜索特定的模式，如果匹配，则创建一个新的series。这是一种.apply方法。...向量化所需要的所有函数都是在同一行上比较的值，这可以使用pandas.shift()实现！确保你的数据正确排序，否则你的结果就没有意义！很慢！...为了解决这个问题，我们对Pandas中的一个series使用.shift()将前一行移到相同的级别。一旦它们被转移到相同的级别，我就可以使用np.select()执行相同的条件向量化方法了！

6.5K4 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云