使用padas dataframe中的for、If语句计算持续时间

在使用Pandas DataFrame时，for循环和if语句通常不是最高效的方法来处理数据，因为Pandas提供了向量化操作，这些操作针对性能进行了优化。然而，如果你确实需要使用for循环和if语句，下面是一个例子，展示了如何计算两列之间的持续时间。

假设我们有一个DataFrame，其中包含开始时间和结束时间：

import pandas as pd

# 创建一个示例DataFrame
data = {
    'start_time': ['2023-01-01 10:00:00', '2023-01-02 11:00:00', '2023-01-03 12:00:00'],
    'end_time': ['2023-01-01 11:30:00', '2023-01-02 12:45:00', '2023-01-03 14:00:00']
}
df = pd.DataFrame(data)

# 将时间列转换为datetime类型
df['start_time'] = pd.to_datetime(df['start_time'])
df['end_time'] = pd.to_datetime(df['end_time'])

# 创建一个新列来存储持续时间
df['duration'] = None

# 使用for循环和if语句计算持续时间
for index, row in df.iterrows():
    if pd.notnull(row['start_time']) and pd.notnull(row['end_time']):
        df.at[index, 'duration'] = row['end_time'] - row['start_time']

在这个例子中，我们首先创建了一个包含开始时间和结束时间的DataFrame。然后，我们将这两列转换为datetime类型，以便能够计算它们之间的差异。接着，我们初始化一个新的列duration来存储持续时间。最后，我们遍历DataFrame的每一行，使用if语句检查开始时间和结束时间是否不为空，如果不为空，则计算它们之间的差异，并将结果存储在duration列中。

这种方法的缺点是它比较慢，特别是当处理大型数据集时。更高效的方法是使用Pandas的向量化操作，如下所示：

# 使用向量化操作计算持续时间
df['duration'] = df['end_time'] - df['start_time']

这种方法不需要显式的循环，它会自动应用于整个DataFrame，通常会更快。

参考链接：

使用padas dataframe中的for、If语句计算持续时间

、、、、

我是pandas和python的新手-您的回答非常感谢我在数据框中有三列，其中值如下: print(df) |name |date&time |IdProgress 2021-01-1 17:29:58 Bike2 10 Stop 2021-01-1 17:30:00 Bike2 我试图通过排除暂停和恢复之间的时间来获得在这里花费的总时间的持续时间

浏览 32提问于2021-05-10得票数 0

回答已采纳

2回答

未返回任何内容时的Numpy Docstring

、、、、

这里已经提出了一个非常类似的问题：Docstrings when nothing is returned 但我也想用Numpy Docstring问同样的问题。Returns void print(x) return 写Numpy Docstring "no return“类型最方便的方法是什么使用void、-、blank还是其他什么更可取？供您参考，https://numpydoc.readthedocs.io&#x

浏览 25提问于2021-07-30得票数 0

1回答

迭代padas dataframe中的列

、、、

我有一个CSV文件，我试图通过将列"a“的每个值与列"b”的每个值相乘来计算该值。我写了一个代码，但现在它一次只能乘以一个特定值。例如，目前，我的代码打印"a“列的第一个值的乘法，方法是迭代分子中"a”列的值，然后将其除以"b“列的第一个值与"b”列的所有值的乘积，并且我必须对"a“列的其他值重复此过程。我是py

浏览 11提问于2021-09-14得票数 0

1回答

当几个栏满足条件时，分配价值。

、、、

用例如下:如果在Pandas中，几个列大于零，我希望创建一个值为1的新列，如果相同的列为负值，我希望设置-1，否则我希望设置0。import numpy as np [ [-10).all(1)] =

浏览 3提问于2020-11-23得票数 0

2回答

列中的不同颜色，Padas DataFrame

、、、

我有这样的Pandas DataFrame： data = pd.DataFrame({"fuel":["gas","gas","diesel","diesel","gas","diesel"]})我应该怎么做才能拥有不同颜色的列？

浏览 28提问于2019-12-28得票数 0

2回答

在方法上调用方法并美化输出(链接方法)

、、

比方说，我有一个Information类，它的方法可以处理一些dataframe并返回dataframe。return dataframe do something..return stringstudent1 =信息(101)返回相同的内容0 101 Thor如何在方法输出上仅获取调用另一个方法的</e

浏览 10提问于2021-07-16得票数 0

1回答

用pandas.read_excel加载复杂的excel

、、、、

我是python的新手，尤其是pandas的新手，我正在尝试加载excel文件，其标题如下：where 0，1，2-文件中的索引或行，我尝试将其加载到padas.DataFrame中，如下所示：数

浏览 1提问于2015-03-05得票数 0

1回答

如果2列相等，则合并数据行(但顺序不同)

、

在padas dataframe中，我想检查是否有这样的行：a b 1 NaN b a

浏览 3提问于2022-02-03得票数 1

回答已采纳

1回答

更改字符串的格式以计算python中的持续时间

、

我试图从列开始时间和结束时间计算持续时间。我把它们作为字符串‘00:00:00:00’，我正在考虑用‘’“替换每一个':‘。因此，我可以很容易地减去它们作为双类型来计算持续时间。为了实现这一点，我尝试了以下代码：endT=list() startT=(dataframe['Chat SessionendT=(dataframe['Chat Session End Ti

浏览 2提问于2022-08-16得票数 0

回答已采纳

1回答

通过比较时间和持续时间合并dataframe* pandas中的行*

、、、

在同一数据帧中合并行(数百万条记录)的最有效方法是什么？输入/输出列id、startTime(秒)、持续时间(秒) 对于给定的id，如果startTime + duration等于下一行的startTime (对于相同的id)，那么输出的dataframe应该包含相对于row3的新持续时间，row1 startTime 65760 + 860 (新计算的持续时间<

浏览 14提问于2019-12-20得票数 0

回答已采纳

3回答

木星笔记本中两台CSV的组合

、、、、

📷我想结合两个基于Column1的csv文件，同时当组合两个CSV的每个Column1元素时，也应该匹配每一行，或者请建议如何根据另一个csv重新排序Column1。在木星笔记本上谢谢！

浏览 0提问于2020-08-04得票数 3

回答已采纳

1回答

使用re.sub()从熊猫数据中删除其他所有内容时出错

、

我有一个df，其中包含字母数字文本的一些变量。Online']我想要一个没有空格的DF，像@!&%这样的特殊字符？等。我试图使用以下代码删除padas dataframe中的字母数字以外的其他所有内容： df = df.apply(lambda x: x.re.sub('[^a-zA-Z\d\s]', '', x) if

浏览 1提问于2020-01-17得票数 0

回答已采纳

1回答

将每一行值连接到python中的NaN值。

、、、

我对python非常陌生，我正试图找到解决以下问题的方法，如果有人知道这个查询的解决方案，请提供帮助。我希望将每个行值连接到nan值，然后将其存储为新列的相应行值。下面是一个支持我的查询的示例:输入数据如下所示： df = pd.DataFrame({"student_name":['mike','maria','alex','mary','shirin'

浏览 5提问于2022-01-12得票数 -3

1回答

列的值不在padas* dataframe的索引中*

、、、

我正在使用的正则表达式计算dataframe中的新列，如下所示：.str.extract("(?P<Address>.*\d+[\w+?|\s]\s?在这方面的任何帮助都将受到高度的感谢。提前感谢您的支持！

浏览 1提问于2021-09-17得票数 1

1回答

熊猫统计开/关事件的数量和持续时间

我有一个包含两列的DataFrame，一列包含事件的时间，另一列包含事件是On还是Off。我想要计算On发生的次数，然后是Off，以及On发生的总持续时间。例如，请参阅此DataFrame：01:00 On01:16 Off02:15 Off将有2个总持续时间为O:30的On/Off事件。

浏览 3提问于2019-08-09得票数 1

回答已采纳

1回答

熊猫计算前几行的总数。

、、、

022', '011','011', '011','011', '011', '6','6'],} df = pd.DataFrame(data, columns = ['process','type','country', 'id', '

浏览 1提问于2021-08-06得票数 0

回答已采纳

1回答

使用python计算同一列中2行之间的持续时间，它们在另2列中相互匹配？

、

我有一个dataframe，如下所示(例如，只显示4行，但dataframe有超过数千行)：我希望得到id 755 (位置A)到976 (位置C)之间的持续时间(从/到达)(这个位置C需要相同)，等等，然后根据plateno创建一个持续时间<

浏览 0提问于2018-04-25得票数 1

回答已采纳

8回答

计算Server中调用的不同关税期

、、、、

对于呼叫评级系统，我试图将电话通话的持续时间划分为不同收费期的次持续时间。调用存储在Server数据库中，并具有启动时间和总持续时间。显然，调用可以覆盖无限的时间段(我们不强制执行最大调用持续时间)。一个持续时间超过24小时的呼叫可以覆盖所有三个时段，从高峰开始，经过非高峰、夜间和返回高峰关税。目前，我们正在使用VB中的递归计算不同的</

浏览 9提问于2009-02-25得票数 2

1回答

列表中每一项的计数次数出现在带有逗号分隔值的熊猫dataframe列中，并附加其他列的聚合。

、、、

我有一份清单：和一只熊猫的Dataframe df1@email.col 8.8我想计算城市列表中每个城市

浏览 1提问于2020-09-28得票数 2

回答已采纳

2回答

总持续时间(不重复计算)- Pandas

、、

我有一只熊猫DataFrame，如下所示。列是日期、颜色、时间和持续时间(以秒为单位)。我需要计算整个一天的时间，我们正在显示一个颜色。12:00:00.00 1 如果我们查看上面示例中</e

浏览 0提问于2021-10-28得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用padas dataframe中的for、If语句计算持续时间

相关·内容

使用padas dataframe中的for、If语句计算持续时间

未返回任何内容时的Numpy Docstring

迭代padas dataframe中的列

当几个栏满足条件时，分配价值。

列中的不同颜色，Padas DataFrame

在方法上调用方法并美化输出(链接方法)

用pandas.read_excel加载复杂的excel

如果2列相等，则合并数据行(但顺序不同)

更改字符串的格式以计算python中的持续时间

通过比较时间和持续时间合并dataframe* pandas中的行*

木星笔记本中两台CSV的组合

使用re.sub()从熊猫数据中删除其他所有内容时出错

将每一行值连接到python中的NaN值。

列的值不在padas* dataframe的索引中*

熊猫统计开/关事件的数量和持续时间

熊猫计算前几行的总数。

使用python计算同一列中2行之间的持续时间，它们在另2列中相互匹配？

计算Server中调用的不同关税期

列表中每一项的计数次数出现在带有逗号分隔值的熊猫dataframe列中，并附加其他列的聚合。

总持续时间(不重复计算)- Pandas

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐