首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何将dataframe中对象列的持续时间(例如2h 50m、8h 35m)转换为仅包含分钟的日期时间列?

要将dataframe中对象列的持续时间转换为仅包含分钟的日期时间列,可以按照以下步骤进行操作:

  1. 首先,将对象列中的持续时间转换为分钟数。可以使用正则表达式或字符串处理方法提取小时和分钟数,并将其转换为分钟数。例如,对于持续时间为"2h 50m"的对象,可以提取出2小时和50分钟,然后将其转换为170分钟。
  2. 接下来,将分钟数转换为日期时间列。可以使用pandas库中的to_datetime函数将分钟数转换为日期时间格式。将分钟数作为参数传递给to_datetime函数,并指定单位为分钟。这将返回一个包含日期时间的新列。

以下是一个示例代码,演示如何将dataframe中的对象列转换为仅包含分钟的日期时间列:

代码语言:txt
复制
import pandas as pd
import re

# 创建示例dataframe
df = pd.DataFrame({'持续时间': ['2h 50m', '8h 35m', '1h 15m']})

# 提取小时和分钟数,并转换为分钟
df['分钟数'] = df['持续时间'].apply(lambda x: int(re.findall(r'\d+', x)[0])*60 + int(re.findall(r'\d+', x)[1]))

# 将分钟数转换为日期时间列
df['日期时间'] = pd.to_datetime(df['分钟数'], unit='m')

# 打印转换后的dataframe
print(df)

输出结果如下:

代码语言:txt
复制
    持续时间  分钟数                日期时间
0  2h 50m  170 1970-01-01 02:50:00
1  8h 35m  515 1970-01-01 08:35:00
2  1h 15m   75 1970-01-01 01:15:00

在这个示例中,我们首先使用正则表达式提取出持续时间中的小时和分钟数,并将其转换为分钟数。然后,使用to_datetime函数将分钟数转换为日期时间格式,并将其存储在新的列中。最后,打印转换后的dataframe。

对于腾讯云相关产品和产品介绍链接地址,由于要求不能提及具体的云计算品牌商,无法提供相关链接。但可以根据具体需求,在腾讯云官方网站上搜索相关产品,以获取更多信息。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

在Pandas中更改列的数据类型【方法总结】

例如,上面的例子,如何将列2和3转为浮点数?有没有办法将数据转换为DataFrame格式时指定类型?或者是创建DataFrame,然后通过某种方法更改每列的类型?...在这种情况下,设置参数: df.apply(pd.to_numeric, errors='ignore') 然后该函数将被应用于整个DataFrame,可以转换为数字类型的列将被转换,而不能(例如,它们包含非数字字符串或日期...另外pd.to_datetime和pd.to_timedelta可将数据转换为日期和时间戳。...软转换——类型自动推断 版本0.21.0引入了infer_objects()方法,用于将具有对象数据类型的DataFrame的列转换为更具体的类型。...例如,用两列对象类型创建一个DataFrame,其中一个保存整数,另一个保存整数的字符串: >>> df = pd.DataFrame({'a': [7, 1, 5], 'b': ['3','2','1

20.3K30

pandas 时序统计的高级用法!

重采样指的是时间重采样,就是将时间序列从一个频率转换到另一个频率上,对应数据也跟着频率进行变化。比如时间序列数据是以天为周期的,通过重采样我们可以将其转换为按分钟、小时、周、月、季度等等的其他周期上。...向上采样:转换到更细颗粒度的频率,比如将天转为小时、分钟、秒等 向下采样:转换到更粗颗粒度的频率,比如将天转为周、月、季度、年等 resample用法 pandas中时间重采样的方法是resample(...),可以对series和dataframe对象操作。...timestamp:将结果索引转换为DateTimeIndex period:将结果索引转换为PeriodIndex on:对于dataframe,指定被重采样的列,且列必须是时间类型 level:对于多级索引...最后一天的午夜 offset:对origin添加的偏移量,Timedelta或str类型 group_keys:指定是否在结果索引包含分组keys,当采样对象使用了.apply()方法,默认False不包含

45240
  • 时间序列的重采样和pandas的resample方法介绍

    2、Downsampling 下采样包括减少数据的频率或粒度。将数据转换为更大的时间间隔。 重采样的应用 重采样的应用十分广泛: 在财务分析中,股票价格或其他财务指标可能以不规则的间隔记录。...Pandas中的resample()方法 resample可以同时操作Pandas Series和DataFrame对象。它用于执行聚合、转换或时间序列数据的下采样和上采样等操作。...) # 将日期列设置为索引 df.set_index('date', inplace=True) # 使用resample()方法进行重新采样 # 将每日数据转换为每月数据并计算每月的总和...1、指定列名 默认情况下,Pandas的resample()方法使用Dataframe或Series的索引,这些索引应该是时间类型。但是,如果希望基于特定列重新采样,则可以使用on参数。...总结 时间序列的重采样是将时间序列数据从一个时间频率(例如每日)转换为另一个时间频率(例如每月或每年),并且通常伴随着对数据进行聚合操作。

    1.1K30

    Pandas 学习手册中文第二版:11~15

    已为sensors列中的每个不同值创建了一个组,并以该值命名。 然后,每个组都包含一个DataFrame对象,该对象由传感器值与该组名称匹配的行组成。...为了说明这一点,下面的代码创建一个DataFrame,其中Label列带有两个值(A和B),以及一个Values列,其中包含整数序列,但其中一个值替换为NaN。...此类可用于构造表示几种常见模式的对象,例如使用日期和时间的固定时间点,或者简单地是没有时间部分的一天,或者没有日期部分的时间。...这些通常是确定两个日期之间的持续时间或从另一个日期和/或时间开始的特定时间间隔内计算日期的结果。...第一类是代表绝对日期的关键字:年,月,日,小时,分钟,秒和微秒。 第二类代表相对持续时间,可以是负值:年,月,周,日,小时,分钟,秒和微秒。

    3.4K20

    pandas

    区别 Series是带索引的一维数组 Series对象的两个重要属性是:index(索引)和value(数据值) DataFrame的任意一行或者一列就是一个Series对象 创建Series对象:pd.Series...对象:pd.DataFrame(data,index,columns) 与Series不同的是,DataFrame包括索引index和表头columns:   其中data可以是很多类型: 包含列表、字典或者...Series的字典 二维数组 一个Series对象 另一个DataFrame对象 5.dataframe保存进excel中多个sheet(需要注意一下,如果是在for循环中,就要考虑writer代码的位置了...,periods=6), "age":np.arange(6)}) print(df) df["date"] = df["date"].dt.date #将date列中的日期转换为没有时分秒的日期..._append(temp, ignore_index=True) pandas数据转置 与矩阵相同,在 Pandas 中,我们可以使用 .transpose() 方法或 .T 属性来转置 我们的DataFrame

    13010

    Python面试十问2

    C', 3]] # 使用pandas的DataFrame()函数将列表转换为DataFrame df = pd.DataFrame(data, columns=['Letter', 'Number']...此外,你可以通过传递参数来调整df.describe()的行为,例如include参数可以设置为'all'来包含所有列的统计信息,或者设置为'O'来仅包含对象列的统计信息。...七、apply() 函数使用方法 如果需要将函数应⽤到DataFrame中的每个数据元素,可以使⽤ apply() 函数以便将函数应⽤于给定dataframe中的每⼀⾏。...0 1 4 7 12 1 2 5 8 15 2 3 6 9 18 八、pandas的合并操作 如何将新⾏追加到pandas DataFrame?...如果想要对每个分组应用多个函数,可以使用agg()方法,并传入一个包含多个函数名的列表,例如group_1.agg(['sum', 'mean'])。

    8810

    Pandas内存优化和数据加速读取

    内存优化 一个现象是,在使用pandas进行数据处理的时候,加载大的数据或占用很大的内存和时间,甚至有时候发现文件在本地明明不大,但是用pandas以DataFrame形式加载内存中的时候会占用非常高的内存...OK,这就是有时候DataFrame内存占用过高的原因。 所以这里有个简单的思路是:我依次去遍历数据的所有列,检查每一列的数值范围包含在哪个最近的子类区间。...pandas 使用一个单独的映射词典将这些int值映射到原始值。只要当一个列包含有限的值的集合时,这种方法就很有用。...例如,如果您有10年的分钟频率耗电量数据,即使你指定格式参数,只需将日期和时间转换为日期时间可能需要20分钟。你真的只想做一次,而不是每次运行你的模型,进行测试或分析。...Pandas的 HDFStore 类允许你将DataFrame存储在HDF5文件中,以便可以有效地访问它,同时仍保留列类型和其他元数据。

    2.7K20

    3 个不常见但非常实用的Pandas 使用技巧

    来源:DeepHub IMBA本文共1000字,建议阅读5分钟本文为你演示一些不常见,但是却非常有用的 Pandas 函数。 创建一个示例 DataFrame 。...date 列包含 100 个连续日期,class 列包含 4 个以对象数据类型存储的不同值,amount 列包含 10 到 100 之间的随机整数。 1....To_period 在 Pandas 中,操作 to_period 函数允许将日期转换为特定的时间间隔。使用该方法可以获取具有许多不同间隔或周期的日期,例如日、周、月、季度等。...但是我们通过使用to_period 函数的参数”M“实现时间序列。 让我们为年月和季度创建新列。...例如在我们的 DataFrame 中,”分类“列具有 4 个不同值的分类变量:A、B、C、D。 默认情况下,该列的数据类型为object。

    1.3K10

    Pandas使用技巧:如何将运行内存占用降低90%!

    为了更好地理解如何减少内存用量,让我们看看 pandas 是如何将数据存储在内存中的。...object 列中的每个元素实际上都是一个指针,包含了实际值在内存中的位置的「地址」。 下面这幅图给出了以 NumPy 数据类型存储数值数据和使用 Python 内置类型存储字符串数据的方式。...看看上表,可以看到其仅包含 7 个不同的值。我们将使用 .astype() 方法将其转换成 categorical 类型。...首先,我们可将每一列的最终类型存储在一个词典中,其中键值表示列名称,首先移除日期列,因为日期列需要不同的处理方式。...().plot.scatter('year','length_minutes') plt.show() 从 1940 年代以来,棒球比赛的持续时间越来越长。

    3.7K20

    Python 数据分析(PYDA)第三版(五)

    在过程的第一阶段中,包含在 pandas 对象中的数据,无论是 Series、DataFrame 还是其他形式,都根据您提供的一个或多个键被分割成组。分割是在对象的特定轴上执行的。...-应用-组合范式下,DataFrame 或两个 Series 中的列之间的操作,例如组加权平均,是可能的。...表 11.1:datetime模块中的类型 类型 描述 date 使用公历存储日期(年,月,日) time 以小时,分钟,秒和微秒存储一天中的时间 datetime 存储日期和时间 timedelta...例如,如果您想要一个包含每个月最后一个工作日的日期索引,您将传递 "BM" 频率(月底的工作日;请参阅 Table 11.4 中更完整的频率列表),只有落在日期区间内或日期区间内的日期将被包括: In...与时区感知时间戳对象的操作 类似于时间序列和日期范围,个别Timestamp对象也可以从无时区转换为时区感知,并从一个时区转换为另一个时区: In [128]: stamp = pd.Timestamp

    17900

    特征工程:Kaggle刷榜必备技巧(附代码)!!!

    2、dataframe:命名为customers_df 3、index:此参数将表中的主键作为输入 4、time_index:时间索引定义为第一次可以使用行中的任何信息。对于顾客来说,这是加入日期。...在我们的session_df表中,我们有一个名为device的列,它包含三个级别——桌面、移动设备或平板电脑。我们可以使用以下方法从这样的列中获取两列: ?...在本次比赛中,我们必须预测旅行的持续时间。我们获得了很多特征,其中上下车的经纬度也在那里。...如果使用一个假定 特征是正态分布的线性模型,则对数转换可以使特征正态。在像收入等倾斜变量发生时,它也很方便。或者在我们的旅行持续时间案例中。以下是无对数转换的旅行持续时间图。 ?...旅行持续时间的对数转换倾斜越小,对模型越有帮助。 基于直觉的一些附加特征 ▍日期时间特征 可以根据领域知识和直觉创建额外的日期时间特征。

    5.1K62

    爱了!0.052s 打开 100GB 数据,这个开源库火爆了!

    第一步是将数据转换为内存可映射文件格式,例如Apache Arrow,Apache Parquet或HDF5。在此处也可以找到如何将CSV数据转换为HDF5的示例。...Vaex仅读取文件的元数据,例如磁盘上数据的位置,数据结构(行数、列数、列名和类型),文件说明等。那么,如果我们要检查数据或与数据交互怎么办?...打开数据集会生成一个标准的DataFrame并对其进行快速检查: 注意,单元执行时间太短了。这是因为显示Vaex DataFrame或列仅需要从磁盘读取前后5行数据。...在筛选Vaex DataFrame时不会复制数据,而是仅创建对原始对象的引用,在该引用上应用二进制掩码。用掩码选择要显示的行,并将其用于将来的计算。...这些功能在数据集中尚不可用,但计算起来很简单: 上面的代码块无需内存,无需花费时间即可执行!这是因为代码只会创建虚拟列。这些列仅包含数学表达式,并且仅在需要时才进行评估。

    82310

    0.052秒打开100GB数据?这个Python开源库这样做数据分析

    Vaex仅读取文件的元数据,例如磁盘上数据的位置,数据结构(行数、列数、列名和类型),文件说明等。那么,如果我们要检查数据或与数据交互怎么办?...打开数据集会生成一个标准的DataFrame并对其进行快速检查: ? 注意,单元执行时间太短了。这是因为显示Vaex DataFrame或列仅需要从磁盘读取前后5行数据。...所有这些统计信息都是通过对数据的一次传递来计算的。 ? 使用describe方法获得 DataFrame 的高级概览,注意这个 DataFrame 包含 18 列数据,不过截图只展示了前 7 列。...在筛选Vaex DataFrame时不会复制数据,而是仅创建对原始对象的引用,在该引用上应用二进制掩码。用掩码选择要显示的行,并将其用于将来的计算。...这些列仅包含数学表达式,并且仅在需要时才进行评估。此外,虚拟列的行为与任何其他常规列都相同。注意,其他标准库将需要10 GB的RAM才能进行相同的操作。 好了,让我们来绘制行程耗费时间的分布: ?

    1.3K20

    matlab复杂数据类型(二)

    1 表 table是一种适用于以下数据的数据类型:即以列的形式存储在文本文件或电子表格中的列向数据或者表格式数据。表由若干行向变量和若干列向变量组成。...使用括号可以选择表中的一个数据子集并保留表容器。使用大括号和点索引可以从表中提取数据。如果使用大括号,则生成的数组是将仅包含指定行的指定表变量水平串联而成的。所有指定变量的数据类型必须满足串联条件。...一个或多个具有指定 type(例如 'numeric')的变量 ③ 数据类型转换 table:具有命名变量的表数组(变量可包含不同类型的数据) array2table:将同构数组转换为表 cell2table...可以使用table数据类型来将混合类型的数据和元数据属性(例如变量名称、行名称、说明和变量单位)收集到单个容器中。表适用于列向数据或表格数据,这些数据通常以列形式存储于文本文件或电子表格中。...ischar:确定输入是否为字符数组 isdatetime:确定输入是否为日期时间数组 isduration:确定输入是否为持续时间数组 isenum:确定变量是否为枚举 isfloat:确定输入是否为浮点数组

    5.8K10

    教程 | 简单实用的pandas技巧:如何将内存占用降低90%

    为了更好地理解如何减少内存用量,让我们看看 pandas 是如何将数据存储在内存中的。...object 列中的每个元素实际上都是一个指针,包含了实际值在内存中的位置的「地址」。 下面这幅图给出了以 NumPy 数据类型存储数值数据和使用 Python 内置类型存储字符串数据的方式。 ?...看看上表,可以看到其仅包含 7 个不同的值。我们将使用 .astype() 方法将其转换成 categorical 类型。...首先,我们可将每一列的最终类型存储在一个词典中,其中键值表示列名称,首先移除日期列,因为日期列需要不同的处理方式。...从 1940 年代以来,棒球比赛的持续时间越来越长。

    3.9K100

    pandas时间序列常用方法简介

    pd.Timestamp(),时间戳对象,从其首字母大写的命名方式可以看出这是pandas中的一个类,实际上相当于Python标准库中的datetime的定位,在创建时间对象时可接受日期字符串、时间戳数值或分别指定年月日时分秒等参数三类...(str):时间提取字符串 其中,pd.to_datetime可接受单个或多个日期数值,具体类型包括数值型、字符串、数组或pd.series等序列,其中字符串日期格式几乎包含了所有可能的组成形式,例如...需要指出,时间序列在pandas.dataframe数据结构中,当该时间序列是索引时,则可直接调用相应的属性;若该时间序列是dataframe中的一列时,则需先调用dt属性再调用接口。...举例如下: 1.首先创建数据结构如下,其中初始dataframe索引是时间序列,两列数据分别为数值型和字符串型 ? 2.运用to_datetime将B列字符串格式转换为时间序列 ?...3.分别访问索引序列中的时间和B列中的日期,并输出字符串格式 ? 03 筛选 处理时间序列的另一个常用需求是筛选指定范围的数据,例如选取特定时段、特定日期等。

    5.8K10
    领券