Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Python处理时间数据的另一种选择,在标准库之外|Arrow使用笔记

Python处理时间数据的另一种选择,在标准库之外|Arrow使用笔记

作者头像
蛰虫始航
发布于 2020-12-30 08:13:02
发布于 2020-12-30 08:13:02
1.3K00
代码可运行
举报
文章被收录于专栏:蛰虫始航蛰虫始航
运行总次数:0
代码可运行

Arrow简介

Arrow是一个优秀的Python时间处理库,比起Python内置的多个日期时间库,它简化了时间类型数据的解析和输出方法,增强了时间属性的获取能力。经过多年的发展,现在其他有追求的第三方Python时间处理库基本都会对标Arrow,足矣见其影响力。目前Arrow是0.17版,其GitHub页面[1] 上有6千多Star,而且保持着活跃的更新,可见其未来会更加强大。

Arrow概览导图

时间数据输入与转换

从各种输入解析为时间对象是经常面对的需求,Arrow库将数据的输入解析统一封装在arrow.get()函数里,不需要去记time的strptime、gmtime等方法,只要将输入数据传给get,就可以得到一个时间对象,例如dt=arrow.get('2020-12-07')。当get()不输入参数时得到的是当前的UTC时间,相当于datetime.utcnow();get(s)则解析字符串s里的日期要素;get()传入浮点数(float)或int则把输入当成时间戳进行解析;get还可以传入time或datetime的对象,转为arrow的时间对象。arrow的时间对象是封装为自己的自定义类型,要转为datetime的时间对象可以调用dt.datetime,同理要转为时间戳格式使用dt.timestamp。时间戳一般为一个浮点数,表示时间基准点至特定时间dt的总秒数(小数部分对应毫秒等更精细的时间要素),基准点是格林威治时间1970年01月01日00时00分00秒这一时刻,也就是说如果dt是1970年1月1日0时0分0秒,则时间戳的值为0,而小于1970年是负数。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import arrow #Anaconda下已经安装
arrow.get('2020-12-07 14:20:10') #内置的对象,不是datetime
#Out[]: <Arrow [2020-12-07T14:20:10+00:00]>
arrow.now() #获取当前时间
dt=arrow.get(1607334506) #get可输入Unix时间戳,也可以输入datetime对象
dt=arrow.get(datetime(2020,12,7), 'US/Pacific')
dt=arrow.get('June was born in May 1980', 'MMMM YYYY')
dt.datetime #转为dateime类型
#datetime.datetime(2020, 12,...)
dt.naive #转为当地时区的datetime类型
dt.year #dt所在的年,输出 2020
dt.floor('hour') #从小时处截断,取dt的小时,后面的分钟秒都是0
#<Arrow [2020-12-07T14:00:00+00:00]>
#对应的有 .ceil('hour')

Arrow和Python内置的time、datetime库并不割裂,arrow有dt.time、dt.datetime、 dt.timestamp将时间数据从Arrow内置对象转为time等库的时间对象,另一方面,从datetime等时间对象转为arrow对象也是容易的,不仅仅是通过get()转换。

Arrow的range、span_range也支持datetime对象作为参数输入。 arrow.now() 可以获取当前时间,另外arrow也有.utcnow()获取当前时间UTC(Coordinated Universal Time,世界协调时)时间,在now()函数中可以传入时区 例如写arrow.now('Asia/Shanghai')

要修改时间的某些部分使用replace函数,输入的参数是时间要素的那些属性,如year、month等。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
d2=d1.replace(hour=3)
d3=d1.shift(weeks=+4) #当前时间4周后
d4=d1.to('local') #换时区

replace更侧重属性的修改,而shift更多是一种时间偏移的感觉,从当前时间向前或向后偏移一个时间间隔,通常在时间序列的生成中使用到。在转换时区时,除了修改时区的值外,还有一类需求是把当前时间转换为其他时区下的时间,例如dt是北京时间9点,转换成美国东部时间是多少点,这个使用的是dt.to('US/Eastern')

Arrow库使用format进行格式化,从时间对象转为特定格式的字符串,Arrow没有使用strptime的 %Y类型的占位符,而是省略了%号。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
dt.format('YYYY-MM-DD')
#'2020-12-07'
dt.format() #不输入参数其实对应 YYYY-MM-DD HH:mm:ss ZZ
#'2020-12-07 20:42:18+08:00'

时间序列

Arrow可以方便地生成一组时间,和其他数值组合成时间序列,这是datetime等内置库的弱点。通过Arrow.range(frame, start, end)可以生成从start开始,到end结束,按frame为周期重复的一个时间序列,range还支持的参数有tz及limit[2]。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
list(arrow.Arrow.range('hour',arrow.now(),arrow.now().shift(hours=5)))
#输出:
#[<Arrow [2020-12-10T20:54:19.878759+08:00]>,<Arrow [2020-12-10T21:54:19.878759+08:00]>,  ...]

Arrow的另一大特色是可以把时间对象转为人类容易理解的自然语言形式进行输出,对应的方法为dt.humanize(),humanize还可以根据locale参数输出特定语言的自然语言,有趣的封装。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
dt=arrow.now().shift(hours=-1)
dt.humanize() #当前时间的自然语言表示
#'an hour ago'
future =dt.shift(minutes=75)
dt.humanize(future, granularity="minute")
#'in 75 minutes' #两个时间的对比自然语言表示
dt.humanize(locale='ko_kr') #在韩语里的自然语言
'2시간 전'

总结

从上文可看出,Arrow有着简洁友好的接口,get统筹各种输入的解析,replace负责各种时间要素的修改,format解决各类格式化输出的需求,range处理时间序列生成问题。通过dt.year等很自然地获取时间对象的要素,也提供了dt.time等从Arrow自定义对象转为内置的time、datetime对象。

Arrow通过收束接口增强了易用性,满足了大部分时间格式处理的需求,而类似的Pendulum、Maya等时间库在解析字符串及输出自然语言方面更进一步,在一些细节上比Arrow更强一些。

Arrow功能与方法导图

References

[1] Arrow: https://github.com/arrow-py/arrow [2] Arrow文档: https://arrow.readthedocs.io/en/stable/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-12-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 蛰虫始航 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
挑战Arrow,需要怎样的实力?Pendulum使用笔记
Pendulum是一款很优秀的Python时间处理模块,其内置数据类型拓展自datetime,与datetime有着很好的兼容性。Pendulum比dateutil功能更丰富,足矣和Arrow对标。Pendulum[ˈpendʒələm]意为钟摆,很好的时间意向。Pendulum在时间解析、转换、属性获取、时区、时间序列等方面都有很好的表现,其用于时间处理的语句概览如下。
蛰虫始航
2020/12/30
9200
挑战Arrow,需要怎样的实力?Pendulum使用笔记
博采众长穿梭时空|Maya库使用笔记
用time、datetime等内置库处理时区需要挺多的代码,而且写法很不优雅,Maya是一个不错的第三方时间库,在pytz、pendulum等库基础上增强了对时区的处理。
蛰虫始航
2020/12/30
1.5K0
博采众长穿梭时空|Maya库使用笔记
Arrow时间处理神器
我们在日常的工作中,经常会对时间对象进行处理,但是内置的库处理时间和日期都稍显复杂,不是很优雅。今天我们为大家介绍一个简单易用的处理时间的库 Arrow。
Python研究所
2022/06/17
3500
Arrow时间处理神器
Python:如何用一行代码获取上个月是
抱歉我用了个有点标题党的标题,因为担心你错过了本文,但内容绝对干货,本文介绍的关于Python时间日期处理,日期时间处理在实际应用场景中无处不在,所以这也成了编程语言中必不可少的模块,Python 也不例外。但是,你知道在Python中有多少个相关的模块吗?datetime、time、calendar、 dateutil、 pytz 等等。 你知道有多少种数据类型吗?date、time、datetime、tzinfo、timedelta 等等。
py3study
2020/01/19
1.4K0
Python:如何用一行代码获取上个月是
任何时间都可以满足你的Arrow
在 python 中有2个常用的时间处理库:datetime, time。 涉及到的时间类型有4种:string, datetime, time tuple, timestamp。 想处理个时间就经常要在各种类型之间相互转换,转换到自己分分钟开始怀疑人生。
MeteoAI
2019/07/22
1.3K0
快速入门 Arrow 日期处理库
Python 中的第三方日期处理库有很多,每个库又存在不同的数据类型,甚至有些库日期和时区的转换很难搞清楚,尤其是针对特殊格式的日期处理起来很困难。 Arrow 的出现,为上述问题带来了解决方案。下面我们就来讲解一下 Arrow 相关的知识。
喵叔
2020/09/08
6150
快速入门 Arrow 日期处理库
Arrow更好用的python时间序列处理库,你用过吗?
总有人问我,应该怎么学习某个知识点?下面的大纲就是很好的证明了。不管学习什么,总结和对比是很有必要的,这就是我们说的逻辑。当你把某个知识点的学习逻辑,搞清楚了,顺着这个线走下去,就不会嫌知识点太多,一下子记不了那么多了。
Python进阶者
2020/09/14
1.2K0
Arrow更好用的python时间序列处理库,你用过吗?
【Python datetime模块精讲】:时间旅行者的日志,精准操控日期与时间
Python的datetime模块提供了日期和时间的类,用于处理日期和时间的算术运算。这个模块包括date、time、datetime和timedelta等类,以及tzinfo接口和timezone类。date类用于表示年、月、日,而time类表示时间。datetime类结合了日期和时间,提供了一个单一的日期时间对象。timedelta类用于表示两个日期或时间之间的差异。此外,tzinfo接口允许用户定义时区信息,而timezone类提供了时区的实现。datetime模块广泛用于需要日期和时间计算的应用程序,如日志记录、调度和数据时间戳。它的强大功能和灵活性使其成为Python标准库中不可或缺的一部分。
爱喝兽奶的熊孩子
2024/06/28
1670
【Python datetime模块精讲】:时间旅行者的日志,精准操控日期与时间
推荐几个评价非常高的Python库
Python的标准库模块和类型太多,时区转换麻烦,而Arrow是一个更加智能的Python时间处理库。它实现并更新日期时间类型,支持创建、操作、格式化和转换日期、时间和时间戳,可以使用更少导入和代码处理日期和时间。
吾非同
2021/07/12
7090
python内置库和pandas中的时间常见处理(1)
在进行matplotlib时间序列型图表之前,首先了解python内置库和pandas中常见的时间处理方法,本篇及之后几篇会介绍常见库的常用方法作为时间序列图表的基础。
python数据可视化之路
2023/02/23
2.1K0
python内置库和pandas中的时间常见处理(1)
(Python实战文)一篇文章教会你Arrow 时间库在项目中的实际应用
Python 默认支持时间序列的库有很多,通常 time 和 datetime 是用的最多的,虽然他们在一般情形下绝对够用,但是总有一些比较奇葩的时间格式的需求,而我们也就不能仅限于这两个 Python 自带的库。
Python进阶者
2020/12/17
4220
一文搞定Python中的时间转化
不同的情况会遇到不同的时间问题:具体时间点、时间间隔、星期等,无时不刻我们在和时间碰撞。本文将利用Python对时间相关的类,及其方法与属性等进行详细的讲解
皮大大
2020/12/28
1.8K0
一文搞定Python中的时间转化
Python 时间专题
python与时间相关的内置模块有: time 和 datetime. 其中,time模块提供各种操作时间的函数,datetime模块定义了如下几个类型:
double
2019/05/17
1.6K0
图解python | 时间和日期处理
教程地址:http://www.showmeai.tech/tutorials/56
ShowMeAI
2022/02/23
1.3K0
图解python | 时间和日期处理
6 款 超好用的 Python 时间库
除了将字符串转换为更有用的 Python 对象之外,还有许多库具有一些有用的方法和工具,可以让你更轻松地进行时间测试、将时间转换为不同的时区、以人类可读的格式输出时间信息,本文将介绍以下六个Python的时间日期库:
Python知识大全
2020/08/17
4K0
6 款 超好用的 Python 时间库
设定基准点去时间旅行|Delorean使用笔记
Delorean是一个在dateutil基础上进一步拓展的Python时间库,以《回到未来》中的时间旅行车命名。Delorean目前已经发展到1.0版本[1] ,其接口更偏向面向对象的写法,时间戳使用epoch定义,时间对象可以和datetime.timedelta进行计算,Delorean默认都调为UTC时间以避免一些时区的问题,实践代码如下。
蛰虫始航
2020/12/30
8000
设定基准点去时间旅行|Delorean使用笔记
Python时间处理模块的常用选择:八大模块,万字长文
时间格式是数据类型中基础也不容忽视的一类。不像整数那样大道至简也不像字符串那样包罗万象,却独有魅力,时间数据本身除了加减、比较运算外,也有下周、去年、时区等更专项的时间切换。在各类编程语言里都提供时间对象的支持,在MySQL里也有DATETIME类型。商业里的DAU、GMV、LTV也少不了时间限定和时间属性,因此数据分析时少不了对时间数据类型的处理与转换。
蛰虫始航
2020/12/30
2.6K0
Python时间处理模块的常用选择:八大模块,万字长文
Arrow模块生成时间
星期几相对移位可以使用Python的工作日数字(星期一= 0,星期二= 1 ...星期日= 6)或使用dateutil.relativedelta的日期实例(MO,TU ... SU)。使用工作日数字时,返回的日期将始终大于或等于开始日期。
步履不停凡
2019/09/11
1.2K0
Pandas学习笔记之时间序列总结
早起导读:pandas是Python数据处理的利器,时间序列数据又是在很多场景中出现,本文来自GitHub,详细讲解了Python和Pandas中的时间及时间序列数据的处理方法与实战,建议收藏阅读。
刘早起
2020/09/15
4.2K0
《利用Python进行数据分析·第2版》第11章 时间序列11.1 日期和时间数据类型及工具11.2 时间序列基础11.3 日期的范围、频率以及移动11.4 时区处理时区本地化和转换11.5 时期及其
时间序列(time series)数据是一种重要的结构化数据形式,应用于多个领域,包括金融学、经济学、生态学、神经科学、物理学等。在多个时间点观察或测量到的任何事物都可以形成一段时间序列。很多时间序列是固定频率的,也就是说,数据点是根据某种规律定期出现的(比如每15秒、每5分钟、每月出现一次)。时间序列也可以是不定期的,没有固定的时间单位或单位之间的偏移量。时间序列数据的意义取决于具体的应用场景,主要有以下几种: 时间戳(timestamp),特定的时刻。 固定时期(period),如2007年1月或201
SeanCheney
2018/04/24
6.6K0
《利用Python进行数据分析·第2版》第11章 时间序列11.1 日期和时间数据类型及工具11.2 时间序列基础11.3 日期的范围、频率以及移动11.4 时区处理时区本地化和转换11.5 时期及其
推荐阅读
相关推荐
挑战Arrow,需要怎样的实力?Pendulum使用笔记
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验