我有一个pandas.Series,它是一个5位数的整数。前3位数是一个时代的前3位数,最后2位数是半个小时.我想对整数序列进行切片,这样我就有两个Series,分别有前3位和最后2位。
下面是一种方法,它需要两种类型转换:
import pandas as pd
days_hours = pd.Series(npr.randint(low=1e4, high=99999, size=1000))
days = days_hours.astype('str').str.slice(start=0, stop=3).astype('int64')
hours = days_hours.astype('str').str.slice(start=3, stop=5).astype('int64')这非常耗时,因为我的Series平均每行为25e6行(有6个这样的Series)。有办法可以避免类型转换吗?
我尝试了另一种解决方案,它涉及到apply对Series的每个元素添加一个lambda函数,但这花费了更长的时间。
发布于 2015-06-09 10:56:59
使用整数除法和模运算符进行算术运算要快得多:
days = days_hours // 100
hours = days_hours % 100https://stackoverflow.com/questions/30729687
复制相似问题