所以我有一只像这样的熊猫date_range
dates = pd.date_range(start='2005-1-1', end='2014-12-31', freq='D')
我想去掉闰年造成的所有额外的日子。
我做了一个for循环
for each in index:
if each.month==2 and each.day==29:
print(each) # I actually want to delete this item from dates
但我的问题是我不知道怎么删除这个项目。常规python列表
我有一个包含多个列的DataFrame,其中一个列的类型是datetime。有时通过df.set_index(...).将此列用作索引。
在其他情况下,为了保持datetime列,我需要重置该索引。现在,我正在寻找一种如何检查dataframe是否有默认索引的方法。我试过了,但这并不适用于所有案件:
if df.index.name is not None:
df.reset_index(inplace=True)
我可以测试索引是否为datetime类型,但我真的想知道是否有像df.is_index_set().这样的通用方法。有什么建议吗?
有些Matplotlib方法在中需要几天的时间。datestr2num是一个转换器函数,但它被相关的pandas对象搞砸了:
In [3]: type(df.index)
Out[3]: pandas.tseries.index.DatetimeIndex
In [4]: type(df.index[0])
Out[4]: pandas.tslib.Timestamp
In [5]: mpl.dates.date2num(df.index)
Out [5]: ...
AttributeError: 'numpy.datetime64' object has no attribu
我用pd.to_datetime(df[0])得到了一个由21-JAN-2016格式的datetimes组成的dataFrame。我尝试对我的数据进行分组,以便将几年中的同一个月并排绘制出来。例如,2015、2016、2017年1月的#次事件等。(因此会有四个并排聚集在一起的条块),然后是2015、2016、2017等在2月份发生的#次。 现在我有下面的代码,我相信它大部分都在工作,但我不确定,因为x轴没有正确地标记月份。现在它将抛出一个AttributeError: 'MultiIndex' object has no attribute 'strftime'
我有一个数据对应于DBs和diff行的列表,其中包含正在使用的日期。
DB Dates USAGE
ABC 03-06-2018 IN USE
ABC 07-06-2018 IN USE
XYZ 04-06-2018 IN USE
XYZ 08-06-2018 IN USE
我想要的是有一个完整的日历月对应于每个db,而不仅仅是它们使用的日期。
DB Dates USAGE
ABC
我有一只熊猫的资料如下:
Date Symbol
0 2015-02-20 A
1 2016-01-15 A
2 2016-01-15 A
3 2015-08-21 A
我需要输出是一个唯一的日期在时代的时间列表,排序。如下所示:[1424390400, 1440115200, 1452816000]
但是当我从Dataframe返回唯一的日期时,我得到:['2015-02-19T18:00:00.000000000-0600' '2016-01-14T18:00:00.000000000-0600' &
我在剪贴板上阅读了一些数据
clipdf = pd.read_clipboard()
A B C D F
2013-01-01 0.000000 0.000000 -1.509059 5 NaN
2013-01-02 1.212112 -0.173215 0.119209 5 1.0
2013-01-03 -0.861849 -2.104569 -0.494929 5 2.0
2013-01-04 0.721555 -0.706771
我有一个带有DataTimeIndex和其他列的Pandas,类似于以下内容:
import pandas as pd
import numpy as np
range = pd.date_range('2017-12-01', '2018-01-05', freq='6H')
df = pd.DataFrame(index = range)
# Average speed in miles per hour
df['value'] = np.random.randint(low=0, high=60, size=len(df
使用R数年后,我开始尝试学习python,从编辑一些现有代码开始。
我有一个从netCDF文件导入的时间变量,如下所示:
import netCDF4 as nc
import numpy as np
import datetime
import pandas as pd
f = nc.Dataset(fname)
time = nc.num2date(f.variables['time'][:],
f.variables['time'].units)
nc_dims = [dim for dim