我是Python和Pandas的新手,在使用日期序列进行索引时遇到了一些问题。我正在尝试将数据从SQLite数据库中提取到DataFrame中,该数据库由'mm/dd/yyyy‘格式的日期和股票价格组成。然后,我使用set_index创建了一个新的DataFrame,以便按日期为价格编制索引。如何使用数据集中的日期将新索引设置为日期序列?这是否需要datetime转换,或者DataFrame是否具有从对象转换为dateseries的能力?
下面是我使用的代码:
import sqlite3 as db
import pandas as p
dbcon = db.connect(...
我有一个按日期(年和时间到秒)进行索引的dataframe,我希望获得与我计算的特定时间段相对应的行。但是,在使用datetime类型或str类型进行索引时,我无法摆脱keyerror。代码如下所示:
def get_series(self, id_dataset, time=None):
if time == None:
time = dt.datetime.now()
time = time.replace(second=0, microsecond=0)
dataframe_global = pandas.read_csv('../rsc
我有一个Pandas DataFrame,其中包含一个date列。该列的元素类型为pandas.tslib.Timestamp。
我想按日期对数据进行分组,但不包括更细粒度的时间戳信息(即。按日期分组,其中所有Feb 23, 2011都分组)。我知道如何用SQL来表达这一点,但是对于Pandas来说,这是非常新的。
做了非常类似的事情,但是我不理解代码,它使用datetime对象。
在中,我甚至不知道如何从Pandas时间戳对象中检索日期。我可以转换为datetime对象,但这似乎非常迂回。
根据请求,df.head()的输出
date show network time
你好,我正在处理一个包含所有总统的出生日期和死亡日期的.csv文件。我试图解决的问题是,哪一年是大多数总统在世的年份。我假设,为了做到这一点,我必须将总统的出生和死亡日期转换为时间序列,而当前在世的总统将不得不将其死亡日期更改为当前时间。有人知道我可以使用Python和包-- Pandas和NumPy --来做这件事吗?以下是我到目前为止拥有的代码:
日期的格式也是这样的:1732年2月22日如果总统还没有去世,那么他的死亡日期是空的
#!/usr/bin/python
#simple problem: find the year that the most presidents
#were
假设我正在构建一个酒店预订平台,并且每个房间记录都有可用日历。常见的搜索条件是按持续时间搜索。其中用户输入开始日期和结束日期,数据库获取该持续时间内未占用的房间。
我实现了一种非常天真的方法,将被占用的日子存储为一个数组。
attribute :occupied_at_i do
array = []
if !occupied_at.empty?
occupied_at.each do |date|
array << Time.parse(date).to_i
end
end
array
end
我使用for循环读取pandas dataframe中的列,并使用嵌套的if语句查找日期时间范围内的最小值和最大值。
我可以确定所需的datetime列,但找不到将column变量传递给dataframe.series.min()和max语句的正确方法。
import pandas as pd
data = pd.somedata()
for column in data.columns:
if data[column].dtype == 'datetime64[ns]':
data.column.min()
data.colum
我有一个excel文件,其中列名包含日期-时间值.
如您所见,标题值采用日期-时间格式。我已经将它加载到Pandas dataframe中,并且头值确实被保存为日期时间值。
现在,如果我需要从Pandas查询,“选择所有大于5月15日的列”,我如何做到这一点?
我知道,通过查询df[df.columns[3:]],我可以实现这一点。但是,我真的想根据列标题的值而不是根据列的位置进行切片。
请帮帮忙。
编辑:基于下面的答案,我找到了一种查询列值的方法。把它加在这里,供将来参考。
from datetime import datetime
df[[col for col in df.
我正在尝试过滤一个DataFrame,使其只在指定时间/日期之前1小时和之后1小时显示值,但我在为此找到正确的函数时遇到了麻烦。我用Python和Pandas一起工作。 我看到的关于按日期屏蔽的帖子大多涵盖了在指定的开始日期和结束日期之间屏蔽行的情况,但我在寻找如何基于单个日期屏蔽行的帮助时遇到了麻烦。 我有一个DataFrame格式的时间序列数据,它跨越了大约一年,所以有成千上万的行。此数据的时间间隔为1分钟,因此每行对应一个行ID、一个时间戳和一个值。 DataFrame示例: ID timestamp value
0 2011-01-15 03:25:00