我的名字是Nick,我是编程新手。我最近完成了Codeacademy的使用Python分析金融数据的课程。我已经开始做我自己的一些项目,但我遇到了一个障碍。 我正在使用pandas-datareader从美联储API (FRED)导入股指每日收盘价数据: import numpy as np
import pandas as pd
import pandas_datareader.data as web
import matplotlib.pyplot as plt
from datetime import datetime
start = datetime(2020, 1, 1)
sp
所以我有我的pandas数据帧,它的格式是这样的。 日期为datetime.date类型 print(dataTime)
Date Text Sentiment
2021-01-28 Some text 1
2021-01-28 Some text 0
2021-01-28 Some text 1
...
2021-03-05 Some text 1
2021-03-05 Some
我有20个数据帧,在最后阶段,我想通过以下代码片段将它们全部合并:
finalDF=allDf[0]
for df in allDf[1:]:
finalDf=finalDF.join(df, on='DateTime')
这会导致内存错误。有没有更好的组合数据帧的内存方式?
每个dataframe有20个数字列,每个列的范围从2015-01-01到当前日期,具有唯一/不同的日期时间。
我使用的是有“日期”列的dataframe。我使用pd.to_datetime()将该列格式转换为yyyy。但是,这种格式在数据帧中的间歇日期被转换为其他格式(例如:yyyy)。
Date
2021-02-01 <----- this is 2nd Jan, 2021
2021-01-21 <----- this is 21st Jan, 2021
此外,我也尝试过使用df['Date'].dt.strftime('%y-%m-%d'),但这也没有帮助。
我要求就以下几点提供一些指导:
对于任何日期列,只使用pd.to_datetime()并确
我正在编写一个脚本来从txt文件中提取特征。我创建了包含所需列名的第一个dataframe。然后,我遍历文件夹中的所有文件,并提取所需的功能。然后,我创建了一个单行的新数据帧,并将其附加到"features“数据帧中。
我没有得到任何错误,但是“功能”数据帧仍然是空的。在创建df时,我对索引感到有点困惑,因为我认为错误可能来自那里。但是如果你不知道呢?或者不想在追加时迭代索引?难道没有一种方法可以像Java中的集合(Arraylist等)那样“添加”行吗?
#we create a df that will contain the chosen features
features =