数据框架中有一个日期列,如下所示:
(Year-Month-Day)
2017-09-21
2018-11-25
我试图创建一个只考虑年份的函数,我一直在尝试以下几点。
df[df['DateColumn'].str[:3]=='2017']
但是我收到了这个错误:
AttributeError: Can only use .str accessor with string values, which use np.object_ dtype in pandas
如何在函数中只考虑日期的前四个字符?谢谢。
我正在使用pandas自动清理一些CSV文件。数据如下所示
date value
1 13 Sep 9
2 5 Oct 8
3 10 Oct 99
我使用以下代码将字符串转换为日期时间
pd.to_datetime(new_df[0].str.replace(' ', ''), format='%d%b')
(进行替换是为了删除有时出现的额外空格)
这可以很好地工作--除了在日期中没有提供年份之外,pandas默认将其设置为1900年。
date value
我正在尝试格式化一组没有年份的日期(例如"Mar-03")使用以下代码:
dates = pd.to_datetime(dates, format="%d-%b")
我的日期是'Feb-29',这会引发一个ValueError:"day is out out of month",因为默认年份是1900年,而不是闰年。有没有办法覆盖Pandas中的默认年份,或者其他一些解决方法?
我有一个csv文件,里面有很多表格,日期从2019年1月1日到2019年1月31日……对于不同的年份,我需要将所有年份的所有列X相加,并有一个图表,显示每个月在不同年份的变化情况。以及在一年中不同的月份如何以不同的方式显示X值。 使用熊猫。和matplotlib。 muestradatos[muestradatos.DateMonth == 1]
This is what the query in pandas shows
1/1/2019 455
1/2/2019 555
1/3/2019 15
1/4/2019 655
.
.
1/1/2017 644 我需要它来展示 Year 20
在下面的MWE中,我的year变量在x轴上显示为0到6,而不是实际的年份数。为什么会这样呢?
import pandas as pd
from pandas_datareader import wb
from ggplot import *
dat = wb.download(
indicator=['BX.KLT.DINV.CD.WD', 'BX.KLT.DINV.WD.GD.ZS'],
country='CN', start=2005, end=2011)
dat.reset_index(inplace=True)
pri
我想总结一下不同年份的数据点。所以我想绘制一个不同年份的图表,并从一个指定的属性中总结出一个图表,所以让我们来看看2011 -2015年的硬币 所以我选择pandas作为我使用的数据帧: Summerize the data point (way 1)
testn = test.groupby(by=[test.index.year,test.index.month]).sum()
print(testn['SalesDateTime'])
print (type(testn)) 这给了我一个错误。这个错误告诉我没有属性year或month? enter code h
我有一份我想要清理的数据。它不是在字符串中格式化的日期,因此我使用以下方法将其转换为日期时间:
df['datecreated']= pd.to_datetime(df['datecreated'], format='%Y-%m-%d %H:%M:%S.%f')
得到一个错误:
ValueError: time data "2021-09-16 16:32:11.643333" doesn't match format specified
但是,当我单独测试它时,它会运行:
我为什么要拿到ValueError?
我在Pandas数据框中有一个列,其中包含年份和周编号(1到52),字符串格式为:'2017_03‘(表示2017年的3d周)。 我希望将列转换为datetime,并使用pd.to_datetime()函数。然而,我得到了一个异常: pd.to_datetime('2017_01',format = '%Y_%W')
ValueError: Cannot use '%W' or '%U' without day and year 另一方面,strftime文档提到: ? 我不确定我做错了什么。
import os
from matplotlib.backends.backend_pdf import PdfPages
import pandas as pd
import matplotlib.pyplot as plt
import datetime as dt
pp = PdfPages('multipage.pdf')
pth = "D:/Technical_Data/"
for fle in os.listdir(pth):
df = pd.read_csv(os.path.join(pth, fle),usecols=(0, 4)