我有一个关于如何在pandas数据帧中填充missint日期值的问题。我发现了一个类似的问题( pandas fill missing dates in time series ) 但这并没有回答我的实际问题。 我有一个数据帧,看起来像这样: date amount person country
01.01.2019 10 John IT
01.03.2019 5 Jane SWE
01.05.2019 3 Jim SWE
01.05.2019 10
具有列名和exm_date的df
name roll exm_date
tom 242 2019-03-05 11:48:03.166
mark 244 2018-03-05 11:48:03.166
tom 244 2020-03-05 11:48:03.166
mark 242 2019-03-05 11:48:03.166
如何通过比较名字和滚动来获得最小日期。如果滚动是不同的,则应将其视为单独的记录。
expected_
我正在使用带有pylab的ipython笔记本--内联
import matplotlib.pyplot as plt
import pandas as pd
......
plt.figsize(14,8)
ax1=plt.subplot(311)
#data is a pandas data frame with timeseries stock data
# this plots the data
data.plot(ax=ax1)
这显示了股票数据的曲线图,但它一次显示了所有数据。我想只显示日期的子范围,并有一个滚动条来控制我怎么做,使它与绘图的内联显示。
我正在关注一个关于YouTube的投资组合优化讲座,并在它进行过程中编写代码(通过VS代码运行木星笔记本),但是偶然发现了一个我无法解决的问题。
下面是我导入的库:
from pandas_datareader import data as web
import pandas as pd
import numpy as np
from datetime import datetime
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')
然后我设置了资产列表:
assets = ['FB'
我刚刚开始学习如何使用Pandas,我正在尝试使用一个相当大的数据集(5000行和15列)。数据具有这样的格式(给出我面临的问题的一个例子,因为我想了解如何做到这一点--实际的数据与终止无关)。
ID# Firing Date Age State Position Cause
1 2011-07-03 29 NY Salesman Layoff
2 2014-03-20 25 AK salesman layoff
3 2004-08
虽然使用pandas滚动方法来应用标准公式很容易,但如果它涉及多列和有限的过去行,我发现很难。使用以下代码来更好地阐述: import numpy as np
import pandas as pd
#create dummy pandas
df=pd.DataFrame({'col1':np.arange(0,25),'col2':np.arange(100,125),'col3':np.nan})
def func1(shortdf):
#dummy formula
#use last row of col1 mult
我正在分析csv文件中的一些数据(随着时间的推移,用电量)
数据可以包括同一X日期的多个Y值,如下所示:
TYPE,DATE,START TIME,END TIME,USAGE,UNITS,COST,NOTES
Electric usage,2021-04-08,00:00,00:59,0.93,kWh,$0.27,
Electric usage,2021-04-08,01:00,01:59,0.42,kWh,$0.12,
Electric usage,2021-04-08,02:00,02:59,0.49,kWh,$0.14,
Electric usage,2021-04-08,03:00,
我有一个熊猫系列看起来
Attribute DateEvent Value
Type A 2015-04-01 4
2015-04-02 5
2015-04-05 3
Type B 2015-04-01 1
2015-04-03 4
2015-04-05 1
如何将值转换为滚动和(例如,过去的两天),同时确保在我的DateEvent索引中说明缺少的日期(假设它的开始日期和结束日期是完整的范围
大家晚上好,
希望你一切都好。如果有人能给我一些关于如何解决这个问题的建议,我将不胜感激。
我的变量x附有日期。我想要创建一个x的滚动平均值,但是我想要平均值跳过最近的10个日期,而是取之前的10个日期的平均值。平均值也应按一个分类变量分组。
下面是一个可复制性最低的例子:
set.seed(24)
dat <- data.frame(id=1:93,
date = rep(seq(as.Date("1990/1/1"),as.Date("2020/1/1"),"years"),each=3),
group = re
我有来自三个市场的每日回报(GLD,间谍和USO)。我的目标是在130天的滚动基础上,从相关矩阵中计算出平均成对相关性。
我的出发点是:
import numpy as np
import pandas as pd
import os as os
import pandas.io.data as web
import datetime as datetime
from pandas.io.data import DataReader
stocks = ['spy', 'gld', 'uso']
start = datetime.datetime
我有一个数据集TransactionId,PolicyId,DebitnoteId和Amount。我需要增加政策和借方附注余额的累积/滚动余额。我已经说明了PolicyID Rolling Balance和DebitNote Rolling Balance应该使用什么颜色来显示组成下面图像中的余额的项目。我是DAX的新手,在不使用日期函数的情况下无法使余额正常工作。