这些行是按日期排序的,因此对于相同的股票,较晚的日期将具有更高的行索引。我想添加一个新列,用于每个股票(即,group by stock)包含一个数字,该数字具有一段时间内股票价格之间的最大正差,如max_price - min_price中所示。中做到这一点,而不是像上面的算法那样,逐一计算每个值并将其分配给数据帧新列
我有一个介于3个日期范围内的大型数据集(图像文件中有一个小样本) excel image of data 到目前为止,我已经将数据导入到pandas中,并将开始日期从对象转换为日期戳。我想在数据中添加一列,其中列中的值特定于开始日期。例如,对于介于26/11/2020 - 28/12/2020之间的任何开始日期,该列
我使用for循环读取pandas dataframe中的列,并使用嵌套的if语句查找日期时间范围内的最小值和最大值。我可以确定所需的datetime列,但找不到将column变量传递给dataframe.series.min()和max语句的正确方法。import pandas as pd
for column in data.colum