我需要将市场数据合并到VolumeBars (具有相同卷的块)中。我认为可以使用BarNo列对数据帧执行GroupBy操作,例如3: Open High Low Close Volume BarNo2.6890 3 3 97 取该组“打开”列的第一个元素,该组“高”列的max,该组“低”列的min和"Close“列的最后一个元素,恰好取bar_volume_size作为”DataFrame
我有一个字符串,其中的函数需要进入我预期的dataframe的.agg函数。client.groupBy("Categ","subCat").agg(sum("Amnt") as "amt",count("ID") as "Total").show()| A| D| 15| 2|+-----+------+
我有一个pyspark dataframe,它包含类似下面的数据: id class price place2 B 5 US来实现 df.groupby('class ').agg({'price': 'sum'}).show()
A如果关于' class‘的sum(价格)大于’0‘,那么这个数据应该进入一个数据帧