我正在尝试重新创建我已经用Python使用Databricks完成的一些工作。我有一个数据,其中有一个名为“time”的列,以纳秒为单位。在Python中,我使用以下代码将字段转换为适当的日期时间值:
# Convert time field from nanoseconds into datetimedf["time"] = pd.to_datetime(df["time"], unit
数据从记录的开始有一个以秒为单位的时间变量(类型: bigint),但我希望能够在每日级别聚合数据(即按天分组)。我首先创建了一个day列,并通过将秒转换为天来更新表以填充day字段:ADD COLUMN day INTEGER;
SET day=tbl.eventtime20小时后,query仍然在运行,我想知道对于我正在处理的数据量来说,这种方法是不是非常不合适。我意识到另一种方法是将以秒为