我正在尝试使用下面的代码找出两个日期列之间的日期差异。但是,我没有得到预期的结果。我是个初学者。例如,开始日期是2016-02-18 00:00:00,结束日期是2015-05-21 00:00:00,这两个日期之间的差值是-273,但实际输出是273000000import pandas as pd
data = pd.
我目前正在做一项数据迁移任务,试图使用pyspark比较来自两个不同数据库的两个数据帧,找出两个数据帧之间的差异,并将结果记录在csv文件中,作为数据验证的一部分。我正在尝试一个性能高效的解决方案,因为有两个原因。#Approach 2 - Creating row hash for each row in dataframe
piperdd=df1.rdd.map(lambda