我有一个数据框架,其中包含不同单位的活动以及这些活动的开始和结束日期。我需要知道是否有单位在结束一个活动后的31天内开始了一个新的活动,以及这些活动是什么(它们的ID)。02-289 D 2016-11-08 2017-03-31
10 D 2017-04-03 2018-08-31 我希望得到的输出将是如下所示的数据帧
我在spark Df1和Df2中有两个数据帧我基于一个公共列(即Id )连接这两个数据帧,然后添加一个额外的列结果,并使用或条件检查多个列。如果有任何列数据匹配,则需要插入新列作为匹配,如果没有匹配的条件,则需要在该列中传递为“未匹配”。我正在写下面的代码。error: type mismatch;
found :