我有两个数据集,如果一列的元素包含另一列的元素,我希望合并这两个表。我该怎么做呢?
val df = df1.join(df2,
df1.col("Complete Name").equalTo(df2.col("Name")))
转到
val df = df1.join(df2,
df1.col("Complete Name").ifContain(df2.col("Name")))
发布于 2018-09-20 07:30:30
如果你这样做会怎么样呢
{
df1.join(df2, df1.col("Complete Name").ifContain(df2.col("Name")), "left_anti)
.union(df2.join(df1, df1.col("Complete Name").ifContain(df2.col("Name")), "left_anti))
}
不过并没有测试它。
https://stackoverflow.com/questions/52414885
复制相似问题