我有两个具有相同列的数据帧。第二列是第一列索引值的子集,但某些列的字段为空,其他列的更新信息为空。125 Nan Arbor Nan
Rob Nan 235 45 Nan 776-333-3222 我想用dfb中的新信息更新如果没有来自dfb的更新(字段是Nan),我希望在dfa中保留原始值。 我能想到的唯一方法就是逐行
假设我有一个spark dataframe df,其中包含一些列(id,...)和带有SQL过滤器的字符串sqlFilter,例如"id is not null"。我想根据sqlFilter过滤数据帧df,即现在,我想要一个由过滤器从df中删除的10个I的列表。一旦过滤后的操作完成,spark必须从分区中收集所有列表,直到它有10个ids。
我想按照描述的那样