我有两个RDDs,每个RDDs都是一组包含重复项的字符串。我想找到这两组保持重复的交集。示例:RDD2 : a, a, b, c, c
我想要的交集是集合a, b, c, c,即交集将包含每个元素,这是它在这两个集合中存在的最小次数。默认的intersection转换不保留重复的AFAIK。是否有一种方法可以使用其他转换和/或交集转换
你好,我想知道如何在python中通过重复的元素而不是值来减去2个列表。ListA = [G, A, H, I, J, B]
因此我们减去ListB值,如果在ListA中发现它们是重复的,那么ListC将返回ListA中的非重复值。从数学上来说,它应该是:
(我不想删除ListA中的重复项,只有ListA和ListB之间