UserRecord],它看起来像这样 case class UserRecord( ts: Timestamp,) 让我们将这几个数据集称为现在我在想,是否可以先为每个数据集执行groupBy和agg,然后将它们连接在一起来解决面向对象的问题。也欢迎任何其他好的建议:) 我有一个数据集的IndexedSeq,如下所示 |name| lists
我有一个大的数据集,我正试图根据两个单独的列的值进行筛选。对于每一行,我都有一个列显示它们的总计数(tot),一个列显示看到该类型的示例的总次数(tot.type)。例如,我希望基于(tot)和(tot.type)筛选数据,其中(tot) OR (tot.type)必须大于或等于2。
我找到的所有基于多个值的过