在Spark中,我以RDD的形式加载了一个数据集,并且喜欢不频繁地向其追加流数据。我知道RDDs是不可变的,因为它简化了锁定,等等。其他处理静态和流数据的方法是一体的吗?
类似的问题以前也被问过:Spark : How to append to cached rdd?
https://stackoverflow.com/questions/41310216
相似问题