初始化 StreamingContext
为了初始化一个 Spark Streaming 程序, 一个 StreamingContext 对象必须要被创建出来,它是所有的 Spark Streaming...此错误可能会显示为序列化错误(连接对象不可序列化), 初始化错误(连接对象需要在 worker 初始化)等. 正确的解决方案是在 worker 创建连接对象....除此之外, 对于更大类的机器学习算法, 您可以离线学习一个学习模型(即使用历史数据), 然后将该模型在线应用于流数据.有关详细信息, 请参阅 MLlib指南....请注意, 与 RDD 不同, DStreams 的默认持久性级别将数据序列化在内存中. 这在 性能调优 部分进一步讨论. 有关不同持久性级别的更多信息, 请参见 Spark编程指南....Spark Core 默认情况不同, 通过流式计算生成的持久化 RDD 将以 StorageLevel.MEMORY_ONLY_SER (即序列化), 以最小化 GC 开销.