我正在尝试为一个模型创建一个生产数据管道。作为此管道的一部分,我以.rds文件的形式保存了一个在R环境中运行的模型。save the model coefficients现在,我想以某种方式将这些coefficients加载到Scala程序中作为Spark Dataframe,它可能看起来像这样-
val loadCoefficient
我正在尝试将每个worker节点(每个元素都是Pandas DataFrame的RDD )上的Pandas DataFrame转换为跨所有worker节点的Spark DataFrame。the data is a pandas dataframe, and I am using some datetime
indexing which isn't available for spark在完成熊猫处理后,我如何将其转换为Spa
如何将熊猫数据帧发送到hive表?我知道如果我有一个spark数据帧,我可以将它注册到一个临时表中,使用sqlContext.sql("create table table_name2AttributeError: 'DataFrame' object has no attribute 'registerTempTable'
有没有办法让我使用pa