所以我试着把熊猫的数据转换成一个RDD,如下所示:spDF = sqlContext.createDataFrame(df['A'spDF.show()TypeError: Can not infer schema for type: <type 'unicode'>
我去是为了看看是否有类似于编码参数的东西是否知道如何将特定的熊猫数据栏转换<
我已经通过数据连接将一个包含100,000个原始json文件的数据集导入到foundry中。我想使用Python Transforms raw file access转换来读取文件,将结构数组和结构数组扁平化为一个数据帧,作为对df的增量更新。我想使用来自*.json文件文档的类似于以下示例的内容,并使用@incremental()装饰器将其转换为增量更新。processed.write_dataframe(proc