我正在尝试创建一个数据管道,其中我从RESTAPI请求数据。输出是一个嵌套的json文件,这很棒。我想将json文件读入pysparkdataframe。当我将文件保存在本地并使用以下代码时,这可以很好地工作: from pyspark.sql import *
spark = SparkSession", mu
我使用了转换为json的api,使用pandas进行了标准化,并使用pyspark转换为dataframe。 但是我不能改变列,无论是表单还是任何东西,我不能选择它们。 我想知道我哪里错了!import requestsimport pandas as pd import os
from pyspark.sql.typesimport DoubleType