有返回CSV数据的url。此url的实际数据每10分钟更新一次。我是否需要通过这个url手动下载数据到文件中,然后通过ApacheSpark加载这个文件,或者例如,我可以将Spark指向这个url,Spark会不时地通过这个url自动重新下载数据并处理它?例如,是否可以使用Spark Structured S
我试图读取卡夫卡的数据,并将其上传到格林梅利的数据库使用火花。我使用的是格林梅-火花连接器,但我正在获取数据源,io.pivotal.greenplum.spark.GreenplumRelationProvider不支持流写入。是否格林梅源不支持流媒体数据?我曾尝试将数据源命名为“绿梅”,并将"io.pivotal.greenplum.spark.GreenplumRelationProvider“转换为.format(”数据源“)
val
java.io.IOException: Could not locate executable null\bin\winutils.exe in the `Hadoop binaries.` <artifactId>apache</artifactId> </parent>
<groupId>org.apache.spa
$.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:731) at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:121)
at org.apache.spark.deploy.SparkSu