我正在使用flink从Azure数据湖中读取数据。但flink无法找到Azure数据湖文件系统。我已经实现了spark来读取Azure Data Lake文件系统文件。
因此,我尝试从flink中触发火花,从Azure数据湖中读取数据,并执行一些逻辑操作,然后将列表返回给flink。所以flink可以使用这些数据?
是否可以从flink触发spark作业?或者如何配置flink来理解Azure数据湖文件系统。有人能在这方面给我指点一下吗?
发布于 2017-07-13 02:46:38
让此场景正常工作的正确方法是直接从ADLS读取数据。通过触发另一种机制,如Spark,这是一件复杂的事情。
此SO问题包含执行此操作的信息:how to configure flink to understand the Azure Data Lake file system?
https://stackoverflow.com/questions/45032015
复制相似问题