我需要从提供REST接口的web服务中读取一些JSON数据,以便从我的SPARK SQL代码中查询数据进行分析。我能够读取存储在blob存储中的JSON并使用它。我想知道从REST服务读取数据并像使用任何其他DataFrame一样使用它的最佳方式是什么。顺便说一句,如果有帮助的话,我正在使用SPARK 1.6 of Linux cluster on HD insi
我是OLAP和SnappyData的新手。我的问题非常具体。我想知道在哪里可以阅读关于OLAP查询的SnappyData‘列’查询语言的进一步文档。也许这是一个行业标准。为了澄清问题,我查看了QuickStart脚本,并试图理解olap_queries.sql中的列表、航空公司和查询。airlineref.Code order by arrivalDelay;
我想了解像'description
我正在尝试将所有杂货店的文件读取到RDD中。目标是为给定的杂货店找到最近的500家商店,并进行一些处理。例如,如果一个商店被取走了,我就必须找到那个城市的所有商店。如果我在RDD上进行映射,我会将单个存储映射到transform函数。如何获取该函数中的所有商店。stores.filter("city="+store.city)stores = s