我已经模拟了一些设备,这些设备正在向IoT集线器存储发送消息,并通过使用Azure Data创建管道将数据(以JSON格式编码)复制到Azure Data Gen2。
如何将这些json输出文件转换为CSV文件,由数据湖引擎处理?我不能直接在蔚蓝数据湖处理所有的json遥测吗?
发布于 2019-08-07 06:58:26
有3个官方的内置萃取器允许您分析包含在CSV、TSV或文本文件中的数据。
但MSFT还在其Azure GitHub 存储库上发布了一些处理Xml、Json和Avro文件的示例提取器。我在生产中使用了Json萃取器,因为它确实是稳定和有用的。
将整个输入文件作为一个JSON文档处理。如果每行都有一个JSON文档,请参见下一节。尝试提取的列将从文档中提取。在本例中,我将提取_id和修订属性。注意,其中一个可能是进一步嵌套的对象,在这种情况下,您可以使用JSON进行后续处理。
REFERENCE ASSEMBLY [Newtonsoft.Json];
REFERENCE ASSEMBLY [Microsoft.Analytics.Samples.Formats];
//Define schema of file, must map all columns
@myRecords =
EXTRACT
_id string,
Revision string
FROM @"sampledata/json/{*}.json"
USING new Microsoft.Analytics.Samples.Formats.Json.JsonExtractor();
https://stackoverflow.com/questions/57377455
复制相似问题