问大参考数据
EN

Stack Overflow用户

提问于 2017-10-05 19:23:27

回答 1查看 190关注 0票数 0

在我的Azure流分析工作，我试图地理定位IP地址。我使用的引用大约为165 MB。引用数据块每个限制为100 MB，但文档声明如下：

的限制为每个blob 100 MB，但是作业可以使用path模式属性处理多个引用blob。

我该如何利用这一点呢？我已经将我的数据分成两个85 MB的文件，iplookup1.csv和iplookup2.csv，但似乎无法弄清楚如何将引用数据输入作为一个大型数据集来获取这两个文件。

作为一个停止间隙，我可能尝试创建两个引用数据输入，然后对两者执行一个左联接，并提取非空值。

azure-stream-analytics

回答 1

Stack Overflow用户

发布于 2017-10-06 12:55:10

根据我的理解，对于引用数据，您可以在Path模式属性中指定静态数据(例如products/products.csv)，也可以指定这些变量({date}、{time})的一个或多个实例(如products/{date}/{time}/products.csv )来刷新引用数据。

根据您的场景，我假设您需要创建两个引用数据输入，然后可以利用友联市操作将两个或多个查询的结果组合到一个结果中。对于引用数据连接，可以使用这里。

更新：

SELECT I1.propertyName, ip01.propertyName
    FROM Input1 I1
    JOIN iplookup1 ip01  
    ON I1.address= ip01.address

UNION

SELECT I1.propertyName, ip02.propertyName
    FROM Input1 I1
    JOIN iplookup2 ip02  
    ON I1.address= ip02.address

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46593338

复制

相似问题

问大参考数据
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大参考数据EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问大参考数据
EN