U-sql -定义输入文件模式时出错_语法为sparksql dataframe定义模式时出错_部署到heroku时出错“未指定输入文件” - 腾讯云开发者社区

、、

我们的用例需要通过Azure数据工厂将可配置的输入传递给U-SQL脚本。我们正在评估可行性，并需要根据活动的时间片间隔自动化传递给U-SQL脚本的变量数量。例如，如果U-SQL脚本每4小时运行一次，它将需要从4个不同的文件中读取数据，每小时一个。如果间隔更改为5小时，我们需要自动执行此操作，以便自动读取5个不同的文件，而无需更新U-SQL脚本。文件路径的格式为: Source\YYYY-MM-DD\hh.csv 这种动态性是否可以通过数据工厂或数据湖提供的现有设施和功能集来实现？或者有没有解决这个问题的办法，这样数据工厂管道的部署就可以自动化了？

浏览 7提问于2016-08-17得票数 2

2回答

输入和输出文件夹位置的配置文件

、

我有多个U-SQL脚本，并且在每个U-SQL脚本的顶部使用了filename变量。我们有没有办法将输入和输出文件夹定义到任何配置文件中，并读取变量、常量或任何内容，以便在Extract和OUTPUT中使用它们 @tab1 = EXTRACT f1 string, f2 string FROM **<path from config file>** USING Extractors.Csv(skipFirstNRows:1);

浏览 1提问于2017-01-03得票数 3

1回答

如何使用代码隐藏在Visual Studio Azure Data Lake U-SQL项目的脚本中设置数据库和架构

、

在Visual Studio2017 Azure Data Lake U-SQL项目中，当运行带有代码的usql脚本文件(例如Script.usql)时，您可以简单地选择(通过下拉列表)不仅要使用的ADLA (Azure数据湖分析)帐户，还可以：-数据库-要在U-SQL脚本中使用的模式(如果有)。但目前(2018年12月27日，使用Visual Studio Professional 2017版本15.9.2和Azure Data Lake Tools for Visual Studio版本2.3.5001.7 )，没有可用于设置数据库或模式的下拉列表。那么如何设置数据库和模式(

浏览 1提问于2018-12-28得票数 0

3回答

可以用U-Sql编写动态查询吗

我想为多个文件编写相同的查询。有没有可能用U-SQL编写动态查询，或者有没有办法避免重写相同的代码，比如 Select count(*) as cnt from @table1; Select count(*) as cnt from @table2; 可以替换为 Select count(*) as cnt from @dynamic where @dynamic = table1, table2

浏览 0提问于2016-12-28得票数 2

1回答

U-sql -定义输入文件模式时出错

、、

在由Azure data factory Pipeline调用的U-SQL脚本中，我使用以下语句为我的过程定义输入文件：DECLARE @inputpattern_csv string = "/FOLDER/" + @year.ToString() + @month.ToString().PadLeft(2, '0') + "{daynum:}_ex1.csv"; 这个过程总是有效的，但是现在当我运行它时，它返回这个错误：E_CSC_USER_INVALIDFILESETPATTERN: Invalid file set pattern

浏览 21提问于2019-06-19得票数 0

1回答

有没有一种不用提取就能编写u-sql查询的方法呢？

、、、

我有一个元数据活动输出，它是我容器中的blob的一个json。我希望将这些名称输入到foreach活动中，在该活动中将根据文件名对blob执行一些u-sql查询。有可能吗？

浏览 1提问于2019-05-16得票数 0

2回答

使用U-SQL删除空列

、

我有许多文件，我正在尝试将它们连接在一起。我碰巧知道这些文件中的许多列只包含空值，我可以不使用它们。我如何编写一条U-SQL语句来从文件中提取数据，检查只有空值的列并排除它们？谢谢!

浏览 2提问于2016-09-16得票数 0

2回答

使用USQL复制活动可以使用任何正文共享脚本

、

使用U-SQL复制活动可以是任何正文共享脚本我想使用U-SQL使用copy activity读取文件，并使用U-SQL将此文件写入文件的输出

浏览 0提问于2017-05-18得票数 0

1回答

U-SQL表与SQL数据仓库

、、

这就是我所处的位置。我在data Lake Store中存储了大量数据。但是，当我想要生成一份报告(可能需要一个月的时间)时，我希望将其系统化到一个表中，以便在查询时反复引用。我应该只使用Data Lake Analytics通过创建U-SQL表()提供的内置数据库特性，还是应该在SQL Data Warehouse中创建这个表？我想我真正想知道的是，这两种情况的优缺点是什么，什么时候使用这两种情况是最好的？顺便说一下，我是微软Azure世界的新手。仍在积极学习。

浏览 0提问于2016-07-12得票数 1

1回答

在U-SQL中追加现有文件中的数据

、

我们可以在U-SQL中将数据追加到现有文件中吗？我已经在U-SQL中创建了一个CSV文件作为输出。我正在编写另一个U-SQL查询，并希望将该查询的输出附加到现有文件中。有可能吗？

浏览 1提问于2016-12-02得票数 1

1回答

你能帮我用U-SQL自定义输出器生成.Avro文件吗

、、、

我正在寻找一个U-SQL自定义输出器，生成.Avro文件。你能帮我提供任何建议或样品吗？

浏览 2提问于2017-07-20得票数 2

1回答

U-Sql Create table语句失败

、、

我正在尝试使用create table as select (CTA的)从两个表创建一个U-sql表，如下所示- DROP TABLE IF EXISTS tpch_query2_result; CREATE TABLE tpch_query2_result ( INDEX idx_query2 CLUSTERED(P_PARTKEY ASC) DISTRIBUTED BY HASH(P_PARTKEY) ) AS SELECT a.P_PARTKEY FROM part AS a INNER JOIN partsupp AS b ON a.P_PARTKEY ==

浏览 0提问于2018-08-15得票数 0

2回答

在U-SQL中执行R

、、

我尝试使用U-SQL和R进行预测，因此需要从U-SQL向R传递一个值列表，并将预测从R返回到U-SQL 我找到的所有示例都使用了reducer，因此将仅处理1行。有没有可能不向R发送列的列表，而是发送行的列表进行处理？谢谢!

浏览 23提问于2018-09-05得票数 3

回答已采纳

3回答

U-SQL存储过程Datetime.Tryparse in where

、

有没有办法在U-SQL WHERE条件下使用DateTime.TryParse？我正在Azure U-SQL目录中创建一个存储过程。简单的U-SQL脚本支持C#函数。对于存储过程，脚本不会向我的自定义C#代码添加任何程序集引用，或者如果在调用存储过程时添加了没有使用的程序集引用。

浏览 2提问于2018-02-08得票数 0

1回答

U-SQL:如何将参数传递给自定义Reducer？

我想传递一个参数给我的User Defined Reducer (除了输入和输出)。文档(https://docs.microsoft.com/en-us/u-sql/statements-and-expressions/reduce-expression)提到我应该能够做到这一点：使用新的值(参数：“MyNameSpace.MyReducer”) 当我尝试这样做时，编译器告诉我，我的reducer没有一个只接受一个参数的构造函数。它只有一个带2个参数的构造器，但是调用它时不带参数(使用新的MyNameSpace.MyReducer())。我仍然需要IRowset输入和输出参数，因此仅使

浏览 17提问于2019-01-08得票数 0

回答已采纳

1回答

在Matlab中使用load命令打开.mat文件时出错

、、、

下面是我的代码的一部分，我在其中输入了.mat文件的名称，该文件与我的代码位于同一文件夹中。但是，它不识别文件名，并给出一个错误： “？使用==>加载时出错无法读取文件'q.mat'：没有这样的文件或目录。“ q_type=input('Do you want to use q from "A", "B" or from a saved .mat file? Enter the exact name: ','s'); q_type=mat2str([q_type'.mat']) load(q

浏览 1提问于2010-10-24得票数 0

回答已采纳

4回答

如何使用U-SQL用上面的数据填充空白单元格

、

我有一个csv文件，我正在尝试使用Azure Data Lake Analytics U-SQL处理该文件。我对U-SQL还是个新手，所以请容忍我。原始文件是半结构化的，我设法使用silent:true标志修复了它。现在它更加结构化了，我想用上面单元格中的数据填充空单元格。我的数据看起来像这样：我的问题在于前四列中的空单元格。第二行包含我想要复制到它下面的空单元格中的数据(第3-5行)。来自行7的数据需要复制到行8，来自行9的数据需要复制到行10-13，来自行14的数据需要复制到行15-18。必须在不更改“Amount claimed”列中的值的情况下完成此操作。有谁有关于如何在U-

浏览 0提问于2017-06-15得票数 1

1回答

U-SQL output语句必须至少有一个本地运行错误

我正在尝试使用U-SQL。我想在本地运行脚本，但我得到了这个错误：“输出语句必须至少有一个本地运行错误”。我将我的输入文件放在数据根目录中，我只想将一列提取到新文件中。简单的脚本只是为了看看它是如何工作的。我是不是错过了什么步骤？

浏览 0提问于2017-10-10得票数 1

2回答

通过数据工厂将多个动态参数传递给U-SQL脚本

、、

目前我可以将一个参数传递给数据工厂工作流中的u-sql脚本。有了这个参数，我就可以应用一些模式来生成文件路径。有没有办法将datetimes参数的集合传递给u-sql并应用模式来生成文件路径？

浏览 0提问于2018-03-07得票数 1

1回答

U-SQL提取器。当使用静默选项时，我们可以检索被忽略的行吗？

、

当使用U-sql提取器时，我使用静默选项。有没有一种方法可以检索和监控被忽略的行？问候

浏览 4提问于2018-11-28得票数 0

1回答

无法使用R扩展在U-SQL上执行R代码

、、

我一直在尝试使用文档()中提到的R扩展在U-SQL上执行R代码。当我尝试执行上面链接中提到的示例脚本时，它抛出错误： C# error CS1739: The best overload for 'Reducer' does not have a parameter named 'rReturnType' 当我删除rReturnType参数时，我无法理解输出。是否有其他Extension.R参数可以达到相同的目的？

浏览 0提问于2017-12-29得票数 1

1回答

根据列值将数据移动到不同的输出文件夹

、、

现在我们有了Azure Data Lake Store中的数据，现在正在使用Azure Data Analytic Job with U-SQL处理那里存在的数据。现在我们有了一个需求，我们需要根据存在的列值将数据推入不同的输出文件夹。假设一旦我们处理了数据，输出结果如下所示 ID |名称|公司 1 Midhun测试 2个Midhun2 test2 因此，我想将第一个要记录的文件移动到名为“\result.tsv”的输出文件夹中，并将第二个文件移动到"test2"\result.tsv的输出文件夹中我能在U-SQL中做到这一点吗？我没有找到任何关于U-SQL的好的参考文档。

浏览 0提问于2016-01-28得票数 0

1回答

USQL -自定义输出器找不到NewtonSoft

、、、、

我有一个USQL Job，它从Azure Blob读取json，然后在一些数据操作之后，将一个单行JSON文件写入ADLS。我已经写了一个自定义输出器来写JSON文件。下面是我的CustomOutputter文件的外观： using Microsoft.Analytics.Interfaces; using Microsoft.Analytics.Types.Sql; using System; using System.Collections.Generic; using System.Linq; using System.Text;

浏览 0提问于2018-03-30得票数 1

3回答

没有模式的令人厌恶的XML配置-为什么？

、、、、

这不是一个为什么将XML用于配置文件的问题。我的问题是为什么，当用于配置文件时，没有伴随的模式。 log4net是一个很好的案例.您可以通过编程方式配置它，但最好使用XML。好吧，那为什么要这么难呢？在Visual中，当我使用模式输入XML时，我会得到很好的Intellisense。如果没有，我必须猜测每个元素和属性，因为似乎从来没有一个完整的列表。XML变成了令人作呕的XML，这种类型的XML容易出错，输入起来也很乏味。那些从事过这样的项目的人:为什么要发布文档、XML注释和示例，但没有XML模式来简化配置？是懒惰吗？背后有真正的动机吗？没人想过吗？

浏览 3提问于2010-07-20得票数 1

1回答

如何在U-SQL代码隐藏中引用System.Xml

、

我试图在一个U-SQL代码隐藏文件中使用SqlGeometry.STMPolyFromText方法，但是我得到一个错误：'System.Xml.Serialization.IXmlSerializable‘类型是在一个未被引用的程序集中定义的。必须添加对程序集'System.Xml，Version=4.0.0.0，Culture=neutral，PublicKeyToken=b77a5c561934e089‘的引用。如何在U-SQL代码隐藏文件中添加此引用？

浏览 0提问于2017-03-23得票数 1

1回答

使用azure中的数据湖存储进行实时数据聚合

、

目前，我正在存储来自设备的分钟地理位置数据，我想计算每个设备之间的差异，并将其存储为分钟距离。之后聚合它，例如小时，3小时和一些其他聚合，每次当新数据来到我的主csv文件与分钟地理位置数据。我目前计划做的是在特定的间隔时间(例如2/3分钟或由事件触发)调用u-sql脚本，这些脚本读取我的主要地理位置数据，计算每个设备的分钟差，并按分钟、小时等将其聚合到特定文件上。但是，也许有什么有效的方法可以用azure工具来做我真正需要的事情呢？

浏览 0提问于2017-03-26得票数 2

1回答

azure u-sql表-如何从python读取

、、、

我已经在Azure Data Lake Analytics中创建了U-SQL表，我需要使用Python从该表中提取特定的行，有什么帮助吗？

浏览 4提问于2017-12-19得票数 0

2回答

在使用JsonOutputter时如何处理内部Json

、、

我正在使用JsonOutputter将一些csv文件转换为Json。在csv文件中，我有一个包含Json的字段，如下所示(管道字符是分隔符)：...|{“类型”：“点”，“坐标”：18.7726，74.5091 }|... 当输出到Json时，结果如下所示："Location"："{ \"type\":\"Point\"，\“Location\”：18.7726，74.5091 }“ 我想去掉外部引号，使Json看起来像这样："Location"：{ "type":"Point"，“quot

浏览 23提问于2017-06-28得票数 0

回答已采纳

1回答

在U-SQL中什么时候应该使用方括号？

、、

当列名中有空格时，U-SQL需要使用方括号([])。但我在中也看到了这个 System.[IO].File.ReadAllText("helloworld.txt") AS Message 我想知道为什么在这种情况下需要括号，以及[]在U-SQL中有用的所有情况。

浏览 3提问于2017-11-04得票数 1

1回答

如何在ADLA的U-SQL中添加多个文件中的列？

、、

我在Azure数据湖中有很多csv文件，包括各种类型的数据(例如，压力、温度、真/假)。它们都有时间戳，为了机器学习的目的，我需要根据时间戳将它们收集到一个文件中。这在Java中很容易做到-启动一个文件流，在打开每个文件的文件夹上运行一个循环，比较时间戳以将相关值写入输出文件，为每个文件开始一个新列(转到第一行的末尾)。虽然我已经解决了U-SQL中的时间戳问题，但我想不出语法来帮助我在整个文件夹上运行它。通配符语法{*}将所有文件视为相同的文件集，而我需要运行某种循环来连接每个文件中的列。有没有什么方法可以做到这一点，比如使用虚拟列？

浏览 4提问于2017-03-22得票数 2

3回答

U-SQL脚本调试错误

、、

在调试U-SQL脚本时，我遇到了ScopeEngine的调试问题。"ScopeEngine.pdb文件包含查找模块ScopeEngine.dl的源所需的调试信息“ 有没有办法解决这个问题？

浏览 0提问于2017-03-27得票数 0

3回答

如何使用ADF中的参数对文件夹中的所有文件运行U-SQL？

、

无法将" in“参数传递给U-SQL以使用文件夹中的所有文件。在我的ADF管道中，我有以下参数设置： "parameters": { "in": "$$Text.Format('stag/input/{0:yyyy}/{0:MM}/{0:dd}/*.csv', SliceStart)", "out": "$$Text.Format('stag/output/{0:yyyy}/{0:MM}/{0:dd}/summary.csv" } 和U-SQL脚本尝试从中提取： @

浏览 0提问于2016-12-02得票数 1

2回答

添加更多Python库

、、

是否有可能在Azure Data Lake Analytics中添加比pandas、numpy和numexpr更多的Python库？具体地说，在使用U-SQL处理NetCDF文件时，我们需要使用xarray、matplotlib、Basemap、pyresample和SciPy。

浏览 2提问于2016-12-09得票数 2

1回答

Azure Data Lake U-SQL并行作业失败

我们通过ADF运行一个u-sql作业，该作业读取包含Avro文件的文件夹，并将数据转换为csv。同时运行作业、从不同文件夹读取并输出到不同文件夹导致以下错误 FinalMetadataOperationUserError: Failed to write job meta-data due to user error Component JobManager_User Message Failed to write job meta-data due to user error Description Version of object ddc1c212-b227-4b0b-8199-5

浏览 3提问于2019-06-24得票数 0

1回答

将文件复制到Azure数据湖存储之外

、、

我已经在Azure Data Factory中设置了管道1)从Storage复制文件到Lake 2) u-sql合并/处理复制的文件并输出到单个文件3)打开并处理这个合并的文件(插入到DB)。无论我怎么尝试，权限，步骤3都会失败。Azure data lake的所有演示和教程都止步于生成声称成功的输出文件。工作完成等。我发现这上面的docs.microsoft相当复杂(可能是由于Gen1/Gen2 Lake??)。当然，我尝试做的是一个常见的场景，获取一些数据文件，合并并输出，处理输出。 u-sql进程创建的文件似乎与其他文件的所有者不同，因此最常见的错误是403。在ADF中设置管道时，

浏览 17提问于2020-01-31得票数 0

1回答

带有自定义输出程序的动态文件名

、、

我试图使用自定义输出程序使用u-sql处理图像(创建缩略图)，并尝试以动态文件名输出文件。我的代码看起来是这样的。 REFERENCE ASSEMBLY [USQLAssemblies]; @image_out = SELECT USQLAssemblies.ImageOps.scaleImageTo(ImgData, 480, 480) AS thumbnail_image, FileName + "480" AS FileName FROM dbo.ThumbnailImages; OUTPUT @image_out TO @"D:\Test\

浏览 0提问于2019-01-07得票数 1

1回答

我只想从U-SQL Azure数据工厂的.csv文件中选择几列

我只想从U-SQL Azure数据工厂的.csv文件中选择几列。在我的csv文件中有10列，我只想选择5列并写入新文件

浏览 0提问于2017-05-17得票数 1

1回答

从Azure用户定义的输出器读取模板

、

我是Azure Data Lake的新手。我想创建用户定义的输出器，它使用文件模板来生成输出文件。问题是在输出器中存储和检索模板文件的最佳方式是什么？最简单、最容易的方法是将模板文件嵌入到U-SQL程序集中，然后从程序集资源中读取它。但这不是灵活的解决方案-如果需要更改模板，则需要重新部署outputter dll。正确的方法似乎是将模板存储在Azure Data Lake Storage中，但我不确定如何从输出器的C#代码中读取模板。

浏览 38提问于2020-04-22得票数 1

1回答

可以在Azure Data Lake Gen 2 Rest API中使用通配符吗？

、、、

我已经创建了一个Azure data Lake gen2文件系统来存储和恢复数据。我已经正确地加载了我的数据(每天一个文件)，但是，当我想要使用Azure Data Lake Azure Rest API获取数据时，我只能针对每个请求访问一个文件，所以，如果我需要一个月，我必须每天执行一个请求并将其合并到我的本地机器中，而直接在Azure Data Lake gen2中这样做是可取的。我知道这可以在数据库中使用SparkSQL和通配符来完成，但是如果我可以直接在Azure Data Lake gen2 rest API中使用通配符，那就更好了。我已经找过了，但是我发现文档不清楚。每个人都知道

浏览 29提问于2019-04-04得票数 -2

1回答

U-SQL -添加R dplyr包

、、

我们开发的R模型之一是使用dplyr R库。 U-SQL默认库不随dplyr一起提供，因此我们尝试使用下面的代码手动部署它，但它不起作用。它不会加载这个库。 U-SQL代码部署RESOURCE @"/LibDataLake/RLibraries/dplyr_0.7.8.zip"； R代码install.packages('dplyr '，repos = NULL)需要(Dplyr) 所以我们尝试直接从CRAN网站下载。它确实可以在本地运行，但它会下载较旧版本。 install.packages('dplyr') 上面方法的其他问题是只能在本地工作

浏览 4提问于2018-12-05得票数 0

4回答

将表从azure SQL数据库迁移到Azure数据湖

、、

我想要完全迁移所有的表从azure SQL数据库到azure数据湖。我怎么能做到这一点。请给我一些场景，这样我就可以完全搬到天蓝色的数据湖。提前谢谢。我也可以通过SSIS做到这一点吗？

浏览 1提问于2016-10-21得票数 2

1回答

动态FROM in U-SQL语句

、

我正在尝试在U-SQL中生成一个动态的FROM子句，这样我们就可以根据之前的查询结果从不同的文件中提取数据。大概是这样的： @filesToExtract = SELECT whatevergeneratesthepaths from @foo; <-- this query generates a rowset with all the file we want to extract like: [/path/file1.csv, /path/file2.csv] SELECT * FROM @filesToExtract; <-- here we want to extract

浏览 4提问于2017-08-18得票数 1

1回答

Angular/Java自动生成前端和后端验证

、、、

我希望我的问题不是太宽泛。我们的应用程序有一个角度前端和一个Java后端，我们需要前端和后端验证。目前，我们在Typescript和Java中手动编写验证器，基本上做同样的事情。由于这不仅繁琐而且容易出错，我们希望定义一次(可能在JSON文件中)哪些输入字段具有哪些约束，并且理想情况下使用一个软件来根据该定义自动生成Java和Typescript代码。我的问题是:有没有开源/商业软件解决方案可以解决这个问题？这似乎是一个很常见的问题，但我还没有找到一个合适的解决方案。JSON模式似乎很有前途，因为我们无论如何都在使用swagger，我曾希望swagger-codegen会自动将支持的JSO

浏览 0提问于2018-11-14得票数 2

1回答

U-SQL中的FILE.EXISTS

我想在运行时创建一个路径，并检查该路径和文件在ADLS中是否存在。根据我的理解，使用U-SQL不可能在运行时生成路径，例如- DECLARE @filePath string = @"/temppath"; FILE.EXISTS(@filePath "/" DateTime.UtcNow.AddDays(-numberofdays).Year "/" DateTime.UtcNow.AddDays(-numberofdays).Month "/" DateTime.UtcNow.AddDays(-numberofdays).da

浏览 0提问于2018-04-20得票数 0

2回答

组合空间数据的最佳方法

我有一个关于空间数据和u-sql的问题。我有一个多边形的输入和一个点的输入，我想把它们组合起来，这样我就知道点属于哪个多边形。在T中，我会使用类似于polygon.STintersect(point)= 1的语句进行左外部连接但我想这在u sql中是行不通的。那么我如何组合这两个输入呢？

浏览 6提问于2017-12-15得票数 2

回答已采纳

1回答

如何从Azure数据湖分析文件中的dat文件中获取列计数

、

我有不同的Dat和CSV文件。它包含超过255列，分隔符为'|‘和制表符。如何获取列数。任何人都可以分享示例U-Sql代码

浏览 0提问于2018-06-29得票数 0

3回答

Azure Data Lake中的文件夹统计信息

、、、

我正在尝试总结有多少数据已经写入到我的数据湖中的文件夹中。做这件事最好的方法是什么？我应该使用U-SQL作业吗？HDInsights？

浏览 1提问于2018-03-09得票数 4

2回答

函数在将输入设置为INT时接受varchar。

、

我有一个函数，它应该有INT作为输入。但是，当我传递任何字符串时，输入将被接受。为什么函数由于输入与输入类型不匹配而不出错？这是函数 DROP FUNCTION IF EXISTS erbaccess.canAdminIRB; DELIMITER $ CREATE FUNCTION erbaccess.canAdminIRB(_userID int) RETURNS int BEGIN set @canPerformAction = 0; if (select count(*) from erbaccess.usersVsGroupsVsActions where

浏览 0提问于2019-07-15得票数 2

回答已采纳

1回答

使用输出器时，标题行未显示在CSV顶部

、

在u-sql查询中，通过Outputterss.Csv()函数将数据从一个csv文件转储到另一个csv文件，但是带有列名的标题行出现在文件的末尾，而不是top.Please。在帮助信息中查找my code below.Thanks。 @telDataResult= SELECT "vin" AS vin, "outsideTemperature" AS outsideTemperature, "EventProcessedUtcTime" AS EventProcessedUtcTime, "PartitionId" AS

浏览 3提问于2016-06-13得票数 0

1回答