雅典娜presto -从长到宽的多列_熊猫长到宽，多列_按多列聚合，从长到宽重塑 - 腾讯云开发者社区

、、、、

在使用AWS雅典娜查询S3上的拼花数据时，我遇到了这个奇怪的问题。基本上，我在S3上存储了一个拼花文件(大约38 S3)，其模式如下：表名: test_table_tinyint ntwk_id (int) broadcast_date (字符串) daypart_id (丁质) 然后运行以下查询:从"test_table_tinyint“中选择count(*)，其中daypart_id = 5；结果:运行时间: 2.7秒，数据扫描:32 The 这是很奇怪的，因为它看起来像没有使用在地板文件中的列索引，它实际上进行了一个完整的表格扫描。然后，作为比较，我创建

浏览 0提问于2018-07-12得票数 0

1回答

在AWS Athena中-如何以所需的格式显示时间戳列？

、、、、

我在AWS S3中有一个包含时间戳列的拼图文件，如下所示 updated_time = "2014-11-13T03:10:17.098765Z". 我创建了一个胶水目录，并从AWS athena查询它。在雅典娜，我只能在毫秒字段中看到3个精确值"2014-11-13 03:10:17.098“。是否有任何选项可以获得与S3中的微秒相同的所有6个精确值。雅典娜的实际结果 2014-11-13 03:10:17.098 雅典娜的预期结果 2014-11-13 03:10:17.098765

浏览 26提问于2021-05-14得票数 0

回答已采纳

2回答

我能在写之前用雅典娜/普雷斯托对桌子进行排序吗？

、、

我想将我的日志存档为Parquet格式。在编写表之前，我希望按列c对其进行排序，以便每个Parquet文件只具有一小部分c。这样，当查询在列c上包含WHERE子句(通过谓词下推)时，雅典娜/ Presto就可以有效地扫描表。然而，我不清楚我是否可以使用雅典娜或普雷斯托对整个桌子进行排序。我需要一种分布式排序--而不是发生在单个节点上的排序--因为数据集太大，无法适应单个节点。这种可能吗？如果是这样，我如何调用它？

浏览 0提问于2019-03-12得票数 2

回答已采纳

1回答

AWS雅典娜(Presto)如何转置映射到列

、

AWS雅典娜查询问题；我的行中有一个嵌套的map，我想将其中的键转置为列。我可以像items['label_a']一样显式地命名这些列，但在本例中，键实际上是动态的…… 从这些行中： {id=1, items={label_a=foo, label_b=foo}} {id=2, items={label_a=bar, label_c=bar}} {id=3, items={label_b=baz, label_c=baz}} 我想要一张这样的桌子： | id | label_a | label_b | label_c | --------------------------

浏览 27提问于2020-07-03得票数 2

1回答

亚马逊雅典娜视图实际上是蜂巢视图，还是单独的插件？

、、、

亚马逊雅典娜基于Presto。Amazon Athena支持视图。 Presto不支持配置单元视图，因为它不想处理配置单元查询语言。由于视图实际上是一个配置单元查询，因此它必须理解配置单元的整个语言，而不仅仅是它的模式。Presto supports views通过其蜂窝连接器。这些视图是"Presto视图“，是特定于Presto的(不能从配置单元中查询)。雅典娜支持隐蔽下的蜂窝视图吗？或者，雅典娜视图是一个完全独立的层/插件，只保存命名为Presto/Athena的查询？

浏览 20提问于2019-05-25得票数 4

回答已采纳

1回答

亚马逊雅典娜中的重复值

、、

我想重复一个项目n次(其中n来自另一列)。 Presto包含重复函数，但雅典娜不支持它。那么，还有其他方法重复项目吗？例如( X，3) -> X，X，X。

浏览 2提问于2018-09-20得票数 0

回答已采纳

2回答

雅典娜普雷托parse_duration未注册

、、

我有一个雅典娜数据库，我正在尝试使用parse_duration Presto函数。由于某些原因，它不起作用(说该函数没有注册)。有人有同样的问题并设法解决了吗？或者有其他我可以使用的功能的想法？ parse_duration函数从2017年5月开始就存在于Presto中，所以我认为雅典娜应该已经支持它了，不是吗？谢谢!

浏览 0提问于2018-06-25得票数 0

回答已采纳

1回答

如何将S3存储桶中的JSON文件与AWS Athena中的字段链接起来

、、

我正在尝试将一些电子邮件信息存储到雅典娜的“主题，发件人，收件人，正文”中，对于正文，我将在其中包含一些大型内容。是否可以将S3存储桶中的JSON或TXT文件与body列中的条目链接起来，并将其从Athena中提取出来？我已经看到DynamoDB有类似这样的东西，它可以在它的条目中存储对象的引用。我们能在雅典娜做同样的事情吗？如果是这样，有人能告诉我如何存储和检索这些信息吗？谢谢尼基尔

浏览 3提问于2018-11-02得票数 0

1回答

有没有办法把AWS雅典娜的结构场夷为平地？

、、、、

我正在尝试编写雅典娜查询，这将允许我在select语句中展开一个结构。假设我有一个表my_table，它看起来像： id string, metadata struct<field1:varchar,field2:int> 我知道，通过将名称field1放在查询中，我可以从结构中提取字段，但是我想要一些更一般的内容，比如metadata.*，以便模式可以是抽象的。这可以很容易地用Python和一些库来完成，但是想要检查在雅典娜里面是否有什么可以完成的。谢谢!

浏览 2提问于2020-05-08得票数 3

回答已采纳

1回答

在AWS雅典娜中连接两个表时，选择除一列外的所有列

、、、、

我想在AWS雅典娜中使用Presto语法连接两个包含多个列的大型表。我的代码非常简单： select * from TableA as A left join TableB as B on A.key_id = B.key_id ; 加入后，主键列(key_id)重复两次。这两个表都有100多个列，连接时间很长。如何解决key_id列不会在最终结果中重复两次的问题？ AWS雅典娜不支持except命令，不像Google BigQuery。

浏览 3提问于2022-08-17得票数 1

回答已采纳

1回答

查找雅典娜查询结果的来源

、、、

我们有数千个文件存储在S3中。这些文件是公开给雅典娜，以便我们可以查询它们。在进行调试时，我发现雅典娜在查询特定id时显示了多行空行。考虑到有数千个文件，我不知道这些数据是从哪里来的。有没有办法在雅典娜结果中看到各自行的源文件？

浏览 3提问于2018-11-27得票数 4

回答已采纳

1回答

如何在雅典娜中做as字符串的MD5哈希？

、

雅典娜中的MD5哈希函数对字符串无效。然而，雅典娜的文档显示确实如此：不确定我在这里遗漏了什么。如果我将varchar转换为varbinary，那么生成的散列是不正确的。获取此错误： SYNTAX_ERROR: line 1:8: Unexpected parameters (varchar(15)) for function md5. Expected: md5(varbinary) This query ran against the "temp" database, unless qualified by the query. Please post the err

浏览 1提问于2019-04-17得票数 2

1回答

使用AWS Athena查询按月计算成本的查询

、

我有一个类似下面的表格。 item_id bill_start_date bill_end_date usage_amount 635212 2019-02-01 00:00:00.000 3/1/2019 00:00:00.000 13.345 user_project IBM 我试图找到每个月和每个项目的usage_amount。亚马逊雅典娜查询引擎基于Presto 0.172。由于雅典娜的限制，它不能像select sysdate from dual;那样识别查询。我尝试将bill_start

浏览 22提问于2019-02-14得票数 0

1回答

如何让雅典娜/普雷斯托识别拼花指数？

、、、、

我有一个25k的“行”拼花文件(总计469.5kb)，其中每个项目都有一个唯一的整数id。知道了这一点，我在本专栏上添加了一个索引，但没有显示索引该列在使用Athena (AWS服务)/ Presto (基础引擎)时实际上会影响性能。我正在尝试一个简单的选择，从哪里我要拉一个行，它是id- SELECT * FROM widgets w WHERE w.id = 1 id列是索引的，所以一旦Presto找到匹配项，就不应该再进行任何扫描。列也是有序的，所以它应该能够执行二进制搜索解析位置而不是哑扫描。我可以判断索引是否被正确使用，因为Athena返回操作中扫描的字节数。不管有没有索引，雅典娜

浏览 0提问于2018-09-24得票数 2

回答已采纳

1回答

AWS Athena中日期类型的最高值是多少

、

我使用拼图文件在AWS雅典娜上将时间戳列类型转换为DATE。由于某些原因，2049-12-10 00:00:00通过一个错误。此类型是否有最大日期限制？

浏览 9提问于2020-02-20得票数 0

1回答

Aws Athena View列计数限制？

、、

我似乎遇到了一个雅典娜视图构造限制，我找不到任何关于它的文档。这是我用来生成视图的查询： CREATE OR REPLACE VIEW view1 AS ( SELECT * FROM table1 ) table1只有5行。如果table1有9334列，则视图构造成功。但是如果table1有9335列，我会得到以下错误： Exception: com.facebook.presto.v217.spi.PrestoException: 1 validation error detected: Value '/* Presto View: 它后面跟着一个页面长的散列。有没有人

浏览 47提问于2021-10-22得票数 1

回答已采纳

4回答

Amazon Athena上的重复数据删除

、、

我们有流媒体应用程序在S3上存储数据。S3分区可能具有重复的记录。我们通过雅典娜查询S3中的数据。有没有一种方法可以从S3文件中删除重复项，这样我们在从雅典娜查询时就不会得到它们？

浏览 0提问于2017-08-13得票数 3

1回答

在aws雅典娜中由CTAS创建的表是外部表吗？

、、

任何知道以下情况的人，请回复。是雅典娜表所有的外部表吗？ Aws雅典娜有外部表和托管表？

浏览 0提问于2021-06-20得票数 1

回答已采纳

1回答

雅典娜中的Geeting invalid_cast_argument错误(Presto)

我在sql方面很新，我正在尝试一个简单的查询。 select *, max(cast(version_date as date)) over (partition by id) mx_dt, min(cast(version_date as date)) over (partition by id) min_dt from "raw_data"."raw_brands"; 但是我发现了一个错误：从AWS雅典娜客户端抛出一个错误。INVALID_CAST_ARGUMENT:值到目前为止无法转换: 2020-

浏览 2提问于2020-01-24得票数 0

回答已采纳

1回答

在雅典娜查询中获取S3文件创建/更新日期

、

有没有内置的雅典娜函数可以在查询结果中显示给定行的底层S3文件创建/修改日期？我们有一个具有许多不同文件格式的大型数据湖，很难将这些信息添加到所有这些数据湖中。

浏览 3提问于2021-07-07得票数 0

1回答

雅典娜相当于information_schema

作为背景，我有SQLServer背景，并且大量使用系统表& information_schema，来告诉我关于表和列的所有信息。我没想到雅典娜会有完全一样的力量，但现在我对似乎很少的东西感到非常震惊和沮丧--除非我错过了什么？例如，'describe mytable‘-一次只描述一个表。在一个结果中显示所有表的列如何？它也不会输出表名称，也不允许您手动将其作为自定义列添加到中。这些"show/ list /describe“命令的所有结果似乎都会生成一个文本列表，而不是一个记录集，因此您不能获取结果并将其连接到其他表或视图以生成更复杂的输出。有没有其他方法可以

浏览 26提问于2019-07-02得票数 7

回答已采纳

1回答

在Athena中将字符串格式转换为日期时出现问题

请求您的帮助，因为您一直在尝试解决此问题，但无法解决。我在雅典娜有一列字符串。我想在雅典娜中将该列转换为时间戳。我使用了以下查询： select date_parse(timestamp,'%Y-%m-%dT%H:%i:%s.%fZ') from wqmparquetformat ; 但我收到错误: INVALID_FUNCTION_ARGUMENT: Invalid format："1589832352“在"832352”处格式不正确我已经尝试了时间戳格式的Presto的所有组合。当我运行以下查询时： select to_iso8601(from_u

浏览 46提问于2020-06-17得票数 0

1回答

AWS Glue Crawler将所有数据发送到Glue Catalog和Athena，而无需Glue Job

、、

我对AWS胶水有新的了解。我正在使用AWS Glue Crawler从两个S3存储桶中抓取数据。我在每个存储桶中都有一个文件。AWS Glue Crawler在AWS Glue Data Catalog中创建了两个表，我还可以在AWS Athena中查询数据。我的理解是为了在雅典娜中获取数据，我需要创建胶水作业，这将在雅典娜中提取数据，但我错了。Glue crawler将数据放在雅典娜中而不需要Glue作业，如果我们需要将数据推送到数据库中，如SQL，Oracle等，那么我们需要Glue job，这是正确的吗？如何配置Glue Crawler，使其只从源存储桶中获取增量数据，而不是所有数

浏览 62提问于2021-10-08得票数 1

回答已采纳

1回答

在创建雅典娜表时添加标识列

我想从存储在AWS-S3中的数据创建一个雅典娜表。但是，另外，我还想要一个标识列。由于invalidrequestexception.雅典娜使用presto sql engine，所以我运行了下面用Athena编写的查询，但是它给出了错误代码400：雅典娜查询 :- CREATE EXTERNAL TABLE `db_name`.`preprocessed` ( id bigint unsigned NOT NULL PRIMARY KEY AUTO_INCREMENT, `event_action` string ) PARTITIONED BY ( `platform` string `d

浏览 1提问于2019-08-20得票数 1

2回答

快速查看将嵌套添加到SQL查询中，从而导致雅典娜中的错误。

、、

我试图在Quicksight中创建一个非常简单的可视化，为此，我在Quicksight中使用了一个SQL查询， SELECT COUNT(distinct uuid), day FROM analytics.myTable GROUP BY day 不幸的是，每当我在Quicksight中运行此查询时，它都会因为以下错误而失败来自AWS雅典娜的客户。SYNTAX_ERROR:第2:8行:无法解析列“_col0” 当我查看雅典娜时，我可以看到Quicksight正在“嵌套”SQL查询.这就是雅典娜出错的原因， /* QuickSight 4da449cf-ffc6-11e8-92ea-

浏览 1提问于2018-12-14得票数 1

回答已采纳

1回答

传统的时间戳应该在Presto 0.220中工作吗？

、、

我遇到了一个问题，正确地阅读时间戳，没有任何自动转换的Presto上的电子病历。示例:在AWS Glue目录中，我有一个表，其中包含UTC时间中的时间戳列(数据类型为时间戳)。当他们在雅典娜询问时，他们会如愿以偿地回来。当在Presto中查询EMR (EMR5.26，Presto 0.220)时，会出现对不同时区的自动转换。 Presto在这里描述了禁用此行为的一种方法- 。 The legacy semantics can be enabled using the deprecated.legacy-timestamp config property. Setting it to true

浏览 0提问于2019-09-23得票数 0

回答已采纳

1回答

将带有偏移量的DateString转换为雅典娜/ Presto中的有效日期/时间戳

、、、、

我正在尝试将日期字符串字段转换为日期。问题是字符串字段对东方时间的偏移量。如何将其转换为日期时间？日期字符串：2016-09-21T10:01:43-04:00 这必须转换为有效的日期时间在亚马逊AWS雅典娜。试过From_iso8601_timestamp，date_parse。但没有运气。

浏览 0提问于2019-04-30得票数 0

回答已采纳

1回答

从AWS Athena/Presto查询struct字段

、、、

我将为这个站点做一个简化的示例，但基本上我试图编写一个雅典娜查询( Glue爬行器加载的数据，并打算在Quicksight中使用)，这将允许我在select语句中展开一个结构。在我的示例中，假设我有一个表my_table，它类似于： id string, scores struct<prediction:double,score:int> 但是，由于我不知道scores列在查询时的确切结构，所以我想在查询的范围内扩展它。我尝试过多种组合，但只使用结构内部嵌套字段的确切名称似乎会产生结果，即 select results.id, results.scores.score, res

浏览 0提问于2019-09-11得票数 5

1回答

EMR-Presto和Athena查询结果的差异

、、、

我已经连接了Glue目录到雅典娜和一个EMR实例(预置)。我试着在这两种情况下运行相同的查询，但得到的结果不同。EMR为0行，雅典娜为43行。使用left join、group by和count distinct查询非常简单。该查询如下所示： select t1.customer_id as id, t2.purchase_date as purchase_date, count(distinct t1.purchase_id) as item_count from table1 t1 left join table2 as t2 on t2.purchase_id=

浏览 1提问于2018-09-16得票数 1

回答已采纳

1回答

如何在有JSON值的Amazon Athena上查询(搜索) sql？

、、、、

1st err while querying[][1] ? select * from table where properties 'year' = 2007 // is not working //please check the screen shot of the table 我想通过sql查询来查询雅典娜数据集。我尝试了所有查询，但都不能处理这个雅典娜数据

浏览 28提问于2019-03-15得票数 1

回答已采纳

2回答

在aws中将1,620列旋转到360 in文本文件中的行

、、、、

浏览 0提问于2017-10-21得票数 1

1回答

雅典娜DateDiff

、、、

我正在尝试执行我认为是一个简单的日期差异函数，但由于某种原因，我的单位值被读取为列("dd")，因此我一直得到一个列无法解决错误。我在用AWS雅典娜我的代码是 SELECT "reservations"."id" "Booking_ID" , "reservations"."bookingid" "Booking_Code" , "reservations"."property"."id" "Property

浏览 1提问于2019-10-10得票数 12

回答已采纳

2回答

AWS Glue + Athena/Hive取代复杂SQL查询是否正确？

、、、

我一直在使用AWS雅典娜查询存储在S3上的多个表中的分析数据。在一段时间内，我提出了2-3个复杂的SQL查询(涉及几个联接)来提取相关数据。由于雅典娜是用于临时查询(而不是预定义查询)，除了处理几个TB和30分钟超时的高昂成本外，我还在寻找替代方案。我能想到的两种选择是：使用基于Presto的EMR群集并运行现有查询。它取消了30分钟的限制，降低了成本(5美元/TB)。但是，这些缺点是在连续运行时重新处理相同的数据。执行ETL (例如通过AWS Glue)和反错数据。这将减少重复连接，因为只处理增量数据。随后，使用一些SQL接口- Athena/Hive查询扁平的数据。然而，除了

浏览 0提问于2018-08-03得票数 4

2回答

亚马逊雅典娜(Presto) SELECT语句创建(n^2 + n)/2 (?第t个三角数)

、

我正在使用雅典娜，并试图找到一种方法来创建一条select语句，该语句将返回以下格式的序列： Numer 1 2 2 3 3 3 4 4 4 4 以此类推，最高可达200。这有可能吗？

浏览 18提问于2019-12-02得票数 0

回答已采纳

2回答

如何处理具有varchar值以及显示为科学格式的大量数字的列？

、、、、

我正在将csv文件中的数据加载到AWS雅典娜的表中。在解析csv时，有一个具有varchar值(如ABC123123 )的字符串列，并且有像2588000000这样的大数字(以科学格式显示)，我只希望将科学格式转换为浮动，这样它就会出现在2588000000，而不是以科学格式出现。我尝试了以下几点： SELECT ..., cast(column2 as float) FROM "db"."table" 但是，由于同一列中有varchar值，所以我显然不能将其转换为float。我还尝试了以下几点： SELECT column1, (CASE

浏览 3提问于2020-08-04得票数 1

回答已采纳

1回答

达美湖+ ADSL + Presto数据库

、、、

Databricks刚刚发布了。我是Azure的新手，该链接多次提到EMR和雅典娜，但缺少Azure关键字。所以我不得不问一个愚蠢的问题：我说得对吗，Presto集成只适用于AWS，因为Azure没有Presto PaaS？数据库是否计划在最近的将来进行达美湖和Synapse/Polybase的集成？

浏览 2提问于2020-01-10得票数 0

回答已采纳

1回答

使用未来版本的功能

、

binomial_cdf(numberOfTrials, successProbability, value) → double在当前版本的Presto中可用，但在版本0.217中没有是否可以将此函数的实现复制到sql代码中？背景：电流 0.217 雅典娜引擎版本2是基于普雷斯特0.217。请参阅

浏览 2提问于2021-09-29得票数 0

回答已采纳

1回答

在Amazon Athena中创建临时函数

、

我在Amazon Athena上做了一些查询(据我所知，它使用的是Presto )。我想以类似于Presto的方式创建一个临时函数 CREATE TEMPORARY FUNCTION square(x int) RETURNS int RETURN x * x SELECT square(col) from table 有没有可能在雅典娜这样做？我找到的唯一的tutorial对我来说并不是很容易理解。

浏览 21提问于2021-04-07得票数 0

回答已采纳

1回答

雅典娜列包含列表类型数据。

、

有这样一张雅典娜桌： userid visited 001a ['New York','Los Angeles'] 002b ['Atlanta'] 0030 ['New York','Paris','Albany'] .... 不太确定如何查询这样的列表类型列。我怎么能找到访问“纽约”的用户希望： 0001a 00030 所有不同的城市都参观过？期望产出： 'New York' 'Los Angeles&

浏览 1提问于2021-06-02得票数 1

2回答

Presto -获取数组元素的和

、

我使用了雅典娜，并试图获得数组元素的和，这些数组元素是双精度的，但reduce函数似乎只对整数有效： SELECT reduce(ARRAY [5.0, 20.0, 50.4], 0, (s, x) -> s + x, s -> s); 将抛出一个错误： Unexpected parameters (array(double), integer, com.facebook.presto.sql.analyzer.TypeSignatureProvider@762f0fa7, com.facebook.presto.sql.analyzer.TypeSignatureProvider

浏览 99提问于2020-06-02得票数 0

回答已采纳

1回答

如何通过AWS Glue获取最新数据

、

我在AWS中管理一些数据，S3桶中有一些拼花文件。每天，新的文件将添加到这个桶中，我想通过使用Athena获取最新文件中的数据。我想知道如何在雅典娜查询中指定最新的文件路径。是否可以从每个拼花文件的路径中识别出最新的文件？

浏览 6提问于2021-12-02得票数 1

回答已采纳

1回答

在雅典娜/普雷斯托用地板滚动和

、、

在雅典娜，我想计算一个滚动的总和，在一个窗口，不能低于0。例如，如果将具有(1, 2, -1, -2, -1, -2, 1, 2)值的列相加，我应该得到(1, 3, 2, 0, 0, 0, 1, 3)。没有地板约束，这很容易- SUM(X) OVER (PARTITION BY some_group ORDER BY ordering_col)。或者，如果我们只想在做了一个实际的累积和之后，将所有的值裁剪为0。但是我不知道如何使用窗口函数来实现我想要的结果，虽然我可以使它在一些特殊情况下工作。这有可能吗？

浏览 0提问于2022-03-17得票数 1

1回答

将字符串类型转换为Unix Date Amazon Athena

、、

我希望在亚马逊雅典娜网站上得到一个结果，如果我能按日(或者按月)计算用户数量的话。但在此之前，我必须将unix时间戳转换为另一种日期格式。这就是我失败的地方。我的最后一个目标是转换这种时间戳： 1531888605109 在以下方面： 2018-07-18 但是当我尝试应用我在这个测试中看到的解决方案时：我发现了一个错误： SimbaAthenaJDBC从AWS雅典娜客户端抛出一个错误。SYNTAX_ERROR:第1:13行:函数from_unixtime的意外参数(varchar)。预期: from_unixtime(double)，from_unixtime(do

浏览 0提问于2018-10-22得票数 4

回答已采纳

1回答

将数组或结构转换为字符串

、、、、

我正在使用org.apache.hive.hcatalog.data.JsonSerDe从json格式将数据加载到雅典娜。目前，我使用struct<...>或array<...>指定对象和列表，但目标是将它们作为varchar或string类型的最终拼花表。因此，我仍然可以使用JSON格式，但使用字符串/varchar类型。你能给我一些好的方法吗？对json和后来对varchar的铸造对我都不起作用： CREATE TABLE new_table AS SELECT cast(my_struct_col as varchar) my_struct_col FROM

浏览 25提问于2022-10-31得票数 0

回答已采纳

1回答

Presto / AWS雅典娜:在SELECT中创建不同类型的数组

、、

我目前有一个AWS雅典娜查询，如下所示： SELECT array_agg(ROW(n.stop_sequence, n.stop_name, n.stop_lat, n.stop_lon)) FROM ... GROUP BY ... 现在的输出如下所示： [{field0=39, field1=Name, field2=41.838512, field3=12.437013}, {field0=...,...},...] 是否有方法以某种方式修改(而不是进行另一个查询来修改当前输出) SELECT，从而使输出看起来像这样？ [[39, Name, 41.838512, 12.437013}

浏览 3提问于2020-07-25得票数 0

回答已采纳

1回答

对雅典娜的分层SQL查询

、、、

我试图在雅典娜中创建一个解决这个问题的查询：我有这样的记录 {'id': 'a', 'children': ['b','c']} 它创建了一个层次结构，就像一棵树，但是有一个不确定的子结构。我有不止一个根，也就是说，不止一个元素不是任何人的子项。我想为其中之一弄到完整的结构。我如何使用SQL查询来做到这一点？我看到在雅典娜中不允许递归查询。

浏览 0提问于2020-11-12得票数 0

回答已采纳

1回答

AWS雅典娜

、、

我想使用LIMIT和OFFSET子句在AWS雅典娜上运行一个查询。我认为前者是支持的，而是支持的。是否有任何方法可以使用其他方法模拟此功能？

浏览 2提问于2017-07-15得票数 9

回答已采纳

1回答

使用presto sql和AWS athena中的编码将varbinary转换为varchar

、、、

我用的是AWS雅典娜。我有一个字符串字段，它保存了由javascript的btoa进行的DOMString的base64编码(所以，不是utf-8字符串，而是16位编码的字符串)。因此，字符串Fútbol España被存储为Rvp0Ym9sIEVzcGHxYQ== (而不是utf-8编码的base64 RsO6dGJvbCBFc3Bhw7Fh ) 如何在AWS athena (presto) SQL中解码此字符串？如果我使用 select from_utf8(from_base64('Rvp0Ym9sIEVzcGHxYQ==')) 我得到F�tbol Espa�a..。

浏览 34提问于2019-06-24得票数 4

回答已采纳

1回答

如何在Athena / Presto中限制数组列中的元素数和/或总大小？

、、

我一直在查看雅典娜和PrestoDB文档，但找不到任何有关数组列中元素数量和/或最大总大小的限制。文件将是拼图格式，但如果拼图是限制因素，这是可以协商的。这是已知的吗？更多上下文：我将把数据推入消防软管，它会将镶木地板文件发送到S3，我计划使用雅典娜查询这些文件。数据是S3 URI到一组ID的一对多映射，例如 s3://bucket/key_one, 123 s3://bucket/key_one, 456 .... s3://bucket/key_two, 321 s3://bucket/key_two, 654 ... 或者，我可以在下面的表单中存储： s3://bucket/key

浏览 2提问于2019-06-17得票数 0

1回答

实用程序，它将从AWS Glue目录创建AWS雅典娜表定义，以便我可以添加一个WITH SERDEPROPERTIES部分

、、、

更新:看起来像一个aws glue get-table --database-name xyz --name tablename会给我提供表定义的原材料，所以这是一个进步--只是想知道是否存在某种自动组装部件的东西 [更新2:您可以让Cloudtrail显示雅典娜表的定义，不使用，使用胶水或胶水爬虫，如本中所讨论的。它仍然有一些古怪之处(没有将一些更复杂的数据元素定义为结构)，但它比如果将胶水指向cloudtrail会生成的东西要好。] 我有一个Glue目录的S3桶，里面有云跟踪日志。JSON巢穴很深。实际上，有一些属性像encryptionContext:struct<aws\:clo

浏览 4提问于2020-05-16得票数 1

回答已采纳