Amazon Athena的用例

文章/答案/技术大牛

发布

2回答

我们正在构建一个web应用程序，让客户能够根据当前流入ElasticSearch的事件来洞察他们的活动。客户是向人们发送消息的组织。有人担心，如果要求托管这些数据三年，就会产生非常大的存储量，并且在使用Elasticsearch的情况下实现成本很高。另一种方法是将每天的数据处理成存储在S3中的report CSV，并使用Amazon Athena之类的工具执行查询。我们的应用程序是否可以向A

浏览 23提问于2020-08-12得票数 0

1回答

将数据从API端点拉入AWS

、、

所以我是API的新手，我有这样的用例:有订单历史记录存储在一个位置上，而供应商已经将这些作为API端点公开(给定一个URL以及API键/参数等)，我想提取这些数据并将其带到我的Redshift表中。我希望能够每天运行一个作业，并将当天的所有新订单放入我的Redshift表中。现在，我正在探索GLUE，因为它具有作业创建/调度功能，但是GLUE只支持使用JDBC协议的少数数据源以及几个非本机数据源。我找不到任何特定于Glue从API端

浏览 18提问于2019-12-20得票数 1

2回答

outputLocation不是有效的S3路径。雅典娜例外

、、、、

Amazon.Athena.Model.ResultConfiguration resultConfig = new Amazon.Athena.Model.ResultConfiguration();tried//testbucket

浏览 1提问于2018-02-14得票数 3

2回答

从亚马逊DynamoDB到亚马逊S3的增量导出

、、、、

我们需要对亚马逊DynamoDB中的数据进行分析。由于DDB在分析方面的局限性，在DDB中做这件事不是一个选择，根据我的建议，我倾向于DDB -?> S3 ->雅典娜。它是一个数据密集型应用程序，具有来自亚马逊网络服务IoT设备的数据流，也是一个多租户应用程序。现在，要将数据从DDB同步到亚马逊S3，可能一天需要几次。为此，我们如何设置增量导出？

浏览 30提问于2021-06-19得票数 0

1回答

如何将cloudwatch自定义指标发送到Amazon* Quicksight Dashboard*

、

我正在将自定义指标数据(客户使用操作次数的计数)发布到cloudwatch。我想使用这些自定义指标数据在Amazon Quicksight仪表板上显示；有人知道我如何做到这一点吗？

浏览 25提问于2020-03-16得票数 2

1回答

S3中拼图文件的最佳最大大小

、

我正在尝试计算出在S3上分区拼图数据时的最佳文件大小。亚马逊网络服务推荐avoiding having files less than 128MB。但是，是否也有推荐的最大文件大小？但是，S3没有任何块大小的概念。有什么想法吗？

浏览 23提问于2019-03-07得票数 3

1回答

如果新分区不存在，如何修改CTAS查询以将查询结果追加到表中？-雅典娜

、、、、

我有一个要每天执行的查询，该查询将按执行日期进行分区。此查询的结果应追加到同一个表中。理想情况下，我的想法是使用类似于CREATE TABLE IF NOT EXISTS命令的方法，在分区不存在的情况下每天通过新分区将数据添加到现有表中，但是我不知道如何将其集成到查询中。= ARRAY['date_executed'])SELECT {columns_that_I_am_selecting_here_including_'date_executed'} 这样

浏览 18提问于2021-07-29得票数 0

回答已采纳

1回答

java.lang.BootstrapMethodError:从雅典娜java类调用站点初始化异常

、、、、

这是我的.java类public class athenaCodeFactory { System.out.println("Athena outputjava.lang.BootstrapMethodErr

浏览 4提问于2019-12-10得票数 5

回答已采纳

1回答

在混合数据S3存储桶上使用雅典娜搜索

、、、

问题是:有谁知道如何使用雅典娜在不仅包含JSON的S3存储桶上查询JSON数据？我要做的雅典娜搜索是在一个试图投影files-that-is-JSON的一些简单属性的表上进行的。表是这样创建的(更多的属性，但它们都是相同的结构)，请注意末尾的声明，它是通过文档说明应该如何忽略非json数据： CREATE EXTERNAL TABLE IF NOT EXISTS mytable这类查询的一个示例是： SELECT *

浏览 21提问于2021-07-10得票数 0

1回答

在Spark中倾斜

、

我有一个数据集，我想按特定的键(clientID)进行分区，但是一些客户端产生的数据比其他客户端要多得多。在Hive中有一个由"<code>C1</code>“调用的称为"<code>C0</code>”的功能，专门用来处理这种情况。有没有等同的Spark功能？或者，Spark有没有一些其他的特性可以复制这种行为？ (作为我的实际用例的</

浏览 16提问于2019-03-28得票数 1

1回答

如何在boto3中使用雅典娜中的预准备语句？

、、

我正在尝试使用boto3在雅典娜引擎版本2中添加的预准备语句。我看到用于CreatePreparedStatement的api文档，但没有用于执行预准备语句https://docs.aws.amazon.com/athena/latest/APIReference/API_CreatePreparedStatement.html https://docs.aws.amazon.com/athena&

浏览 17提问于2021-04-09得票数 0

1回答

AWS雅典娜创建外部表是否成功，即使AWS s3中没有文件？

、、、、

"quoteChar" = "'",) location 's3://bucket_name/athena-workspace/athena-input/'上面的查询

浏览 2提问于2020-06-10得票数 0

3回答

没有为jdbc找到合适的驱动程序:amazonaws

、、、

我正在尝试使用JDBC连接到amazon。由于我没有在maven上找到AthenaDriver存储库，所以我自己在上创建了它。基本上我要做的是：<repository> <name>maven repository</name> <url>httpsraphael-psr/maven-repository/raw/master/</ur

浏览 0提问于2018-03-15得票数 1

1回答

如何将RabbitMQ消息以csv文件格式传输到亚马逊S3存储桶中，并使用雅典娜查询存储桶？

、、、、

我正在开发一个能够读取RabbitMQ消息并将其传输到亚马逊S3存储桶中的硬应用程序。 RabbitMQ消息应该以.csv文件格式存储在S3存储桶中。亚马逊S3存储桶应连接到AWS Athena以对其进行查询。有澄清的人能帮我吗？

浏览 13提问于2019-04-15得票数 0

2回答

Tableau未显示分区字段(雅典娜连接)

、

我已经在Tableau中建立了Amazon Athena连接，可以看到除分区列之外的所有列(在本例中是date)。但是，我可以在Athena中看到表结构中的列。连接到同一个Athena DB的我的同事可以在他的Tableau中看到该列。有什么不同之处吗？

浏览 9提问于2018-07-20得票数 0

回答已采纳

1回答

AWS雅典娜:撤销AWS湖形成的所有权限后，选择允许的访问权限

、、、、

我使用AWSlake using来管理使用雅典娜所需的权限。对于其中一个用户，我撤销了他的所有权限，所以现在他看不到athena Catalog中的数据库和表，但当他直接从编辑器运行任何请求时，它仍然可以工作。他不是ldata ake的队形管理员，而且他有雅典娜的全部权限。

浏览 29提问于2021-02-12得票数 0

1回答

有没有办法在Amazon* Athena上查询select用户名？*

、、

我想使用DML查询会话用户名，例如： SELECT user(); 我用Presto读过这个current_user函数，但在雅典娜不起作用。我的目标是创建一个基于用户的where子句…类似于： SELECT * WHERE if(current_user=<some>, 'value', 'othervalue

浏览 14提问于2021-08-05得票数 0

1回答

从s3的雅典娜中的2个外部表更新雅典娜表

、、、、

我是雅典娜和s3的新手。我有一个s3存储桶，其中包含两个文件夹，两个文件夹中都有csv文件。我已经为雅典娜中的每个文件夹创建了2个外部表。你能告诉我获得所需产量的最好方法吗？我在雅典娜尝试过"create table from query“。但是，当我向s3上传更多文件时，该表保持不变，并且不会更新。

浏览 15提问于2021-03-17得票数 0

1回答

在Amazon* Athena中创建临时函数*

、

我在Amazon Athena上做了一些查询(据我所知，它使用的是Presto )。我想以类似于Presto的方式创建一个临时函数 CREATE TEMPORARY FUNCTION square(x int)RETURN x * x SELECT square我找到的唯一的tutorial对我来说并不是很容易理解。

浏览 21提问于2021-04-07得票数 0

回答已采纳

1回答

在S3上创建雅典娜，需要截断并重新加载s3存储桶中的底层数据

、、

我正在尝试为我的用户设置athena查询，但我们需要刷新底层数据。不确定我们是否可以从s3刷新数据，比如截断和重新加载，但不会对雅典娜用户造成停机。

浏览 20提问于2019-05-29得票数 0

点击加载更多