我试图在Quicksight中创建一个非常简单的可视化,为此,我在Quicksight中使用了一个SQL查询,
SELECT COUNT(distinct uuid), day
FROM analytics.myTable
GROUP BY day
不幸的是,每当我在Quicksight中运行此查询时,它都会因为以下错误而失败
来自AWS雅典娜的客户。SYNTAX_ERROR:第2:8行:无法解析列“_col0”
当我查看雅典娜时,我可以看到Quicksight正在“嵌套”SQL查询.这就是雅典娜出错的原因,
/* QuickSight 4da449cf-ffc6-11e8-92ea-
我在sql方面很新,我正在尝试一个简单的查询。
select
*,
max(cast(version_date as date)) over (partition by id) mx_dt,
min(cast(version_date as date)) over (partition by id) min_dt
from "raw_data"."raw_brands";
但是我发现了一个错误:
从AWS雅典娜客户端抛出一个错误。INVALID_CAST_ARGUMENT:值到目前为止无法转换: 2020-
1st err while querying[][1] ? select * from table where properties 'year' = 2007 // is not working
//please check the screen shot of the table 我想通过sql查询来查询雅典娜数据集。我尝试了所有查询,但都不能处理这个雅典娜数据
我已经连接了Glue目录到雅典娜和一个EMR实例(预置)。我试着在这两种情况下运行相同的查询,但得到的结果不同。EMR为0行,雅典娜为43行。使用left join、group by和count distinct查询非常简单。该查询如下所示:
select
t1.customer_id as id,
t2.purchase_date as purchase_date,
count(distinct t1.purchase_id) as item_count
from
table1 t1
left join
table2 as t2
on t2.purchase_id=
希望有人能帮我。我正在尝试转换一行SQL来使用Presto。目前,在SQL中,我执行以下操作以获得在接下来的0-5天内到期的所有记录:
((EventStartDate)between getdate()-1 and dateadd(day, 5, getdate()))
我以为普雷斯托会是这样的
EventStartDate between current_date and interval '5' day
但是,在AWS雅典娜中获取以下错误:无法检查日期是否介于日期和间隔日期之间
谢谢,
标记
我在EMR5.19.0中运行Presto 0.212,因为AWS雅典娜不支持Presto支持的用户定义函数。我使用的是配置为使用胶水模式的EMR。我已经在S3中以正确的分区格式存在已存在的Parquet文件。
最近的Presto版本似乎取消了创建和查看分区的能力。这就引出了一个问题:如何添加单独的分区?我可以在AWS中使用雅典娜控制台并运行MSCK REPAIR mytable;,从而正确地创建分区,然后我可以使用Presto或HUE成功地查询分区。但是,我如何在Presto中做到这一点呢?
如果我在EMR主节点上的presto-cli中尝试这样做的话:
use hive.default;
I
基于的非常基本的地理空间连接每次都会超时。
表polygons包含340K个多边形,而points包含具有纬度/经度对(和ID)的5K行。这两个文件在S3中都是单独的.csv文件。
查询:
SELECT poly.geometry, p.id
FROM polygons as poly
CROSS JOIN points as p
WHERE ST_CONTAINS (ST_POLYGON(poly.geometry), ST_POINT(p.lon, p.lat));
上面的SQL查询永远不会在默认的30分钟Athena查询时间限制内完成。
我发现大型数据集上的普通雅典娜查询性能相当高,但我
我有一个MySQL数据库,它的耗电量超过20年。我想询问每个月的平均耗电量,从一个月开始。
例如,在这个数据库中,
date power_consumption
2014/03/30 30
2014/04/30 40
2014/05/30 50
2014/06/30 20
The result would be, from 2014/04
month average_so_far_from_april_2014
2014/04 40.0
2014/05 45.0
2014/06 36.667
如果我不能在一个查询中实现这一点,那么我
我想在AWS雅典娜中使用Presto语法连接两个包含多个列的大型表。我的代码非常简单:
select
*
from TableA as A
left join TableB as B
on A.key_id = B.key_id
;
加入后,主键列(key_id)重复两次。这两个表都有100多个列,连接时间很长。如何解决key_id列不会在最终结果中重复两次的问题?
AWS雅典娜不支持except命令,不像Google BigQuery。
雅典娜中的MD5哈希函数对字符串无效。然而,雅典娜的文档显示确实如此:
不确定我在这里遗漏了什么。如果我将varchar转换为varbinary,那么生成的散列是不正确的。
获取此错误:
SYNTAX_ERROR: line 1:8: Unexpected parameters (varchar(15)) for function md5. Expected: md5(varbinary)
This query ran against the "temp" database, unless qualified by the query. Please post the err
有一个数据格式为20 GB的表,简单的查询只需扫描1GB的数据即可得到结果。select columns from table1 where id in (id1, id2, idn)
如果使用子查询(如- select columns from table1 where id in (select id from table2 limit n) )执行相同的查询,则该查询将通过扫描20 10提供结果,整个table.Even n为10、50或5000的非常小的数字。
左加入也是如此。
SELECT table1.* FROM
table2 LEFT JOIN table1
ON table2