腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
具有
complext
列
类型
的
Athena
(
Presto
)
视图
、
、
我正在尝试创建一个由CloudFormation管理
的
雅典娜
视图
。此
视图
包含嵌套记录列表属性。直接在
Athena
中运行SELECT可以很好地工作: item_id AS material_id, Name: "item_master" <
浏览 13
提问于2020-05-23
得票数 0
2
回答
ORC格式扫描每个查询中
的
所有表
、
、
、
我在雅典娜创造了我
的
第一张兽人桌子。作为一个列表,它不会只搜索hexId
列
,而不扫描整个表吗?谢谢! pd:对不起,我
的
英语!
浏览 1
提问于2018-03-23
得票数 0
1
回答
亚马逊雅典娜
视图
实际上是蜂巢
视图
,还是单独
的
插件?
、
、
、
亚马逊雅典娜基于
Presto
。Amazon
Athena
支持
视图
。
Presto
不支持配置单元
视图
,因为它不想处理配置单元查询语言。由于
视图
实际上是一个配置单元查询,因此它必须理解配置单元
的
整个语言,而不仅仅是它
的
模式。
Presto
supports views通过其蜂窝连接器。这些
视图
是"
Presto
视图
“,是特定于
Presto
的
(不
浏览 20
提问于2019-05-25
得票数 4
回答已采纳
6
回答
以编程方式创建AWS雅典娜
视图
、
、
、
、
概述了如何使用用户界面创建
视图
。...._view' is stale; it must be re-created.View */"
presto
_view = "true" comment = "
Prest
浏览 0
提问于2019-05-24
得票数 24
回答已采纳
1
回答
Presto
:发布一个时区已更改为正确区域
的
表
、
、
、
我试图在
presto
中更改时间戳
的
时区,但是,当我将
列
的
类型
转换回时间戳时,时区校正被恢复。我需要将其转换为timestamp/bigint/string,以便能够在模式中存储数据,因为该模式不存储
列
类型
timestamp-timezone。/
Athena
?How do I convert a string which is actually a date with timezone to a timestamp in
浏览 148
提问于2020-01-15
得票数 0
回答已采纳
1
回答
在雅典娜查询中获取S3文件创建/更新日期
、
有没有内置
的
雅典娜函数可以在查询结果中显示给定行
的
底层S3文件创建/修改日期?我们有一个
具有
许多不同文件格式
的
大型数据湖,很难将这些信息添加到所有这些数据湖中。
浏览 3
提问于2021-07-07
得票数 0
1
回答
如何在
Athena
/
Presto
中限制数组
列
中
的
元素数和/或总大小?
、
、
我一直在查看雅典娜和PrestoDB文档,但找不到任何有关数组
列
中元素数量和/或最大总大小
的
限制。文件将是拼图格式,但如果拼图是限制因素,这是可以协商
的
。s3://bucket/key_one, 123.... s3://bucket/key_two, 321因为拼图是压缩
的
浏览 2
提问于2019-06-17
得票数 0
1
回答
无法查询Databricks运行时中
的
able /
Athena
视图
['java.lang.IllegalArgumentException:无法从空字符串创建路径;‘]
、
、
、
、
试图在Databricks集群上使用view读取在AWS雅典娜上创建
的
pyspark (基于指向S3
的
拼花文件
的
Glue表)将引发以下错误: java.lang.IllegalArgumentException在继续研究时,我发现了以下Databricks关于这个问题
的
原因
的
文章:
浏览 3
提问于2021-11-18
得票数 0
回答已采纳
1
回答
无法使用create_dynamic_frame.from_catalog从AWS glue作业访问使用分区投影配置
的
表中
的
数据
、
、
我还没有在glue元数据目录中定义任何分区,我可以使用SQL在
Athena
OK中查看数据。glueContext.create_dynamic_frame.from_catalog( print (data.count()) # returns 0 :( 有没有办法在不定义粘合元数据分区
的
情况下访问数据我
的
印象是,如果雅典娜可以看到数据,胶水也可以。
浏览 30
提问于2021-07-16
得票数 1
回答已采纳
2
回答
在AWS
Athena
中访问复杂
类型
、
、
、
我有一些嵌套
的
数组/结构值(复杂
类型
),我在通过查询访问时遇到了问题。该单元格
具有
以下值:
浏览 66
提问于2020-05-13
得票数 0
回答已采纳
2
回答
如何在AWS
Athena
外部表中获取作为
列
的
输入文件名
、
、
、
、
我在AWS
Athena
中创建了外部表来查询S3数据,但是,位置路径有1000+文件。因此,我需要将记录
的
相应文件名显示为表中
的
一
列
。select file_name , col1 from table where file_name = "test20170516" 简而言之,我需要知道AWS
Athena
Presto
中
的
INPUT__FILE__NAME(hive)等效项或任何其他实现相同功能
的
方法。
浏览 3
提问于2017-05-17
得票数 52
回答已采纳
1
回答
类似Hive
视图
的
AWS胶水
视图
在Hive中,我们都知道我们可以定义一个非物化
视图
。很简单。 我
的
问题是,是否可以在AWS胶水目录中创建类似的结构?我看到了物化
的
观点,但这不是我
的
意思。我认为这是不可能
的
,但我可能遗漏了一些东西。提前谢谢。
浏览 35
提问于2021-05-06
得票数 0
回答已采纳
1
回答
删除数据库(AWS雅典娜)中数据中
的
双引号?
、
、
、
、
在一个与
Presto
兼容
的
数据库(AWS
Athena
)中,我有一些行包含双引号中
的
值,与没有双引号
的
值混合在一起。 例如,
列
“邮政编码”可以有"00100"和00100。我可以发出什么SQL查询来删除找到
的
所有双引号,以便"00100"变成00100
浏览 6
提问于2020-12-15
得票数 0
回答已采纳
1
回答
使用Terraform创建雅典娜资源
、
、
、
我想通过Terraform创建一个雅典娜数据库,包括表和
视图
。我已经搜索了很多,找到了一些帖子,例如这里:Create AWS
Athena
view programmatically 我知道我可以使用Terraform provisioners执行AWS CLI命令来创建这些资源,例如:AWS
Athena
Create table view with SQL 但我不想这么做。如果我选择AWSDataCatalog (胶水)作为雅典娜中
的
数据源,那么我用Terraform创建雅典娜数据库还是胶水数据库都没有关系,对吗?
浏览 18
提问于2020-10-06
得票数 0
1
回答
使用大数据解决方案在双方唯一id匹配时替换S3文件中
的
内容
、
、
、
、
我正在尝试探索一个用例,比如“我们在文件中有大量数据(50B记录),每个文件有大约5000万条记录,每个记录都有一个唯一
的
标识符。文件10中
的
记录也可能出现在文件100中,但该记录
的
最新状态出现在文件100中。文件位于亚马逊网络服务
的
S3中。现在,假设50B记录中
的
大约1B记录需要重新处理,一旦重新处理完成,我们需要识别曾经
具有
这些1B记录
的
所有文件,并将这些文件
的
内容替换为这些1B唯一ids。我们已经启动了一个任务,用于维护文件到唯一is
的<
浏览 2
提问于2017-09-05
得票数 0
1
回答
更新存储在亚马逊网络服务S3中
的
数据
的
模式/数据
的
策略
、
、
、
在我
的
组织中,我们使用亚马逊网络服务S3、和
的
堆栈来推动一些内部指标的报告。通常,这个堆栈非常适合用于报告原始数据(存储在S3中)
的
快速设置。我们遇到
的
问题是,如果我们发现需要以某种方式更新已经存储在S3中
的
数据,该怎么办。例如,我们希望更新
具有
特定字符串
的
列
中
的
值,以更新该值。 与数据库不同,我们不能只运行一个查询来更新所有现有数据。我试着看看我们是否可以利用来实现这一点,但从我有限
的
理解来看,它似乎并不意味着要从
浏览 0
提问于2020-07-17
得票数 1
1
回答
如何让雅典娜/普雷斯托识别拼花指数?
、
、
、
、
我有一个25k
的
“行”拼花文件(总计469.5kb),其中每个项目都有一个唯一
的
整数id。知道了这一点,我在本专栏上添加了一个索引,但没有显示索引该
列
在使用
Athena
(AWS服务)/
Presto
(基础引擎)时实际上会影响性能。我正在尝试一个简单
的
选择,从哪里我要拉一个行,它是id-FROM widgets wid
列
是索引
的
,所以一旦
Presto
找到匹配项,就不应该再
浏览 0
提问于2018-09-24
得票数 2
回答已采纳
1
回答
计算不同
列
最大值
的
问题
、
在
Athena
中,我有一个名为"levels“
的
表,其中包含了名为"user”、“levels”和"levelcount“
的
列
。这张表是这样
的
:+------+---------------+--------------+ | user | levelstarted | startedcount | +------+-----0012 | 3 | +------+---------------+--------------+ 对于每个
浏览 0
提问于2019-07-05
得票数 0
回答已采纳
1
回答
在Hive/
Presto
中是否有一个伪
列
来获取给定文件
的
“最后一次修改”时间戳?
、
、
、
我在雅典娜有一个外部表,链接到S3中
的
一个文件夹。
Presto
中有一些伪
列
,它允许我获取有关该文件夹中
的
文件
的
元数据信息(例如,$path伪
列
)。我想知道是否有一个伪
列
,在这里我可以通过使用AWS
Athena
中
的
查询来获取S3中文件
的
最后修改时间戳。
浏览 15
提问于2019-06-25
得票数 3
1
回答
Presto
/AWS中
的
交叉应用函数
、
、
我正在尝试将标题为创建、批准、处理和实现
的
4个日期
列
转换为包含所有4个日期
的
单个
列
,以及包含每个日期状态
的
第二个
列
。最后
的
图像直观地显示了数据问题(抱歉,我仍在研究如何在堆栈溢出上附加文本形式
的
表)。为了解决这个问题,我在server中成功地执行了交叉应用函数(见下文),但现在我需要用
Athena
或
Presto
语言进行同样
的
操作。有人能指点我什么是AWS/
Presto
<e
浏览 3
提问于2020-07-01
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
对象存储
云直播
腾讯会议
活动推荐
运营活动
广告
关闭
领券