我们使用Trino (https://trino.io/)连接到HDFS。我发现information_schema表中的数据,例如:
select
*
from
information_schema.columns clz
where
clz.table_catalog = ‘hive’ and
clz.table_schema = ‘’ and
clz.table_name = ‘’并不总是和我跑步时得到的相匹配
show tables from [schema]
show columns in [schema].[table]等等,如果我运行hadoop命令(hadoop -ls .),那么显示表/显示列命令似乎总是与我看到的内容相匹配。若要显示hdfs文件夹的内容,请执行以下操作。
所以我想弄清楚:
谢谢。
发布于 2022-09-27 15:51:46
Trino中的information_schema表只公开来自每个数据源的底层架构数据。因此,这取决于所使用的数据源和连接器:
对于您的具体情况,如果某些外部系统也在对象存储和HMS中乱七八糟,则可能不匹配。具体来说,在HMS中也有一个元数据缓存,这可能会过时。
https://dba.stackexchange.com/questions/311608
复制相似问题