我对Google平台非常陌生,我正在做一个POC,用于将一个蜂窝应用程序(表和作业)移动到Google。这些数据已经转移到了谷歌云存储系统。
是否有一种内置的方法来批量创建数据仓库中的所有表,而不是使用蜂箱提示符逐个创建表?
发布于 2021-01-13 01:02:41
Dataproc支持Hive作业类型,因此可以使用gcloud命令:
gcloud dataproc jobs submit hive --cluster=CLUSTER \
-e 'create table t1 (id int, name string); create table t2 ...;'
或
gcloud dataproc jobs submit hive --cluster=CLUSTER -f create_tables.hql
还可以将SSH放入主节点,然后使用直线执行脚本:
beeline -u jdbc:hive2://localhost:10000 -f create_tables.hql
https://stackoverflow.com/questions/65682271
复制相似问题