数据湖计算 DLC

权限类常见问题

为什么要同时开通 CAM 权限和 DLC 权限?

为什么我开通了子账号,还是使用不了数据探索(数据作业)?

引擎类常见问题

共享引擎和独享引擎的区别是什么?

一个集群,支持多少任务并行?可以调整吗?

集群挂起和启动,这个时间有多长?

为什么任务实际使用 CU 核数会小于引擎的集群规模中指定的 CU 核数?

DLC 集群是否可以访问同地域的其他 VPC 下的 IP/服务?是否可以访问外网?

如何修改集群的自动启停时间?

若在任务运行中进行集群变配,是否会导致任务失败?

功能类常见问题

外表和原生表的区别是什么?

数据湖计算 DLC 支持数据调度吗?

数据湖计算 DLC 是否支持自助上传 jar 包,自定义 spark 函数?

元数据加速桶支持 CDN 吗?

元数据加速桶与普通 COS 桶的区别是什么?

数据存储需要绑定引擎权限吗?

一个 COS 的 bucket 可以绑定多个 DLC 数据引擎么?

Spark 作业类常见问题

PySpark 任务数据倾斜导致 python+jvm 内存占用超过 K8s request 内出现 OOMkilled?

Insert into/overwrite 后如何自动添加 repartition 命令对数据做分区以减少小文件数量?

PySpark 任务高并发写 COS 存储桶时返回503错误?

常用数据治理 SQL 有哪些?

如何查看 SQL 执行计划和 SQL 执行的日志?

CAST 未自动转换精度导致数据写入失败?

QUERY_PROGRESS_UPDATE_ERROR(code=3060): Failed to update statement progress 错误