我有一个数据流作业,它从bigquery表(在大表之上创建)读取。数据流作业是使用java中的自定义模板创建的。我需要处理bigquery的大约5亿条记录。我面临的问题甚至是读取100万条记录,大查询读取需要26分钟,数据流工作需要36分钟。在大查询中读取太慢。
任何关于如何提高阅读性能的建议。
发布于 2022-12-03 10:20:45
您可以尝试提高BigQuery作业的读取性能:
WHERE
子句过滤掉不相关的数据,使用GROUP BY
或ORDER BY
来减少需要处理的数据量。总之,优化查询和数据存储以提高BigQuery作业的读取性能是很重要的。
https://stackoverflow.com/questions/74658971
复制相似问题