我正在尝试将SQLAlchemy表达式与dask的read_sql_table一起使用,以减少通过连接和过滤几个不同的表而创建的数据集。documentation表明这应该是可能的。我构建了我的连接字符串,创建了一个SQLAlchemy引擎和与我数据库中的一个表相对应的表。(我使用的是PostgreSQL。)import dask.dataframe as ddfrom sqlalch
我正在尝试使用我设置的dask集群来运行和并行化这个sqlalchemy查询,因为我没有足够的内存从本地计算机执行它。我的代码如下-我不确定这是否是实现这一目标的最佳方法: from dask.distributed import Clientfrom dask.delayed"""SELECT * FROM table WHERE date = '%s'""&
在尝试以分布式方式运行sqlalchemy查询时,我有一个如下所示的dask表达式。但是,它引用了在connect_args参数中输入的.pem密钥文件。如何将此密钥文件上载到dask群集/工作器,以便它允许我运行此sqlalchemy查询?return pd.read_sql(q, conn)
delayed(execute_query)(q) for q in qu