我想通过python脚本从PostgreSQL数据库中获取数据。在where条件下,我必须使用名为"lastrun“的局部变量的值。上次运行什么也不是,但我已经将程序上次执行的时间存储在一个文件中。读取该文件后,我将该值存储在一个名为"lastrun“的变量中,并希望在查询中使用它。conn ):
cur = conn
我有一个场景,通过where条件从同一个DataFrame中使用另一个列从DataFrame读取一列,这个值作为IN条件通过,从另一个DataFrame中选择相同的值,我如何在spark DataFrame中实现。在SQL中,它将类似于:
select distinct(A.date) from table A where A.key in (select B.key from table B where</