我正在从SQL Server迁移到Postgres,但是我遇到了一个非常原始的问题,在googling搜索了一段时间之后,这个问题得到了解决,但是我不知道我做的是不是官方的方法!我在标签数组字段上有Gin索引,而且性能是很好的选择记录。我只有13万排左右。当我阅读更多关于PostgreSQL的内容时,我了解到它几乎是在更新每一行时重建我的表的。所以我做了两件事VACUUM FULL mytable;
在每个查询
在postgresql中工作时,我有一个笛卡尔连接,产生了大约400万行。连接大约需要5秒,写回数据库大约需要1分钟45秒。在python中需要使用这些数据,特别是在pandas dataframe中,因此我正在尝试在python中复制相同的数据。我应该在这里说,所有这些测试都在一台机器上运行,所以没有任何东西通过网络。使用psycopg2和pandas,读取数据并执行连接以获得400万行(这里的答案是:cartesian product in pandas),所需时间始终不到3秒,令人