我计划使用vertica的大容量复制选项来复制csv文件以创建表。我在vertica上创建了一个空表
dbSendQuery(vertica, "COPY hpcom_usr.VM_test FROM LOCAL \'/opt/mount1'/opt/mount1/musoumit/MarketBasketAnalysis/Code/test.csv‘
我注意到在执行计划的一个步骤中有相当大的内存分配,这是非常令人困惑的。
有没有什么想法,为什么会发生这样的事情?查询是直接的select *,row_number() over(partition by column1) from table where sort_key=value。rrs过滤后的数据集为1000行。然后应用排序。