我能写基本的sql,并知道概念‘笛卡尔产品’。但在某种程度上,我对on in join感到困惑。sqlserver中的示例:--+--2 | 3
select * from ta left join tb on ta.A = 2 --??!顺便说一下,我知道ta.ColA=tb.ColB上最常见的用法,但在这个问题中,我只想知道在上是如何工作的。
我有100个文件要合并,每个文件有1亿行,索引作为键。每个行的列数只有2列,我尝试过使用pandas将它们合并在一起,但似乎连接或合并超过1,000万行的dataframe非常慢。是否有其他有效的方法将数据组合在一起?内存不是问题,我使用256 issue内存服务器。[pd.read_csv(filename, index_col=index_col) for filename in filenam