我有一个这样的DataFrame: `id` `text`2 Hello people I am fine4 Good Evening 我想把每个单词写成不同的列。它们将只包含两个值1或0 (1表示该单词出现在文本中,0表示不存在) 预期输出: `id` `text` Hello world how are you people I am fine Good Morning Evening
1 Hello world how ar
试着跑这样我就可以计算jaccard索引了,但是由于数据大小,它会出现内存错误,因为series.str.get_dummies()使用Int64作为dtype,并且没有办法更改它,至少我不知道如何更改,因为str.get_dummies()没有dtype参数。所以我试着跑
u = pd.get_dummies(df, columns=[&q