Dataframe A有一个ID和名字的列表。Dataframe有一个名称组合列表和一个相似性评分。我希望,基于多个索引,从Dataframe中获取值,并检查DataFrame B中是否存在这种组合。如果是,我想给我的Multindex数据提供相似的分数,否则只有0。0.92 Peter Pete 0.8
3 Pete
我想要将这个函数应用到中。为此,我在我创建的dataframe上调用"foreachPartition(inside)“方法。"inside“函数需要dataframe值。dataframe如下所示:DataFrame[lon: double, lat: double, t: bigint]def inside(iterator0:20000,:] #take sample of rows from big dataset
我有一个多索引dataframe列,我已经从雅虎金融检索,并希望将它转换为一个单一索引列表。而不是让每个符号(间谍,AMZN)对应属性(高,低,关闭),我需要有一个额外的列的符号名称。下面是雅虎金融在该数据上填充的多索引数据。
from pandas_datareader import data import numpy as np
tickersstart