假设我们有一个具有大约5行的列id的pandas数据帧df。在下面的代码中,为什么我仍然得到过滤后数据帧的长度为5:
import pickle
import gzip
import bz2
import pandas as pd
import os
import _pickle as cPickle
import bz2
from downcast import reduce
def load(filename):
"""
Load from filename using pickle
@param filename: na
这里的想法是,对于每一年,我能够创建三个数据帧(df1、df2、df3),每个数据帧包含不同的公司和股票价格(‘公司’和‘价格’是df1~df3中的两列)。我想每年使用另一个数据帧(下面命名为“store”)来存储这三个数据帧。
下面是我的代码:
store = pd.DataFrame(list(range(1967,2014)), columns=['year'])
for year in range(1967,2014):
....some codes that allow me to generate df1, df2 and df3 correctly...
如何从具有共同列值的两个数据帧中获得合并的数据帧,使得只有那些行使得合并的数据帧在特定的列中具有共同的值。
我有5000行df1格式:
director_name actor_1_name actor_2_name actor_3_name movie_title
0 James Cameron CCH Pounder Joel David Moore Wes Studi Avatar
1 Gore Verbinski Johnny Depp Orlando Bloom Jack Davenport Pirates
o