我的熊猫df:
first second third fourth fifth
0 x y 12 2 0
1 a b 1 1 1
2 c d 2 12 0
为了检查列数据类型,我使用:
df.info()
这是结果:
<class 'pandas.core.frame.DataFrame'>
first 380 non-null object
second 380 n
非常简单的查询,但在谷歌上没有找到答案。 date列中包含时间戳的df Date
22/11/2019 22:30:10 etc. say which is of the form object on doing df.dtype() 代码: df['Date']=pd.to_datetime(df['Date']).dt.date 现在,我希望使用列号而不是列名将日期转换为日期时间。本例中的列号将为0(我有非常大的列名和类似的多文件,所以我想使用它的位置'0‘将date列更改为datetime )。 有人能帮上忙吗?
合并两个不同列上的两个数据帧,并重命名其他两个列。
df1
Male height
Alex 156
Philip 178
df2
Female height
Alex 144
Janice 150
我想要这样的数据帧
df3
Person M_Height F_Height
Alex 156 144
Philip 178 0
Janice 0 150
我该如何实现这一点?如果我说“向右”和“向左”,Merge会分别给我两列。
我有两个不同行数和列数的电子表格。
我想做的是将两者进行比较,并从a1.xlsx中提取与a2.xlsx的列名匹配的A和B的值,然后将这些值复制到a2.xlsx中的C和D列。我知道如何在excel中使用Index-Match来做到这一点,但不是使用Python的Pandas。
电子表格1 (a1.xlsx)
Index A B C
0 s 0.2 new york
1 d 1 vienna
2 g 2 london
3 c 3 tokyo
4 r 2 paris
5 d 1 berlin
6 a 8 ma
如何从具有共同列值的两个数据帧中获得合并的数据帧,使得只有那些行使得合并的数据帧在特定的列中具有共同的值。
我有5000行df1格式:
director_name actor_1_name actor_2_name actor_3_name movie_title
0 James Cameron CCH Pounder Joel David Moore Wes Studi Avatar
1 Gore Verbinski Johnny Depp Orlando Bloom Jack Davenport Pirates
o
我有2个数据帧df1和df2,它们的列名相同,但列号不同。如何在不创建额外的列/行的情况下合并为df3。 df1
a b c
1 3 6
df2
b c a
5 6 1
expected df3
a b c
1 3 6
1 5 6 尝试了下面的代码,但不起作用 df3=merge(df1, df2, by = "col.names")
我想做的是一种交叉销售。
我有一个Pandas dataframe,它有两个列,一个列有收据号,另一个列有产品I:
receipt product
1 a
1 b
2 c
3 b
3 a
大多数收据都有许多产品。我需要找到的是收据中产品组合的数量。假设产品'a‘和'b’是最常见的组合(它们一起出现在大多数收据中),我如何找到这些信息?
我试过使用df.groupby(['receipt','product']).count(),但是这只带来了收据+产品组合的数量,而不是每个收
我有一个数据框架,其中有两列(语言、文章)作为列标题,另一个数据框架的列标题是language和count。
我想迭代第一个dataframe,如果第一个dataframe的language列中的值与第二个dataframe中language列的值匹配。我想将文章列的值插入到第二个dataframe中。
language articles
1 en 4200596
2 de 1571581
3 fr 1369891
4 nl 1405514
5 it 1020971
6 es 981124
lang