我有以下数据:
ID Company Name State
200 Apple CA
300 Microsoft CA
300 Grant Thornton IL
200 Amazon WA
200 Apple CA
250 Dollar Tree VA
250 Dollar Tree VA
250 Dollar Tree VA
400 Target
我有一个数据框架,其中包括项目类别、货币、投资者数量、目标等,我想创建一个新列,它将是“他们类别的平均成功率”:
state category main_category currency backers country \
0 0 Poetry Publishing GBP 0 GB
1 0 Narrative Film Film & Video USD 15 US
2 0 Narrative Film Film & Vid
我有这样的数据:
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
呼叫
In [10]: print df.groupby("A")["B"].sum()
会回来
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
现在,我想对&
我有一个熊猫系列,我想用三种不同的方式组合。该系列内容如下:
import pandas as pd
timestamps = [1,1,1,2,3,3,3,4]
quantities = [10,0,2,6,7,2,8,0]
series = pd.Series(quantities, index=timestamps)
显然,时间戳有3 values of 1、1 value of 2、3 values of 3和1 value of 1。我想生成以下系列:
1.重复索引值之和:
pd.Series([12,6,17,0], index=[1,2,3,4])
2.重复索引值的中位数:
pd
我有两个多索引系列
系列1
Company Name Product Price TransactionID
Company A Apple 10 T0001
Company B Grapes 20 T0002
Orange 30 T0003
系列2
Company Name Product Price TransactionID
Company A Orange
当我导入一个csv文件时,该文件只包含一个由州和城市组成的列,例如:
ALABAMA
NaN
Birmingham
Montgomery
Huntsville
NaN
CALIFORNIA
NaN
Los Angeles
San Diego
Fresno
NaN
我的问题是,如何将其转换为两个分层列,使其看起来更像以下内容:
ALABAMA Birmingham
Montgomery
Huntsville
CALIFORNIA Los Angeles
San Diego
Fresno
我尝试创建一个e
我有一个潘达斯系列,其中包含一个索引列和第二列,0。
Index列包含语言的几个缩写。这个索引列中的两个不同的值是"en“表示"English”,"en-gb“表示"British English”。本专栏中还有许多其他值,包括“西班牙语”的"es“,”法语“的"fr”等等。
所以这个系列看起来是这样的:
Index 0
en 42000
en-gb 500
es 320
und 143
fr 50
列0包含索引列中每个语言值出现在原始dataframe中的次数的
我有一个这样的数据帧:
Id Name site status
1995 sachin http://www.abcd.co closed
1996 sachin http://www.abcd.co working
1997 sourav http://www.abcd.co closed
1998 sourav http://www.abcd.co working
我想找出对于给定的名称,哪些列可能会有所不同。在本例中,对于每个名称,站点都是相同的(它始终是http://www.abc