我有证券的主要原始数据,我需要在其中创建基于某些筛选标准的多个证券投资组合。我习惯于在C++中工作,不太清楚如何用Python语言实现下面的代码。
我尝试使用嵌套的for循环创建不同的数据帧:
i -用于循环从2007年到2017年的年份(原始数据中的yr列)
j -用于遍历从1到4的区域(原始数据中的列区域)
for i in range (2007, 2018):
for j in range (1,5):
dfij_filter = (df['yr'] == i) & (df['Region'] == j)
我的npy文件包含120951个数组,加载方式如下:
import numpy as np
arm = np.load('full_numpy_bitmap_arm.npy')
我还有一个数据帧df,它有120951行和6列。我想将"arm“变量中的每个数组附加到数据帧中的每一行,作为数据帧末尾的一个新列。例如,arm在第一行最后一列,arm1在第二行最后一列,等等。我不确定连接函数在这里是否有效,因为arm不是一个数据帧。我想知道是否有其他方法可以做到这一点?谢谢
我刚接触pandas,我正在尝试更新基于'Id'列的'Text‘列。
我的数据是这样的[(1,'One'), (0, 'Zero'), (4,'Four'), (3, 'Three')]我在数据中也有一些丢失的id,对于那些丢失的id,我必须将其留空
原始数据帧
Id A Text
0 0 NaN
1 1 NaN
2 2 NaN
3 3 NaN
4 4 NaN
最终数据帧
Id A Text
0 0 Zer
我在一个循环中从一个大的数据帧中创建了子数据帧,并且我一直在尝试在循环中的那些子数据帧上创建一个列:
Partidas=data2['Partida'].unique()
Partida2=[w.replace(' ','_') for w in Partidas]
for i, j in zip(Partidas,Partida2):
globals()['%s' % j]=data2.loc[data2['Partida']==i]
for k in globals().items()
[
假设我有这样的数据帧,并且favorite_food列中有大量的分类值(大约100个),其中包括NaN值:
Name | favorite_food
Anna | apple
Barbara | banana
Charlie | apple
Danie | nan
Emily | nan
............
我的目标是将分类值转换为数值,如下所示:
Name | favorite_food
Anna | 1
Barbara | 2
Charlie | 1
Danie | 0
Emily | 0
............
那么我应该如何修改这个代码df.favorite_f
我有两个数据帧,df1和df2。df1有两列'Name‘和'K’。df2有3列'A','B','C‘
列B的值与df1 'Name‘的值相同。但现在我需要添加列K。
所以我试着
for t in range(len(df1)):
whichvalue=t
a=df1.iloc[whichvalue,:]
Name=a['Name']
knownetf=df2['B'].value_counts()[Name]
etfs
我有两个数据帧: ID LIST_VALUES
1 [a,b,c]
2 [a,n,t]
3 [x]
4 [h,h]
VALUE MAPPING
a alpha
b bravo
c charlie
n november
h hotel
t tango
x xray 我需要向第一个数据帧添加一个新列,该列根据LIST_VALUES列表中的内容显示第二个数据帧中的值。如果某个值在LIST_VALUES中重复,则只在输出
我有一个字典和一个数据框架:
dic = {"A":1,"B":2,"C":3,"D":4}
key
0 A
1 C
2 D
3 B
4 A
5 C
6 C
如何使用字典填充数据帧,以生成新的数据帧,如下所示:
key value
0 A 1
1 C 3
2 D 4
3 B 2
4 A 1
5 C 3
6 C 3
我考虑过使用apply(lambda)函数,但没有成功。
谢谢!
我仍处于学习编程和Python的初级阶段,但我正在为如何最好地使用字典或是否应该使用字典而苦苦挣扎。目前,我希望有一个这样的“表”格式:
user attr loc
---- ---- ----
1 red,green here
2 blue there
3 yellow here, there
... ... ...
n black nowhere
对于我正在尝试做的事情,我希望能够调用'us
我有一个pandas数据帧,其中一列包含分类数据,我希望将其更改为数字 le=LabelEncoder()
for col in p3data.columns.values:
if p3data[col].dtypes=='object':
p3data[col]=le.fit_transform(p3data[col]) 当我在pandas dataframe中的一列上使用此代码时,它会更改值 非常低=4 低=1 Medium =2 高=0 非常高=3 然而,这是不符合顺序的,我如何手动更改它们以使其符合顺序(即 非常低=0 低=1 Medium =
我正在迭代一个数据帧,提取出特定的行,然后用一些其他元素丰富这些行。我有一个字典,它有以下定义映射:
testdir = {0: 'zero', 40: 'forty', 60: 'sixty', 80: 'eighty'}
当我从原始数据帧中提取出特定行时,如下所示
a b c x str
0 0 0 0 100.0 aaaa
我希望str单元格现在设置为c列的字符串值,它是0,因此
输出应为
a b c x str
0 0 0 0 100.0 zero
然