从应用于数据帧的每一行的函数创建新DataFrame的最佳选项是什么。最终目标是将所有产生的new_dataframes串接(重新绑定)。
输入:
Name Age
0 tom 10
1 nick 15
2 juli 14
示例:
import pandas as pd
import pdb
data = [['tom', 10], ['nick', 15], ['juli', 14]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
在下面创建的示例数据帧中: Name Age
0 tom 10
1 nick 15
2 juli 14 我想添加另一个列'Checks‘,如果列表检查包含的值为check=['nick'],则将其中的值设为0或1 我已经尝试了下面的代码: import numpy as np
import pandas as pd
# initialize list of lists
data = [['tom', 10], ['nick', 15], ['juli', 14]]
check = [&
我有这个数据集
age salary gender
44 3000 M
32 4555 F
45 6000 M
50 4200 F
43 5000 F
23 1700 M
我想循环每一列并使用数字按性别获得年龄/薪资组的最大值/最小值,我这样做了:
import pandas as pd
import numby as np
data = pd.read_excel("file")
var = ["age","salary","gender"]
dat = data[var]
column_li