首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Pandas基于多个值创建新变量

Pandas基于多个值创建新变量
EN

Stack Overflow用户
提问于 2020-06-09 03:30:06
回答 2查看 64关注 0票数 0

我正在尝试为合并后的数据帧中的每一行创建一个新的连接变量。连接的名称将基于相对于表索引和父索引的表名。父索引充当表索引的映射。下面是我的表格:

代码语言:javascript
运行
复制
Table Index  ParentIndex  TableName
    0           -1        ingredient
    1            0        salt
    2            0        pepper
    3            1        butter
df0

FieldIndex    TableIndex    FieldName
    0              1         afield
    1              3         anotherfield
    2              2         afield
df1

我已经合并了TableIndex上的数据帧。所需的输出将如下所示:

代码语言:javascript
运行
复制
TableIndex   ParentIndex    FieldIndex    FieldName     ConcatNames
    1             0             0         afield        ingredient.salt.afield
    3             1             1         anotherfield  ingredient.salt.butter.anotherfield
    2             0             2         afield        ingredient.pepper.afield

正如您所看到的,ParentIndex在某种程度上是TableIndex的复合函数,直到它达到-1 (并且不必包含在最终输出中)。我不知道该怎么做。这可以使用像df.index.mappd.IntervalIndex这样的东西来实现吗?这也不是唯一的文件,每个文件的表名都不同。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-06-09 15:17:51

代码语言:javascript
运行
复制
df = pd.merge(df1, df0,on='TableIndex')
for index, row in df.iterrows():
    pidx = row.ParentIndex
    table_names = [row.TableName,row.FieldName]
    while pidx!=-1:
        p_row = df0[df0['TableIndex']==pidx]
        insert_name = p_row.TableName.iloc[0]
        table_names.insert(0, insert_name)
        pidx = p_row.ParentIndex.iloc[0]
    df.at[index, "ConcatName"] = ".".join(table_names)
print(df[['TableIndex','ParentIndex','FieldIndex','FieldName','ConcatName']])
票数 1
EN

Stack Overflow用户

发布于 2020-06-09 04:09:48

我试着这样解决它...希望能对你有所帮助。

代码语言:javascript
运行
复制
df = pd.merge(df0, df1)
table_name = df0[df0["ParentIndex"] == -1]["TableName"][0]
for index, row in df.iterrows():
    table_names = df0[df0["ParentIndex"] == row["ParentIndex"]]["TableName"].to_list()
    str_table_names = ".".join(table_names)
    df.at[index, "ConcatName"] = table_name + "." + str_table_names + "." + row["FieldName"]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/62269839

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档