首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何从Dataframe列的逗号分隔字符串中提取数据库名和表名到两列

从Dataframe列的逗号分隔字符串中提取数据库名和表名到两列的方法如下:

  1. 首先,使用pandas库加载数据并创建一个Dataframe对象。
代码语言:txt
复制
import pandas as pd

# 创建Dataframe对象
df = pd.DataFrame({'column_name': ['database1.table1, database2.table2, database3.table3']})
  1. 接下来,使用apply方法和lambda函数来处理每个字符串,并将提取的数据库名和表名存储到新的列中。
代码语言:txt
复制
# 定义函数来提取数据库名和表名
def extract_names(row):
    names = row.split(',')  # 使用逗号分隔字符串
    db_names = []
    table_names = []
    for name in names:
        name_parts = name.strip().split('.')  # 使用点号分隔数据库名和表名
        if len(name_parts) == 2:
            db_names.append(name_parts[0])
            table_names.append(name_parts[1])
        else:
            db_names.append('')
            table_names.append('')
    return pd.Series({'database_name': ','.join(db_names), 'table_name': ','.join(table_names)})

# 应用函数到Dataframe的列中
df[['database_name', 'table_name']] = df['column_name'].apply(lambda x: extract_names(x))
  1. 最后,可以查看提取结果。
代码语言:txt
复制
print(df)

输出结果:

代码语言:txt
复制
                                     column_name  database_name        table_name
0  database1.table1, database2.table2, database3.table3  database1,database2,database3  table1,table2,table3

这样,我们成功从Dataframe列的逗号分隔字符串中提取了数据库名和表名,并将它们存储到了两个新的列中。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

没有搜到相关的合辑

领券