我正在尝试从以下数据框中提取多个域名:
email
0 test1@gmail1.com; test1@gmail2.com
1 test3@gmail3.com; test4@gmail4.com
2 test5@gmail5.com
我可以使用以下代码拆分并提取第一个电子邮件地址:
orig = []
mylist = []
for i in df['email']:
orig.append(i)
i = i[ i.find("@") : ]
i = i.split(";")
i = ';'.join(i)
mylist.append(i)
将列表附加到数据帧后,我会得到以下结果:
origemail newemail
0 test1@gmail1.com; test1@gmail2.com @gmail1.com; test1@gmail2.com
1 test3@gmail3.com; test4@gmail4.com @gmail3.com; test4@gmail4.com
2 test5@gmail5.com @gmail5.com
我想要的结果是:(这些电子邮件地址可能不限于两个,可能会更多。)
origemail newemail
0 test1@gmail1.com; test1@gmail2.com @gmail1.com; @gmail2.com
1 test3@gmail3.com; test4@gmail4.com @gmail3.com; @gmail4.com
2 test5@gmail5.com @gmail5.com
有没有人能给我指出正确的方向,以达到预期的效果?提前谢谢。
https://stackoverflow.com/questions/56677381
复制相似问题