首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >从数据帧中的多个电子邮件地址中提取域名

从数据帧中的多个电子邮件地址中提取域名
EN

Stack Overflow用户
提问于 2019-06-20 08:04:58
回答 1查看 317关注 0票数 0

我正在尝试从以下数据框中提取多个域名:

代码语言:javascript
复制
    email
0   test1@gmail1.com; test1@gmail2.com
1   test3@gmail3.com; test4@gmail4.com
2   test5@gmail5.com

我可以使用以下代码拆分并提取第一个电子邮件地址:

代码语言:javascript
复制
orig = []
mylist = []
for i in df['email']:
    orig.append(i)
    i = i[ i.find("@") : ]
    i = i.split(";")
    i = ';'.join(i)
    mylist.append(i)

将列表附加到数据帧后,我会得到以下结果:

代码语言:javascript
复制
    origemail                           newemail
0   test1@gmail1.com; test1@gmail2.com  @gmail1.com; test1@gmail2.com
1   test3@gmail3.com; test4@gmail4.com  @gmail3.com; test4@gmail4.com
2   test5@gmail5.com  @gmail5.com

我想要的结果是:(这些电子邮件地址可能不限于两个,可能会更多。)

代码语言:javascript
复制
    origemail                           newemail
0   test1@gmail1.com; test1@gmail2.com  @gmail1.com; @gmail2.com
1   test3@gmail3.com; test4@gmail4.com  @gmail3.com; @gmail4.com
2   test5@gmail5.com                    @gmail5.com

有没有人能给我指出正确的方向,以达到预期的效果?提前谢谢。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-06-20 08:18:47

像这样的东西应该是有效的:

代码语言:javascript
复制
orig = []
mylist = []
for i in df['email']:
    orig.append(i)
    emails = i.strip().split(';')
    domains = [x[x.find('@'):] for x in emails]
    if len(domains) == 1:
        domain_string = domains
    else:
        domain_string = '; '.join(domains)
    mylist.append(domain_string)

它(1)遍历所有电子邮件,(2)首先将它们附加到orig,(3)找到域,然后(4)连接它们并将它们附加到mylist

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/56677381

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档