我有一个带有关键字列的数据。关键字列也有2-7个关键字,用逗号分隔。例如:
URL Keywords
www.example.com "Keyword 1 , Keyword 2 , Keyword 3"
www.example2.com "Keyword 2, Keyword 4, Keyword 5"
.
.
.我想要的输出,产生组合,但只有两个。我实际上需要"TO“和"FROM”的值来进行可视化。我期望以这种方式输出
URL Keyword Combination
www.example.com Keyword 1, Keyword 2
www.example.com Keyword 1, Keyword 3
www.example.com Keyword 2, Keyword 1
www.example.com Keyword 2, Keyword 3
.
.
.
.我认为使用ITERTOOLS是可能的,但我不知道如何实现。
发布于 2020-02-25 11:16:13
试试itertools.permutation,itertools.chain和df.explode (对于熊猫>= 0.25.0):
>>> lst = [[','.join(p) for p in permutations(val.split(','),2)] for val in df['Keywords']]
>>> df['Keywords'] = lst
>>> df.explode('Keywords')
URL Keywords
0 www.example.com Keyword 1 , Keyword 2
0 www.example.com Keyword 1 , Keyword 3
0 www.example.com Keyword 2 ,Keyword 1
0 www.example.com Keyword 2 , Keyword 3
0 www.example.com Keyword 3,Keyword 1
0 www.example.com Keyword 3, Keyword 2
1 www.example2.com Keyword 2, Keyword 4
1 www.example2.com Keyword 2, Keyword 5
1 www.example2.com Keyword 4,Keyword 2
1 www.example2.com Keyword 4, Keyword 5
1 www.example2.com Keyword 5,Keyword 2
1 www.example2.com Keyword 5, Keyword 4https://stackoverflow.com/questions/60393104
复制相似问题