问将2维numpy数组转换为无重复列表的有效方法
EN

Stack Overflow用户

提问于 2019-02-22 02:55:07

回答 1查看 82关注 0票数 0

我想从pandas dataframe的两个不同列中提取值，将它们放入一个没有重复值的列表中。

我尝试过以下几种方法：

arr = df[['column1', 'column2']].values
thelist= []
    for ix, iy in np.ndindex(arr.shape):
        if arr[ix, iy] not in thelist:
            thelist.append(edges[ix, iy])

这行得通，但时间太长了。数据帧包含大约3000万行。

示例：

  column1 column2 
1   adr1   adr2   
2   adr1   adr2   
3   adr3   adr4   
4   adr4   adr5

应使用以下值生成列表：

[adr1, adr2, adr3, adr4, adr5]

考虑到数据帧包含3000万行，您能帮我找到一种更有效的方法吗？

python

pandas

numpy-ndarray

回答 1

Stack Overflow用户

发布于 2019-02-22 02:59:00

@ALollz给出了正确的答案。我将从那里扩展。要像预期那样转换为列表，只需使用list(np.unique(df.values))

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/54814286

复制

相似问题

问将2维numpy数组转换为无重复列表的有效方法
EN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将2维numpy数组转换为无重复列表的有效方法EN

回答 1

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问将2维numpy数组转换为无重复列表的有效方法
EN