我遇到了需要numpy.digitize数组的情况。比如说,代码是
my_bin_list = [3, 6, 9]
my_array = np.array([1,2,3,4,5,6,7,8,9])
digitized = numpy.digitize(my_array, my_bins)这个很好用。但是,问题是我没有一个像示例中那样的回收箱列表,而是my_array中每个元素的一个bin列表(因为每个元素都属于一个不同的数据集,它有自己的回收箱),因此len(my_array) == len(list_of_my_bin_lists)。这是list_of_my_bin_lists = [my_bin_list1, my_bin_list2, ...]。所以我需要告诉数字化,对于第一个数组元素,它应该检查这个元素属于哪个list_of_my_bin_lists[0]的bin,对于带有list_of_my_bin_lists[1]的第二个元素,等等。这有可能吗?我可以想象一下
list_of_my_bin_lists = [[2, 6, 9], [4, 6, 8], [3, 5, 9]]
my_array = np.array([1, 3, 7])
digitized = numpy.digitize(my_array[i], my_bins[i] for i in len(my_array))它必须返回数字化: 0,0,2
发布于 2014-02-12 22:50:49
你可以通过一个清单理解来做这件事,这与你想象的很接近:
import numpy as np
list_of_my_bin_lists = [[2, 6, 9], [4, 6, 8], [3, 5, 9]]
my_array = np.array([1, 3, 7])
digitized = [np.digitize(np.array([item]), bin_list)[0]
for item, bin_list
in zip(my_array, list_of_my_bin_lists)]结果:digitized == [0, 0, 2]
假设您希望digitized成为list of ints,这是可行的。如果您希望它是一个np.array或其他东西,那么将它重铸到您需要的任何东西都应该是简单明了的。
https://stackoverflow.com/questions/21741378
复制相似问题