--请注意,这不是 这个职位 的重复,因为我想压缩超过2个列表(或者至少我不能简单地泛化该帖子,以便在这里使用而不需要显式循环)
我希望找到以某种方式合并列表的最佳实现(就速度而言)。输入是一个列表(或多个元组),排序使下一个列表的长度总是上一个列表的倍数。例如:
a = ['A', 'B', 'C', 'D']
b = ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H']
input_list = [a, b]输出是以下内容的合并列表:
output = ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D', 'A', 'E', 'B', 'F', 'C', 'G', 'D', 'H']也就是说,较短的列表(在本例中为a)都是通过循环自身来扩展为最长的列表(在本例中为b),这样列表将具有相同的长度。然后,所有列表都以垂直叠加的方式合并。
目前,我有一个实现,主要做以下工作:
step 1 step 2 step 3
====== ======== ======
ABCD ABCDABCD
ABCDEFGH -------> ABCDEFGH ------> AABBCCDDAEBFCGDH它起作用,但没有效率:
def flatten_list(value):
return sum(value, [])
def group(value):
for idx in reversed(range(1, len(value))):
multiplier = int(len(value[idx]) / len(value[idx - 1]))
if multiplier > 1:
value[idx - 1] = flatten_list([value[idx - 1] for i in range(multiplier)])
return flatten_list(list(zip(*value)))是否有更快的实现?性能对于我的应用程序来说是至关重要的,因为输入可能是巨大的。如有任何建议,敬请谅解!
发布于 2018-01-19 17:50:41
使用迭代工具配方
两个输入
import itertools as it
a = list("ABCD")
b = list("ABCDEFGH")
list(it.chain.from_iterable(roundrobin(zip(it.cycle(a), b))))
# ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D', 'A', 'E', 'B', 'F', 'C', 'G', 'D', 'H']itertools.cycle()无限扩展了较短的可迭代性。zip()在较短的可迭代性之后停止迭代。roundrobin处理可迭代性之间的元素交织。
较长的输入
要处理两个以上的输入,我们需要循环除最后一个可迭代之外的所有输入:
def interleave(*inputs):
*rest, last = inputs
cycles = (it.cycle(x) for x in rest)
return list(it.chain.from_iterable(mit.roundrobin(zip(*cycles, last))))现在,对于两个或多个输入迭代,我们可以应用interleave函数:
p = list("ab")
q = list("abcd")
r = list("abcdef")
input_list_1 = [a, b]
input_list_2 = [p, q, r]
print(interleave(*input_list_1))
# ['A', 'A', 'B', 'B', 'C', 'C', 'D', 'D', 'A', 'E', 'B', 'F', 'C', 'G', 'D', 'H']
print(interleave(*input_list_2))
# ['a', 'a', 'a', 'b', 'b', 'b', 'a', 'c', 'c', 'b', 'd', 'd', 'a', 'a', 'e', 'b', 'b', 'f']注意:您可以从roundrobin重新实现医生们配方,也可以安装第三方库为您实现它,例如more_itertools。> pip install more_itertools,然后是Python,from more_itertools import roundrobin。
https://stackoverflow.com/questions/48346169
复制相似问题