ll = [[3, 5, 10, 11], [1, 5, 10]]
n = len(ll)
m = max(len(l) for l in ll)

ids = [[], []]
values = []
for i, l in enumerate(ll):
    length = len(l)
    ids[0] += [i] * length  # rows
    ids[1] += list(range(length))  # cols
    values += l

t = torch.sparse_coo_tensor(ids, values, (n, m))

否则，您可以尝试使用文档语料库的嵌入技术，例如bag- of -words (尽管它仍然会生成一些“填充”)、tf-idf等。

内部列表中可能存在重复项的词袋

corpus = [[3, 5, 10, 11], [1, 5, 10]]
n = len(corpus)
m = max(max(inner) for inner in corpus)
t = torch.zeros(n, m)

for i, doc in enumerate(corpus):
    torch.bincount(corpus)

内部列表中具有不同值的词袋

corpus = [[3, 5, 10, 11], [1, 5, 10]]
n = len(corpus)
m = max(max(inner) for inner in corpus)

t = torch.zeros(n, m)
for i, doc in enumerate(corpus):
    t[i, doc] = 1

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/70067595

复制

相似问题

问如何使用pytorch将python列表列表转换为张量
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用pytorch将python列表列表转换为张量EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何使用pytorch将python列表列表转换为张量
EN