我正在从一个Pandas数据帧创建一个矩阵,如下所示:
dense_matrix = np.array(df.as_matrix(columns = None), dtype=bool).astype(np.int)
然后转换成一个稀疏矩阵:
sparse_matrix = scipy.sparse.csr_matrix(dense_matrix)
有没有办法从df直接转到稀疏矩阵?
提前谢谢。
发布于 2013-12-09 06:12:41
df.values
是一个numpy数组,以这种方式访问值总是比np.array
快。
scipy.sparse.csr_matrix(df.values)
您可能需要先进行转置,如df.values.T
。在DataFrames中,列是轴0。
发布于 2022-01-06 00:38:10
有一种方法可以做到这一点,而不需要在途中转换为密集:csr_sparse_matrix = df.sparse.to_coo().tocsr()
https://stackoverflow.com/questions/20459536
复制相似问题