如何直接将Pandas数据矩阵转换为稀疏Numpy矩阵?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (1)
  • 关注 (0)
  • 查看 (506)

我正在根据Pandas数据创建一个矩阵,如下所示:

dense_matrix = np.array(df.as_matrix(columns = None), dtype=bool).astype(np.int)

然后变成一个稀疏矩阵:

sparse_matrix = scipy.sparse.csr_matrix(dense_matrix)

从df直接到稀疏矩阵有什么方法吗?

提问于
用户回答回答于

df.values是一个numpy数组,以这种方式访问值总是比np.array要快

scipy.sparse.csr_matrix(df.values)

必须先转置: df.values.T.。在DataFrames中,列为轴0。

扫码关注云+社区