说明: 稀疏矩阵是机器学习中经常遇到的一种矩阵形式,特别是当矩阵行列比较多的时候,本着“节约”原则,必须要对其进行压缩。本节即演示一种常用的压缩方法,并说明其他压缩方式。...由此,就要修改矩阵的表示形式,只记录非零元素及其位置,没有记录的位置,都是零元素,这就是矩阵压缩。...★矩阵压缩的基本原则:
不重复存储相同元素
不存储零元素
下面详细介绍一种压缩稀疏行(Compressed Sparse Row,CSR)的矩阵压缩方法。...,则为: 按照上表和矩阵,可以得到三个文档中的每个单词出现的列索引,即矩阵中非零元素对应的列索引,组成一个列表:
ind = [0, 1, 0, 1, 2, 3, 4, 5, 3, 4, 6, 7]...,从输出信息可知,其中保存了 个元素,也就意味着对应的稀疏矩阵中都是零元素。