文章/答案/技术大牛

发布

社区首页 >问答首页 >基于特征稀疏矩阵的性能调整

问基于特征稀疏矩阵的性能调整
EN

Stack Overflow用户

提问于 2017-10-07 15:30:34

回答 1查看 315关注 0票数 0

我用Eigen的SparseMatrix实现了一些东西，基本上是这样的

SparseMatrix W;
...
W.row(i) += X.row(j);  // X is another SparseMatrix, both W and X are row major.
...

我通过google-pprof对代码做了一些perf分析，我认为上面的代码是有问题的，见下图，

图1

然后是图2

最后图3

看起来operator+=带来了很多内存拷贝的东西。

我不太了解SparseMatrix操作的内部结构，但是否有任何优化上述代码的推荐方法？

eigen3

performance

sparse-matrix

eigen

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-10-09 20:21:15

如果X的稀疏性是W稀疏性的子集，那么您可以编写自己的函数执行就地添加：

namespace Eigen {
template<typename Dst, typename Src>
void inplace_sparse_add(Dst &dst, const Src &src)
{
  EIGEN_STATIC_ASSERT( ((internal::evaluator<Dst>::Flags&RowMajorBit) == (internal::evaluator<Src>::Flags&RowMajorBit)),
                      THE_STORAGE_ORDER_OF_BOTH_SIDES_MUST_MATCH);

  using internal::evaluator;
  evaluator<Dst> dst_eval(dst);
  evaluator<Src> src_eval(src);

  assert(dst.rows()==src.rows() && dst.cols()==src.cols());
  for (Index j=0; j<src.outerSize(); ++j)
  {
    typename evaluator<Dst>::InnerIterator dst_it(dst_eval, j);
    typename evaluator<Src>::InnerIterator src_it(src_eval, j);
    while(src_it)
    {
      while(dst_it && dst_it.index()!=src_it.index())
        ++dst_it;
      assert(dst_it);
      dst_it.valueRef() += src_it.value();
      ++src_it;
    }
  }
}
}

下面是一个用法示例：

int main()
{
  int n = 10;
  MatrixXd R = MatrixXd::Random(n,n);
  SparseMatrix<double, RowMajor> A = R.sparseView(0.25,1), B = 0.5*R.sparseView(0.65,1);

  cout << A.toDense() << "\n\n" << B.toDense() << "\n\n";

  inplace_sparse_add(A, B);

  cout << A.toDense() << "\n\n";

  auto Ai = A.row(2);
  inplace_sparse_add(Ai, B.row(2));

  cout << A.toDense() << "\n\n";
}

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/46621953

复制

相似问题

问基于特征稀疏矩阵的性能调整
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于特征稀疏矩阵的性能调整EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于特征稀疏矩阵的性能调整
EN