首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >卤素和循环嵌套

卤素和循环嵌套
EN

Stack Overflow用户
提问于 2017-01-16 11:56:53
回答 1查看 544关注 0票数 1

打印循环嵌套卤化物::sum不是最优的,正如用教程写的那样。

这段代码为零初始化和求和提供了单独的循环。

代码语言:javascript
运行
复制
  Halide::Func f("f");
  Halide::Var x("x");
  Halide::RDom r(0, 3);

  f(x) = Halide::sum(r + x);
  f.print_loop_nest();

  f.realize(10);

产出:

代码语言:javascript
运行
复制
produce f:
  for x:
    produce sum:
      for x:
        sum(...) = ...
      for x:
        for r4:
          sum(...) = ...
    consume sum:
      f(...) = ...

能融合这个循环吗?还是不影响性能?谢谢!

更新:熔断器如下:

代码语言:javascript
运行
复制
produce f:
  for x:
    produce sum:
      for x:
        sum(...) = ...
        for r4:
          sum(...) = ...
    consume sum:
      f(...) = ...
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2017-01-17 02:21:27

这是print_loop_nest令人困惑的情况。X上的内环大小是1,所以就消失了。编译后的循环嵌套就是您想要的。X上的外循环是一个非平凡的循环,所以这就是真正发生的事情:

代码语言:javascript
运行
复制
produce f:
  for x:
    produce sum:
      sum(...) = ...
      for r4:
        sum(...) = ...
    consume sum:
      f(...) = ...
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/41675911

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档