前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >07KT98 GJR5253100R0278提供了许多灵活的部署选项

07KT98 GJR5253100R0278提供了许多灵活的部署选项

原创
作者头像
用户10534454
发布2023-05-04 16:34:57
1910
发布2023-05-04 16:34:57
举报
文章被收录于专栏:GEGE

07KT98 GJR5253100R0278提供了许多灵活的部署选项

所使用的模拟器还可以提供每个指令地址的执行计数。这提供了每个二进制文件中热循环被执行的迭代次数。每次迭代的浮点运算(FLOPs)是通过检查反汇编来计算的。如果进行静态分析,原始标量代码在热循环中有28个触发器。但是由于循环的一部分有时会被删除(对于这个输入数据集,4.5%的迭代),所以每次迭代的动态FLOPs为27.33。将每次迭代的FLOPs乘以迭代次数表明,每个二进制文件都在做相同的FP工作总量[6].

对原始标量代码进行矢量化以使用Neon将所需的指令数量减少了65%[7]。尽管执行了任何额外的指令,但由于vector Neon版本不再为非常远的对象或对象本身修剪计算。做一些无用的工作并丢弃结果仍然是有益的,因为Neon矢量代码比原始标量代码减少了63%的执行周期。

SVE版本保留了算法的计算修剪(使用预测),并且执行速度比矢量化Neon版本快26%。虽然通过预测修剪计算可能对执行的指令数量影响最小,但使用SVE提供了略有不同的指令组合,并导致更少更短的数据依赖链和改进的指令流。

ABB IMDSO14

ABB IMDSI14

ABB DI814

ABB DPW01

ABB DSBB175

ABB DSAO110

ABB DSAI130

ABB DRA02

ABB DSDX404

ABB DO620

ABB DO610

ABB DLM02

ABB DLM01

ABB DSQC322

ABB 07KT97F1

ABB DSQC313

ABB DSQC202

ABB DSPC406

ABB DO630

ABB 37911-4-0338125

ABB 07KT97B

ABB 5716075-P

ABB PU516

ABB 3BSE013064R1

ABB DSPC172H

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档