CUDA优化的冷知识2| 老板对不起
CUDA优化的冷知识 3 |男人跟女人的区别
今天主要说两点, 一点是如何正确的计算一段操作所用的时间。...这里的一段操作是指的, GPU设备上的kernel计算, 以及, 数据传输操作。...但是我们历年来, 很遗憾的看到, 大部分人的做法都是错误的. 甚至使用了错误的测时结果, 来气势汹汹询问一些问题. 此时, 因为你的基础部分(计时)是错误的, 从而导致了你的问题整体无效....这点无论是从, 我们的论坛上的帖子中, 还是我们的直接的客户支持用, 用户给出的他们的代码中, 都可以看到这样的错误.
今天我们就说一下, 这些错误的根源, 和正确的计时方式该如何进行....然后我们继续说一下该例子, 楼主的正当做法应该是:
(1)CPU记录开始时间
(2)CPU给GPU派活
(3) [CPU等待GPU完成该活]
(4)CPU记录结束时间
我们在这里插入了步骤3, 也是手册上今天的