2), (4, 3), (2, 2)])
typeof(custom_types)
"CuArray{point,1}"
数组操作
我们已经定义了许多操作。...CPU 数组和复制
多维索引和切片 (xs[1:2, 5, :])
permutedims
串联 (vcat(x, y), cat(3, xs, ys, zs))
映射,融合 broadcast(zs...这是因为 Julia 的自动微分库适用于任意函数,并存有可在 GPU 上高效运行的代码。这样即可利用最少的开发人员就能在 GPU 上实现 Flux,并使 Flux GPU 能够高效实现用户定义的功能。...同时可以在 OpenCL 或 CUDA 设备上执行内核,从而提取出这些框架中的所有差异。
实现上述功能的函数名为 gpu_call。...kernel 的每个并行调用都有一个线程索引,可以利用它索引到数组 A 和 B。如果计算索引时没有使用 linear_index,就需要确保没有多个线程读取和写入相同的数组位置。