杂乱的访问会导致访存被拆分成多次请求, 严重降低效率.这是local memory的用途一.用途二则是, 方便编译器安排一些无法有效的放入寄存器, 例如当前阶段寄存器资源用的太多了, 或者一些访存方式(...所以这是为何今天手册说, 对局部的数组的非编译时刻能确定的下标访问, 会被放入local的原因....也就是动态的下标访问.所以我们其实是可以用数组的, 只要(1)数组别太大, 或者很大, 但是每段代码使用的热点明显. (2)下标是静态的, 编译时刻能确定的....某些时刻某个变量可能在寄存器中, 但下一时刻它可能在local中, 根据不同代码位置的寄存器压力, 或者其他因素所决定.好了....建议总是小心对待.代码这玩意, 你先写对为主, 然后再考虑优化.