GPU 实例最适用于并行度极高的应用程序,例如,使用数千个线程的工作负载。当图形处理有大量的计算要求,其中的每个任务都相对较小时,执行的一组操作形成了一个管道,而此管道的吞吐量要比单个操作的延迟更为重要。要构建能充分利用这种并行度的应用程序,用户需要掌握 GPU 设备的专项知识,了解如何针对各种图形 API(DirectX、OpenGL) 或 GPU 计算编程模型(CUDA、OpenCL)进行编程。