TACO DiT 加速 Flux 模型

最近更新时间:2025-08-12 18:58:02

我的收藏
本文档以 Flux 系列模型为例,演示 TACO DiT 部署和使用流程。

环境准备

机型:GC49d 一卡
说明:
如果您的业务场景需要使用当前机型,请联系 技术支持
软件版本:
PyTorch 2.7.1
CUDA 12.8

基于 Flux.1-kontext-dev 最佳实践

工作流:Flux.1-kontext-dev
客户按需将工作流放到模型加载器(如果有 lora,放到 lora 加载器之后即可)之后,单击运行即可。MegCache 节点和 Compile Flux Model 节点可单独使用也可以配套使用。

整体生图时延平均提速4.5倍,从23.6s降低到5.2s。运行结果如下:
Baseline
TACO DiT 优化



基于 Flux.1-dev 最佳实践

工作流:Flux.1-dev
客户将上述工作流放置在模型加载器之后,单击运行即可。

整体生图时延平均提速3.9倍,从13.9s降低到3.6s。运行结果如下:
Baseline
TACO DiT 优化