创建工作流

最近更新时间:2026-03-25 14:21:31

我的收藏

操作场景

本文档指导您如何在 TI-ONE 平台创建并编排工作流。通过拖拽式组件编排,您可以快速搭建从数据接入、数据处理到模型训练的端到端工作流程。

前提条件

已开通 TI-ONE 服务
已加入工作流功能的白名单(工作流当前为白名单功能,如需开通,请联系您的客户经理或提交工单)

核心概念

在创建工作流前,建议您先了解以下核心概念:
名词
定义与说明
工作流
由一系列节点和边组成的有向无环图(DAG),描述任务的执行逻辑和数据流向
算子
封装了具体算法或逻辑的独立执行单元(代码+环境),是构建工作流的原子单位
组件
在画布上被用户拖动和连接的对象,通常指内置的或者由用户自定义的、可复用的算子,包含输入输出定义、Docker 镜像和执行命令
节点
组件被拖到工作流画布上后,即成为该工作流的一个节点。一个算子被包装为组件后,可以被拖拽多次,并且进行相关配置,作为多个节点
工作流文件夹
用于组织和管理多个工作流的容器,支持在文件夹内创建、编辑、删除工作流
工作流模板
由平台内置的可被多次复制并基于其进行修改的工作流示例

操作步骤

步骤1:创建工作流文件夹

工作流文件夹用于组织和管理您的工作流,您需要先创建文件夹(也可使用其他用户创建好的文件夹)后,再创建工作流。
1. 登录 TIONE控制台,在左侧导航栏中单击工作流
2. 在"工作流文件夹"页面,单击“+”新建文件夹。
3. 在弹出的对话框中,填写以下信息:
文件夹名称:自定义文件夹名称,例如“自动驾驶数据处理”。
描述(可选):填写文件夹的用途描述。
存储配置:填写 COS 路径,用于保存该文件夹下所有工作流的中间结果数据。
标签(可选):为文件夹添加标签,便于分类管理。
CLS日志投递(可选):如需持久化存储日志,可开启该能力。
4. 单击确定,完成文件夹创建。
说明:
工作流文件夹在当前工作空间内公开,空间内所有成员均可查看。
如需编辑或删除文件夹,您需要具备对应的数据权限(可编辑权限)。
工作流文件夹在当前工作空间内公开,空间内所有成员均可查看
如需编辑或删除文件夹,您需要具备对应的数据权限(可编辑权限)


步骤2:新建工作流

您可以通过以下两种方式创建工作流:

方式一:从空白工作流开始

1. 在"工作流文件夹"页面,单击希望使用的文件夹名称,进入文件夹详情页。
2. 单击新建工作流
3. 在弹出的对话框中,填写以下信息:
工作流名称:自定义工作流名称,例如“点云数据处理流程”。
描述(可选):填写工作流的用途描述。
4. 单击确定,进入工作流编排画布。


方式二:从工作流模板创建

1. 在左侧导航栏中单击工作流 > 工作流模板
2. 浏览平台提供的内置模板,找到符合您需求的模板。
3. 单击模板卡片右下角的复制或单击模板卡片预览页面的复制
4. 在弹出的对话框或页面中:
选择目标文件夹
填写工作流名称

5. 单击确定,系统将自动复制模板内容并进入编辑页面。
另外,您也可以在方式一的入口勾选从模板新建来使用模板。


步骤3:添加组件并编排工作流

进入工作流编排画布后,您可以开始构建工作流:

3.1 了解组件面板

画布左侧为组件面板,组件按功能分类展示:
组件分类
说明
典型组件
数据源
用于接入数据
COS、数据集
代码
用于运行自定义代码
Spark、PyTorch、TensorFlow
数据处理
用于数据预处理
上采样、缺失值填充等
特征工程
用于特征转换和选择
向量索引、one-hot 等
机器学习
用于传统机器学习建模
XGBoost、随机森林、KMeans 等
自然语言处理
用于 NLP 任务
BERT、Transformer 等
评估分析
用于模型评估和可视化
散点图、中文问答评估等
自动驾驶行业
用于自动驾驶数据处理
4D 预标注、文件解压、点云优化等
说明:
“自动驾驶行业”类组件当前仅在“上海自动驾驶云”地域可用。

3.2 拖拽组件到画布

1. 在左侧组件面板中,选择您需要的组件分类。
2. 将组件拖拽到画布中央区域。
3. 重复上述步骤,添加工作流所需的所有组件。


3.3 连接组件节点

1. 将鼠标悬停在组件节点上,节点右侧将出现连接点。
2. 单击并拖拽连接点到下一个组件的左侧连接点,建立数据流向。
3. 重复上述步骤,按照业务逻辑连接所有节点,形成有向无环图(DAG)。
注意:
工作流不支持循环连接(即不能形成闭环)。
每个节点可以有多个输入和多个输出。
工作流不支持循环连接(即不能形成闭环)。
每个节点可以有多个输入和多个输出。


3.4 配置组件参数

添加组件后,需要为每个节点配置运行参数:单击画布中的组件节点,右侧将弹出参数配置面板。

您可根据业务需求配置参数,每个组件的配置有差异,常见的配置主要包括:
1. 基本信息
节点名称:系统会自动填充,您也可自定义节点名称,建议使用有意义的命名
备注(可选):可对该节点进行备注,填写节点用途说明
2. 数据参数
输入数据:选择数据来源(如上游节点输出、COS 路径、数据集等)
输出数据:配置数据输出路径
3. 算法参数
根据组件类型不同,配置对应的算法参数(如学习率、Batch Size 等)
4. 资源参数
机器来源:选择“从 TIONE 平台购买”或“从 CVM 机器中选择”
从 TIONE 平台购买(托管资源):
计费模式:按量计费/资源组/包年包月
算力规格:选择 CPU 或 GPU 规格(如 GN7.2XLARGE32、CPU.4 核 8G 等)
节点数量:设置并行节点数
从 CVM 机器中选择(纳管资源):
资源组:选择已创建的 CVM 资源组
资源申请:配置具体的资源规格要求
5. 镜像参数
系统默认显示该组件的推荐镜像,您也可切换镜像。内置通用镜像为平台维护的该组件相关镜像,如需使用其他镜像,您可以切换至自定义镜像并选择您在镜像管理中创建的自定义镜像

步骤4:保存工作流

完成工作流编排后,单击画布右上角的保存按钮,系统将自动保存工作流配置。
说明:
建议在编排过程中定期保存,避免意外丢失。保存后的工作流可在文件夹中查看和管理,工作流编排完成后即可运行任务。