WeData 的模型管理依托于 MLflow 和 Catalog,提供了完整的机器学习模型生命周期管理能力,包括:
模型注册:你可以将训练好的模型注册到模型库;
版本管理:对模型进行版本控制,方便回溯和对比不同版本;
血缘追踪:展示模型与其上游数据、实验的关联,帮助你追踪模型的来源和依赖关系;
实验追踪:集成MLflow,自动记录模型的训练参数、评估指标、运行环境等,便于实验对比和性能监控;
模型部署:支持将模型一键部署为在线服务,实现实时推理和应用集成;
这些功能帮助团队高效协作,规范化管理和部署机器学习模型,提升生产效率和模型治理能力。
模型注册
模型界
面注册有两个入口:方式一:直接在模型管理页面“创建模型”。
方式二:在实验运行界面基于某个实验运行“注册模型”。
在模型管理页面“创建模型”
1. 左侧菜单进入模型管理页面。
2. 单击创建模型,选择模型类型“机器学习模型注册”、填写模型名称、选择 catalog、schema 路径,单击创建;该步骤在 catalog 中创建了一个模型名称和路径。(说明:选择 catalog 地址的前提是需账号已有 catalog 数据目录的授权。)

3. 到实验运行界面,基于具体的模型实验运行,单击模型注册,注册方式选择“已有模型新版本”,模型名称选择刚创建的模型名称。

基于实验运行“创建模型”
1. 左侧菜单进入实验管理,进入训练最佳的实验运行,单击模型注册。

2. 选择注册成新模型,还是注册成已有模型的新版本。
注册成新模型:输入模型名称、选择 catalog 和 schema,单击模型注册。(说明:选择 catalog 地址的前提是需账号已有 catalog 数据目录的授权。)

注册成已有模型的新版本:选择已有模型,单击模型注册。

3. 注册成功,在模型管理列表中查看模型,单击模型名称,进入模型详情。

版本管理
1. 模型注册会以版本的形式进行管理。

2. 单击关联的任务,追踪查看该模型的实验运行。
3. 单击模型版本,查看模型基本元数据、模型签名及血缘;支持修改模型别名标签、模型描述。

血缘追踪
单击模型血缘查看模型的上下游血缘链路,上游节点有原始数据表/特征表/训练数据表/实验运行;下游节点有模型服务/推理表。

实验追踪
1. 单击模型版本的关联的任务,追踪查看该模型的实验运行。

2. 在实验运行中可以追踪模型的训练指标、参数。

3. 追踪模型工件,支持导出模型工件。

模型部署
1. 进入模型版本详情页,单击部署。

2. 进入模型服务创建流程。
