有奖捉虫:办公协同&微信生态&物联网文档专题 HOT

操作场景

该任务指导您在开通 TI-ONE 服务,配置 COS 存储并上传或标注所需训练数据后,开始进行训练任务的配置。通过训练任务配置,您可使用 TI-ONE 的自动学习功能,进行对应场景(例如图像分类、目标检测、杯盘检测)的模型训练。

前提条件

完成 TI-ONE 服务注册与开通,请参考 账号和权限说明
开通 对象存储 COS 服务并完成 存储桶创建
在数据中心 上传 带有标注标签的数据或对数据进行 标注
使用按量计费类型资源会预先冻结所选配置2个小时的使用费用,若您的现金账户余额不足,请先进行充值。

操作步骤

1. 进入自动学习 > 立即开始,选择对应的区域,单击新建任务
您可以新建视觉类型任务,点击选择【视觉】,可以选择图片分类,目标检测,杯盘检测任务类型。



您可以新建OCR任务,点击选择【OCR】,可以选择智能结构化任务类型。



您可以新建NLP任务,点击选择【NLP】,可以选择单标签文本分类和多标签文本分类任务类型。



单击后进入新建任务页面,用户需在此填写本次任务的任务名称、训练数据、训练输出路径、训练配置及训练资源配置等信息。
2. 填写基本信息

新建任务-配置任务-填写基本信息


3. 填写数据配置

新建任务-配置任务-填写数据配置

其中:
是否增量训练:对于首次训练的任务,是否增量训练默认关闭。如果您需要基于某个已有训练任务进行模型的增量更新,可选择将该项开启。
数据来源:您可选择数据中心的数据,或选择示例数据。数据中心的数据通常是您自己创建的数据集,示例数据为平台内置数据。
4. 填写模型配置

新建任务-配置任务-填写模型配置

其中:
预训练模型:腾讯TI平台提供腾讯超大规模预训练模型及通用训练模型。其中,推荐优先使用腾讯超大规模预训练模型,其具有训练数据庞大(亿级别数据)、训练起点高、通用性强、对训练数据要求更少、迭代速度快等特点。
训练偏好设置:可结合您的业务场景设置训练偏好,训练偏好主要用于平衡模型精度及推理速度。
期望准确率:可结合业务目标设置合理的期望准确率值,到达准确率后会为您自动停止训练。
最长训练时长:默认为1小时,到达后任务会立即停止。该设置下,模型可能无法达到所需的训练效果,可结合实际情况对该项进行调整。 训练参数设置为可选项,自动学习会为您提供默认值。也可结合您的实际情况进行修改,可修改的训练参数包括:
epochs:模型训练次数,可选择系统内置的值或进行自定义。
lr:学习率,可选择系统内置的值或进行自定义。
batch_size:训练批次大小,可选择系统内置的值或进行自定义。请结合训练数据数量调整batch_size。
warmup:预热训练次数,可选择系统内置的值或进行自定义。
模型优化:可通过此功能降低模型的推理时延,支持针对T4及V100两种类型的GPU进行优化。
5. 填写训练资源配置,可按需选择按量计费或包年包月计费模式,确认后单击下一步
单击下一步后,进入训练模型页面如您在单击下一步后离开训练模型页面,可至任务管理列表页重新找到该任务。
说明
配置目标检测任务(含杯盘检测)与配置图片分类任务类似,此处不再赘述。

大规模预训练模型使用注意事项

1. 当提供的训练数据中不同类别之间的外观差距非常小(如某两个类别为牛奶、酸奶),且提供的数据量较少(每类少于20张)时,需降低效果预期。
2. 如训练后认为模型效果无法达到预期,可尝试如下调整:
若训练数据量较小(如每类少于50张),可调小lr(逐步除以10),其他参数一般无需调整。
若训练时间较长(如训练数据量较大时),可减小epochs(逐步除以2),或适当调大lr(逐步乘以5),其他参数一般无需调整。