专栏首页腾讯智能钛AI开发者【典型案例】如何使用机器学习帮助你快速成为花朵分类专家
原创

【典型案例】如何使用机器学习帮助你快速成为花朵分类专家

随着信息时代的发展,伴随着照相装备和图片采集设备的普及,越来越多的图片数据广泛存在于生产生活的各个角落,如何对海量图片数据进行高效的分类和检索成为了一项新的挑战。

腾讯智能钛机器学习平台为用户提供一种利用深度学习快速搭建图像分类模型的方式,用户无须编写代码,只要拖动相应的算法组件,便可以在短时间内快速上手,解决自己的实际问题。

此篇文章呢,小编将会带你了解如何使用智能钛机器学习平台,一步一步,拖拉拽搭积木似的搭建出能识别出5种花朵的模型,最后再用图片去验证模型的准确性。即使你是机器学习方面的小白,也能快速上手哦,大家是不是很期待呢?快跟我一起感受机器学习的魅力吧~

智能钛现阶段免费试用开放中,欢迎使用:https://cloud.tencent.com/product/tio

本场景中,将通过搭建 CNN 网络训练分类模型,识别5种花朵;训练完成后部署模型,通过 HTTP 调用返回预测结果,预计完成需要30分钟时间。

数据集介绍


本案例使用的公开数据集共包含五类花朵数据:Daisy(菊花)、Dandelion(蒲公英)、Rose(玫瑰)、Sunflower(向日葵)和Tulip(郁金香),共218MB大小。

数据集下载链接:

http://download.tensorflow.org/example_images/flower_photos.tgz

数据集抽样展示如下:

各类别下花朵照片示例

整体流程


工作流整体流程

详细流程


一.数据准备

1.在智能钛机器学习平控制台的左侧导航栏,选择【输入】>【数据源】>【 COS 数据集】,拖入画布中。

2.填写 COS 路径地址,请直接复制输入${ai_dataset_lib}/image_classification/flower_photos,并关闭【是否检查数据】。

数据准备

二. 切分数据

在模型训练的时候通常会将所有的数据分成三部分,分别是训练集 training set、验证集 validation set 和测试集 test set。训练集用来训练模型,验证集用于调节超参数,测试集用来整体评估模型的性能。

本文的实验较简单,可以只将数据切割成训练集和测试集,比例为8:2, 80%用于训练,20%用于测试。

1.在控制台的左侧导航栏,选择【输入】>【数据转换】>【图像数据切分】。

2.将【图像数据切分】拖入画布,并右键重命名为“切分数据”。

3.填写参数:(其余参数均可默认)

    ●分类 or 检测任务:Classification

    ●验证集比例:0.2

切分数据

三. 数据格式转换

TFRecord 数据文件是一种将图像数据和图像标签统一存储的二进制文件,能更好地利用内存,在 TensorFlow 中快速的复制、移动、读取、存储等。在这一步中,我们将原始 JPG 文件转换成高效的 TFRecord。

1.在控制台的左侧导航栏,选择【输入】>【数据转换】>【图片格式转换(分类)】,并拖入画布中。

2.将【切分数据】的输出桩连到【图片格式转换】左边的输入桩上,将【COS 数据集】输出桩连接到【图片格式转换】右侧的输入桩。

3.填写参数:(其余参数均可默认)

    ●images/split:1000。

4.两个输出桩分别代表训练集和验证集的 TFRecord 文件, 供后面的分类网络使用。

数据格式转换

四. 分类网络

选择合适的 CNN 网络处理分类任务,这里以 Inception 网络为例。 Inception 网络的详情可以参考 相关论文。

1.在控制台的左侧导航栏,选择【算法】>【深度学习算法】>【计算机视觉】>【 Inception 】,并拖入画布中。

2.将【图片格式转换】的两个输出桩,分别连接到【 Inception 】 的前两个输入桩,代表了训练集和验证集数据文件,同时将【切分数据】的输出桩连接到【 Inception 】 最右侧的输入桩,代表“label_map文件所在目录”。

3.填写参数:(其余参数均可默认)

    ●batch_size: 16。

    ●学习率:0.0025。

    ●训练步数:6000。

    ●是否模型微调:true。

    ●优化器:sgd。

    ●微调模型路径:(复制填写)

${ai_dataset_lib}/checkpoints/inception/inception_v1.ckpt

    ●GPUs:深度学习网络用到了 GPU 资源, 可以极大地提高训练速度。 单击该选项,在对话框中选择合适的显卡型号和数量,此处1张显卡即可。

分类网络

五.保存并运行工作流,等待模型生成

(一定有记得保存工作流再运行)

运行工作流

运行完成,模型成功生成,显示如下图:

模型生成

保存并应用模型


一.保存模型

1.右键单击【模型】组件,选择【保存到模型仓库】。

2.输入【模型名称】,跳转至【模型仓库界面】。

保存模型

二.部署模型

1.在【模型仓库界面】找到该模型,点击【部署】.

2.在【模型服务名称】栏填写【花朵分类】,【运行环境】选择【tfserving】,点击【确定】,跳转至【模型服务】界面。

部署模型

当【状态】显示为【运行中】时表明部署成功。

三.测试模型

最后让我们来做个简单测试,看看训练出来的模型是否能准确分类出5种花朵。

准确识别出菊花
准确识别出蒲公英
准确识别出向日葵
准确识别出玫瑰花
准确识别出郁金香

是不是很有意思?这里呢我们只是做了个简单的测试,更多模型的应用可以参考官网的文档哦:https://cloud.tencent.com/document/product/851/35158

本案例已在平台内置,你可以直接复制到自己的工程,即可点击运行,等待生成模型,操作如下图:

你也可以在创建工作流时直接选择从模板创建,即可点击运行,等待生成模型,操作如下图:(右侧还支持文档同步说明哦)

如果你在创建模型过程中遇到问题

请给我们留言反馈

我们将为你解答

长按/扫描关注我们官方公众号

更多典型案例请关注:

智能钛官网文档中心:https://cloud.tencent.com/document/product/851/19547

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【2020腾讯广告算法大赛】什么是智能钛机器学习平台(TI-ONE)

    钛(Ti)是一种轻量级、高强度的金属,也是制造钢铁侠飞行战衣的材料。在人工智能快速发展的今天,智能钛机器学习平台(TI-ONE)作为腾讯AI战略发展(Tence...

    腾讯智能钛AI开发者
  • 【典型案例】利用AI技术快速识别物体种类之火眼金睛目标检测

    目标检测任务在计算机视觉和数字图像处理领域扮演着重要角色,在各行各业也已得到广泛应用,如航空航天、机器人、智能监控等重大行业。精准地从图片中识别出目标所在位置,...

    腾讯智能钛AI开发者
  • 【典型案例】利用决策树实现乳腺癌预测助你成为半个医学专家

    乳腺癌是美国妇女最常见的癌症,也是癌症死亡的第二常见原因。利用机器学习算法从已有的临床乳腺癌数据中,可以学习导致乳腺癌的特征,并通过大量历史数据的学习使得机器成...

    腾讯智能钛AI开发者
  • 推荐系统遇上深度学习(四十一)-使用RNN做基于会话推荐的一些小trick

    本文论文的题目是《Improved Recurrent Neural Networks for Session-based Recommendations》 论...

    石晓文
  • 做数据分析必须学R语言的4个理由

    R 是一种灵活的编程语言,专为促进探索性数据分析、经典统计学测试和高级图形学而设计。R 拥有丰富的、仍在不断扩大的数据包库,处于统计学、数据分析和数据挖掘发展的...

    小莹莹
  • 做数据分析必须学R的4个理由

    R 是一种灵活的编程语言,专为促进探索性数据分析、经典统计学测试和高级图形学而设计。R 拥有丰富的、仍在不断扩大的数据包库,处于统计学、数据分析和数据挖掘发展的...

    华章科技
  • 为什么你需要改进训练数据,如何改进?

    Andrej Karpathy 在他的 Train AI 演讲中展示了这张胶片,我非常喜欢。这张胶片完美地揭示了深度学习在研究与生产间的区别。通常来说,学术论文...

    AI研习社
  • 使用Unity3D提取王者荣耀英雄模型 VR资源

    我玩儿王者荣耀的时候,看到大乔的建模非常漂亮,于是想提取出来研究一下。搜索网上发现只有在各个网站出售的提取好了的模型,需要用各种币购买,以及注册等非常麻烦。所...

    bering
  • python中函数的基础用法

    python中的内置函数提供了基础功能,在实际开发中,我们需要将这些基础功能进行搭配组合,来有效解决我们的问题。如何将我们自己构建的代码作为一个可复用的工具,最...

    生信修炼手册
  • 一文探究数据仓库体系(2.7万字建议收藏)

    数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它出于分析性报...

    肉眼品世界

扫码关注云+社区

领取腾讯云代金券