专栏首页大数据智能实战AI+CV: 谷歌数据增强文章的实践

AI+CV: 谷歌数据增强文章的实践

数据增强是机器学习中常用的Trick,特别是用于样本不足的情况下的一种提升机器学习模型性能的重要手段。看了谷歌开源的数据增强文章,里面已经实现得比较全的,做了简单实验,效果还是不错。

从其开放代码(https://github.com/tensorflow/tpu/blob/master/models/official/efficientnet/autoaugment.py)中可以看出,该类已经封装了较多的数据增强操作。

class AutoAugment(object):
    def __init__(self):
        self.policies = [
            ['Invert', 0.1, 7, 'Contrast', 0.2, 6],
            ['Rotate', 0.7, 2, 'TranslateX', 0.3, 9],
            ['Sharpness', 0.8, 1, 'Sharpness', 0.9, 3],
            ['ShearY', 0.5, 8, 'TranslateY', 0.7, 9],
            ['AutoContrast', 0.5, 8, 'Equalize', 0.9, 2],
            ['ShearY', 0.2, 7, 'Posterize', 0.3, 7],
            ['Color', 0.4, 3, 'Brightness', 0.6, 7],
            ['Sharpness', 0.3, 9, 'Brightness', 0.7, 9],
            ['Equalize', 0.6, 5, 'Equalize', 0.5, 1],
            ['Contrast', 0.6, 7, 'Sharpness', 0.6, 5],
            ['Color', 0.7, 7, 'TranslateX', 0.5, 8],
            ['Equalize', 0.3, 7, 'AutoContrast', 0.4, 8],
            ['TranslateY', 0.4, 3, 'Sharpness', 0.2, 6],
            ['Brightness', 0.9, 6, 'Color', 0.2, 8],
            ['Solarize', 0.5, 2, 'Invert', 0, 0.3],
            ['Equalize', 0.2, 0, 'AutoContrast', 0.6, 0],
            ['Equalize', 0.2, 8, 'Equalize', 0.6, 4],
            ['Color', 0.9, 9, 'Equalize', 0.6, 6],
            ['AutoContrast', 0.8, 4, 'Solarize', 0.2, 8],
            ['Brightness', 0.1, 3, 'Color', 0.7, 0],
            ['Solarize', 0.4, 5, 'AutoContrast', 0.9, 3],
            ['TranslateY', 0.9, 9, 'TranslateY', 0.7, 9],
            ['AutoContrast', 0.9, 2, 'Solarize', 0.8, 3],
            ['Equalize', 0.8, 8, 'Invert', 0.1, 3],
            ['TranslateY', 0.7, 9, 'AutoContrast', 0.9, 1],
        ]

实践测试:

  随机跑了两次,发现每次的结果都不一样,而且速度较快! 不过里面的策略中并不包含有随机擦除这一功能,需要再扩展。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 干货分享:成为机器学习工程师要知道的多种学习路径(附图)

    如果你决心成为一名机器学习工程师的话,在这篇文章中,我们将从简单的线性回归到最新的神经网络,让你了解机器学习的所有方面,你不仅可以学习如何使用它们,还将学习如何...

    AiTechYun
  • 问答 | 谷歌 AI 发布 BERT 模型,打破十一项 NLP 记录,会开启 NLP 新时代吗?

    日前,谷歌 AI 团队发布 BERT 模型,在机器阅读理解水平测试 SQuAD1.1 中表现出相当不错的成绩:在 11 项 NLP 任务中刷新当前最优性能记录。...

    AI研习社
  • Diffbot启动了基于AI的知识图谱:包含1万亿个有关人类、地点和事物的事实

    如果你曾经在谷歌搜索名人,著名地标或之前的产品,那么你可能会遇到有时位于结果页右侧的信息框,充满了谷歌知识图谱的信息,这是一个实体数据库,用于增强网络和Goog...

    AiTechYun
  • 业界 | AI在谷歌,如何「不作恶」

    AI 科技评论按:今年 3 月,谷歌与美国国防部在 Project Maven 上合作的消息泄露。由于 Project Maven 的目标是用于无人机的视频检...

    AI科技评论
  • 【绝不开发武器】谷歌发布AI 使用七原则,但仍与美国防部合作

    新智元
  • 【李飞飞李佳新里程碑】AutoML自然语言与翻译大升级,TPU 3.0进入谷歌云!

    【新智元导读】谷歌云年度Next大会召开,李飞飞和李佳的“佳飞?”组合也迎来了她们在谷歌云的又一座里程碑:度过艰辛时刻,AI客服中心终于落地,AutoML也如约...

    新智元
  • 谷歌 CEO 公布 AI 七原则 但继续与美国军方合作

    针对此前不断发酵的与美国军方合作IAI技术应用事件,今天,谷歌CEO桑达尔•皮查伊(Sundar Pichai) 发表了题为《AI at Google: our...

    C4rpeDime
  • 【谷歌2028】斯坦福前校长挂帅,体系结构宗师聚首启幕TPU新时代

    编译:闻菲 张乾 司明 【新智元导读】上周,Alphabet/谷歌迎来了新任董事长、曾经的斯坦福大学校长John Hennessy。这是“AI带头大哥”谷歌内部...

    新智元
  • ECCV 2020 Spotlight 谷歌论文大盘点

    本文继续盘点谷歌 Spotlight 中论文,看看工业界巨头都在关注什么方向,取得了哪些突破。该部分论文总计 12 篇,

    CV君
  • 2018年,AI企业之间或将拉开差距

    AI 科技评论按:继 2017 年人工智能相关企业大尺度布局和激烈的进行人才争夺之后,在稍微冷静的 2018 年,或将不断拉开彼此之间的差距。而这其中起重要作用...

    AI科技评论
  • 掌握哪些机器学习工具更受企业青睐?

    根据 GitHub 活跃数、开发人员使用人数、在招聘描述中出现的频率等综合数据分析,Google的 TensorFlow 仍稳居第一,被广大网友一致认为非常适合...

    AI科技大本营
  • 业界 | 谷歌发布AI七原则,不开发伤人武器,但没说不介入战争

    大数据文摘
  • 一文看尽2019全年AI技术突破

    最近,Analytics Vidhya发布了2019年AI技术回顾报告,总结了过去一年中,AI在不同技术领域取得的进展,并展望了2020年的新趋势。

    OpenCV学堂
  • 业界 | 关于李飞飞、李佳重磅加盟 Google,这里有三个有意思的地方

    今日,谷歌对外宣布斯坦福大学人工智能实验室主任李飞飞,和前 Snapchat 研究主管李佳(音译),这两位华裔女科学家将担任谷歌云机器学习部门的负责人。 女性在...

    AI科技评论
  • 一文看尽2018全年AI技术大突破

    这一年成为NLP研究的分水岭,各种突破接连不断;CV领域同样精彩纷呈,与四年前相比GAN生成的假脸逼真到让人不敢相信;新工具、新框架的出现,也让这个领域的明天特...

    量子位
  • 谷歌说「不作恶」?Nature评论:人工智能研究应当成为军事发展的助力

    今年 1 月,谷歌 CEO Sundar Pichai 曾表示人工智能的影响会比电力「更深刻」。他遵循谷歌领导者的悠久传统,称其技术是变革性且美妙的。

    机器之心
  • 特朗普盯上谷歌在华AI中心,CEO皮查伊上演“拉锯战”

    长久以来,Google CEO 皮查伊对拿下中国 AI 市场的念头似乎愈演愈烈,却每每不能如意。

    AI科技大本营
  • 谷歌医疗AI商业化提速!Jeff Dean亲自挖来大总管

    而且天要下雨员工要吃饭,还得扛起人类的希望,哪怕眼下收入和股价还不错,但谁又能保证几年后不会成为雅虎?

    量子位
  • 从TPU3.0到DeepMind支持的Android P,谷歌I/O 2018的AI亮点全在这了

    机器之心

扫码关注云+社区

领取腾讯云代金券