专栏首页AI研习社如何成为一个 AI 白痴?

如何成为一个 AI 白痴?

上周,你加入了 Bean 先生的冒险之旅(http://bit.ly/quaesita_mrbean),学习了关于训练、验证和测试的基础知识。关于如何成为一个 AI 白痴的规则自然地遵循这些内容,但是让我明确地为你阐明它们。

图片来自 tenor

到目前为止的故事


在上一集中,你扮演了 Mr. Bean——你的 AI 的耐心教授。既然你越来越在行了,那就让你坚持下去吧。我常说,避免应用人工智能陷阱的最好方法是永远不要忘记学习基本的知识,所以我暗地里希望你永远保持当 Bean 教授的思维方式。

永远不要忘记学习和教学的基础!

三个阶段的快速提醒:

  • 训练阶段:Mr. Bean 从在课堂上看到的例子中寻找模式,然后将这些模式转换成模型(食谱)。
  • 验证阶段:看看 Mr. Bean 的食谱在他没有明确研究的例子上的表现。如果分数看起来不错,就让他去考试,否则就重新开启训练阶段。
  • 考试阶段:Mr. Bean 参加期末考试,成绩决定是否允许他进行实际生产或换专业。

训练阶段相当简单,你可以把例子推到学生身上(把数据推到机器学习算法中),并且大多希望是最好的(我只是在开玩笑)。访问以下网站进一步了解它在这里的工作原理:http://bit.ly/quaesita_emperor

在我们列出成为 AI 白痴的方法之前,让我们从你尊敬的教授的角度来谈谈更微妙的阶段——验证和测试。

验证和测试之间的细微差别


如果你只关心挂掉那些成绩较差学生,你不需要验证阶段,你只需要测试:可怜的 Mr. Bean 进行训练,找到一个模式(这是一个愚蠢的模式),冲到你的考试中,结果考试不及格,并被踢出数学专业。你抓到并处决了一个无知的人,干得好!

测试是用来把关的,只有有价值的人才会通过!测试使你免于发布坏的原型。

好老师帮助学生进步(图源:GettyImages)

但你想帮助学生进步的愿望在哪里呢?你想帮助他们变得更好的承诺在哪里?他们的救赎和自我完善的机会在哪里?验证,这就是答案。

验证就是救赎,这是一个让你振作起来再试一次的机会,验证允许你迭代以获得更好的原型。

如果你真的关心你的学生,当你发现他们看起来很愚蠢的时候,你会很难过的。期末考试的时候,你是老师还是刽子手?

如果你的最终目标是培养合格的学生,你将需要提供实践问题(来自验证数据集)来帮助你的学生在专业测试之前提高。

如何避免成为 AI 白痴?


虽然人工智能项目的领导者可能不必知道他们的工程师和数据科学家所处理的数学问题,但他们没有理由忘记学习和教学的基本知识。如果你曾经考虑过设置一个考试,你已经有了大多数常识性的工具,你需要防止一些主要的问题。这里有几个例子。

永远不要忘记人工智能就是用例子来解释

如果你的例子不好,你应该感觉不好。如果你不给学生提供足够高质量的例子来学习,你怎么能指望他们有效地学习呢?哦,如果你给学生举一些有偏见的例子,你会得到一个有偏见的学生。那是你的错,教授。

从在测试数据上进行训练

如果只需要背诵就能通过考试,那没有任何好处。机器学习是为了在新的例子上取得成功——如果你关心的只是在旧的东西上表现良好的话,就可以跳过 ML/AI 的麻烦,使用一个查找表就好了。为了保证你评估的是正确的东西,而不是记忆旧数据的能力,确保你的学生从来没有机会学习你的任何测试例子。

不要在期末考试中使用训练或验证数据,这只会降低你正确测试学生能力的机会。

永远不要把你的数据集弄混

如果在深入研究之前没有仔细地整理和拆分数据,你将如何防止上述问题?数据拆分是最好的数据科学快速修复方法。在你开始教你的学生之前,一定要把测试的例子锁在一个安全的地方。

在你确定考试标准之前,千万不要开始考试

马上就开始?住手!虽然这一点似乎太明显了,但你会惊讶的发现,真正的项目团队在领导能力薄弱的情况下,往往会进行测试,然后改变,这样他们的学生的成绩就足够好。不管怎样,别这样。

从不复用测试数据

如果你想对那些坚持说你不能多次使用一个测试数据集的统计学家翻白眼,那么让我们试着用另一种方式来表达:「如果你给同一个学生两次相同的期末考试,不要相信他们第二次的表现。」不要重复使用这些试题!

不要跳过测试

测试可以让你免于灾难,这是你防止发布有问题原型的保护措施。如果你真的不在乎它,那么你有勇气把你的要求的性能标准设置得很低吗?如果不能,那就好好测试。

永远不要太相信自己

还有一个薄弱环节,那就是你自己,教授。如果你没有意识到你的考试设置得不好怎么办?比较少 最好的人也可能犯下这个错误。为了以防万一,一定要建立一些安全网,以将你没毕业的学生和外界隔绝。

如何成为 AI 白痴


当团队缺乏熟练的人工智能领导能力,或者当他们过于沉迷于工程的细节时,他们的常识可能会被忽略。他们可能会忽略基础知识,最终发布真正糟糕的解决方案。几乎我在现实生活中看到的每一个糟糕的 ML/ai 灾难都可以追溯到上面列表中的一个条目,所以如果你在寻找 AI dunce 帽子,我给了你一个很好的错误列表供你选择,请自便!

但是,如果你想建立一个好的,有用的,有效的人工智能解决方案,那么请时刻记住教授的观点。关于机器学习教学,就这些了!

via:https://towardsdatascience.com/how-to-be-an-ai-idiot-8559c65d91a8

本文分享自微信公众号 - AI研习社(okweiwu),作者:skura

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2020-01-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • GitHub 标星 1.6w+项目 HelloGitHub,让开发更简单的开源启蒙手册!

    如果你恰好是一个编程新手,并纠结于该如何开始 GitHub 开源项目的学习与研究,这本手册就恰恰能很好解决这一难题,它的最大亮点就在于 GitHub 入门。

    AI研习社
  • 小米无人机蔡炜:为什么没做“千元机”?

    半年前,小米发布了九号平衡车,1999元。行业人士的评价是:“革自己的命,让别人无路可走。” 所以在小米无人机发布之前,虽然业内人士一再强调:“上了4K和光流,...

    AI研习社
  • A/B测试常见的10个错误

    这是 W. Edwards 的依据名言,它表明,A/B 测试对于做出良好的商业决策来说至关重要。在 Manomano,我们向数百万用户展示数百万 DIY 和园艺...

    AI研习社
  • 观点︱如何提升渠道ROI?在数据分析的基础上实现精准营销

    著名广告大师约翰·沃纳梅克曾说过“打广告的钱有一半是浪费的,但客户永远不知道是哪一半。”尽管如此,每一位广告主都还是希望把漫天撒网的广告变成一种精准的目标广告。...

    CDA数据分析师
  • python使用sendmail在lin

    参考链接:How do I send mail from a Python script?

    py3study
  • 「CDAS 在线」央企财会到数据分析师的华丽转变

    原作者 CDA 数据分析师 去年的CDAS 2016 第三届中国数据分析师行业峰会上,有一个比较特别的分论坛。这个论坛的嘉宾有些原本并不是业内人士,但经...

    CDA数据分析师
  • 数据库测试的重要性、组件和过程

    企业级的服务系统通常是复杂的,一般都是多层设计,包括用户界面、业务逻辑、数据访问层和数据库层等。要确保服务按预期运行,所有这些层都需要一致且准确的协同工作。

    苦叶子
  • .NET 基金会项目介绍-Windows Presentation Foundation WPF

    Windows Presentation Foundation WPF 是属于 .Net 基金会的一个项目,本文将简要介绍该项目相关的信息。

    newbe36524
  • 今天来认识下数据库

    这是我的第七篇原创文章 爬了数据,只能放在记事本上?小的数据还是可以的,但是当你遇到较多的数据,放在记事本上就不是很好了,这时就需要用到数据库来存储了,那我们今...

    sergiojune
  • 服务器怎么买,腾讯云服务器购买三种流程介绍

    在国内的云服务器商家中,腾讯云是排名前列的云服务器提供商。而且腾讯是国内互联网龙头企业,信得过,它们的产品是值得信任的。现在教下新手怎样选择和购买腾讯云服务器。...

    tengxunyun8点com活动整理

扫码关注云+社区

领取腾讯云代金券