专栏首页基于机器学习的Hello World程序

基于机器学习的Hello World程序

机器学习有大量的算法,往往很容易让人感到不知所措。也正因为有太多的选择,导致人们不知道应该从哪里开始和要怎么去做。

这么多的选择,常常会让人感到麻木。

你需要先克服这种恐惧再开始。

没有魔法书或课程会告诉你什么时候应该使用什么算法。实际上,在实践中你不可能事先知道这一点。你必须通过反复试验才能发现它。这也意味着你会犯一些错误。

在这篇文章中,你会发现一个简单的技巧,让你应用在刚开始的机器学习上。

这个技巧将会引人深思,激励你更深入的钻研,还会增强你最喜欢的算法或工具,加速你的机器学习的旅程。

这是一个简单的策略,甚至一些有经验的从业者也会因为它的简单而忽略或忘记这个策略。

机器学习的Hello World,Faris Algosaibi的照片,保留部分权利

熟悉机器学习算法

你需要用各种不同的算法建立信心。

你解决机器学习问题的技巧大部分都掌握在你掌握的工具和能自信运用的能力上。

在这条道路上的第一步是打开一个工具或者库,并开始应用算法。就像学习编程一样,你需要从hello world开始。应用机器学习的hello world就是加载数据集并运行算法。

运行算法就是你建立自信的方式。

你应该运行大量的算法。运行完一个工具或库提供的所有算法后,接着尝试另一个库或工具的。

你不要想着找到最好的算法,没有最好的机器学习算法,如果对所有问题使用同一种算法或一类算法,则会严重的限制你可以实现的结果。

运行你的第一个算法

你会惊讶于有兴趣应用机器学习,但没有运行算法问题的人数。

同样,在你运行完你的第一个算法之后,你也会惊奇地发现,这是多么的微不足道,而你还有更多的东西需要你做。

很简单的流程:

  1. 选择一个工具。如果你不是程序员,我推荐Weka,因为它提供了一个图形用户界面。如果你是一个程序员,我建议使用基于 Python 语言的 scikit-learn 或者 R
  2. 选择一个标准的数据集。我推荐来自UCI机器学习库的标准数据集,虹膜分类问题是一个和 Hello World 一样经典的分类问题。
  3. 找到或设计一个方法。确定你使用这个工具加载数据集,将其放进队列和测试数据集中,并运行一种算法对这个数据集进行预测。如果你使用Weka,你可以按照这个方法。当然,我也有使用Rscikit-learn的方法。
  4. 运行这个方法
  5. 查看结果。 根据你运行结果的准确性,思考这意味着什么。查看是否有关于算法的信息,这些信息有可能代表着什么。
  6. 重复。尝试用不同的算法,不同的算法配置或不同的数据集运行大量的算法。

上面的流程很简单。事实上,正因为这么简单,你更应该这么做,这让你在所有主流的机器学习工具和库中,都能轻松地处理简单的问题。

除了选择最喜欢的算法之外,另一个问题是选择一个最喜欢的工具或库。

要想真正有效的解决问题,你需要使用任何能给你带来更好结果的工具。而且还要学习如何充分地使用每个工具,但要做好这些工具过时的准备。

动力来源于好奇心

你暂时还不需要了解工具或算法的问题。您正在建立对这个工具的信心和熟悉它提供的东西。

你刚开始应该问这样的问题:

  • 这个算法是怎样实现的?
  • 为什么这个算法比那个算法给出更好的结果呢?
  • 这些算法的所有参数分别代表什么?

在机器学习的应用方面有很多东西需要学习,这也正是为什么它是一个激动人心的领域。

希望这个练习能激励你深入一点,并开始研究一定的算法或算法参数来回答这些问题。

这个技巧不只是克服算法的选择困难症,对这个工具建立信心和熟练使用它,我还希望它能激发你的好奇心。毕竟知道更多需要的东西可以让你走很长一段路,帮助你理解以前觉得难以理解的事情。

可以随时在想要演示的数据集上运行给定的算法的好处在于,你可以把书籍,博客和其他资料所阅读和学习的内容加以理解融入你使用的工具。这种将创意付诸行动的能力将会提高你的学习动力并促进你的学习。

走得更远

这里有很多工具,几乎和机器学习算法一样多。

我喜欢尝试其中的大部分,但只是看看他们提供什么,他们可以做什么。

有一个小技巧,您可以在文本文件比如word文档或程序代码中创建一套属于你自己的方法或执行计划。这让你以后再使用这个工具时,可以针对问题和算法快速的开始。

你的好奇心会让你更进一步,因为你可能想要开始建立一个机器学习算法列表描述这些算法,甚至运用在小型的研究项目中从而研究他们

行动步骤

在这篇文章中,你发现的这个简单的技巧,可以用来压倒性的克服算法。这关键在于开始使用现成的工具和库将算法应用于小内存问题。

这个技巧的妙处在于它让你熟悉算法和工具,但更重要的是让你对算法,算法的实现和参数产生了好奇心。这种好奇心可以激励你更深入的了解,追求知道更多相关知识。

当你在学习机器学习的过程中遇到它们,熟悉工具和算法是你发现新东西想进行尝试并付诸行动的基础,这也可以促进你的学习。

请选择一个工具,然后运行你的第一个算法。

如果你仍然感到迷惑,请按照这个循序渐进的教程在Weka中运行你的第一个机器学习算法。然后运行更多的算法。

请分享你的经验。比如说你选择了哪一种工具,运行了哪种算法,引发了什么问题?

本文的版权归 selinayu 所有,如需转载请联系作者。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 在Linode上部署React应用程序

    React是一个用于构建用户界面的流行JavaScript库。虽然React经常被用作更复杂应用程序的前端,但它也足够强大,可以单独用于完整的客户端应用程序。

    selinayu
  • TalkingData张夏天:不要专职算法工程师,要数据科学家

    用户1737318
  • 数据挖掘10大算法详细介绍

    在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法,今天我打算用简单的语言来解释一下。

    用户3003813
  • 6个你应该熟知的机器学习算法

    在大部分机器学习课程中,回归算法都是介绍的第一个算法。原因有两个:一回归算法比较简单,介绍它可以让人平滑地从统计学迁移到机器学习中。二回归算法是后面若干强大算法...

    1480
  • 机器学习中K-近邻算法的案例实践

    人类一直有一个梦想,造一个智能机器,让机器帮助我们实现自己的心愿。就像小时候看的动画片《葫芦娃》,如意如意随我心意快快显灵,如意如意,一听这个名字就知道它是代表...

    机器思维研究院
  • 这四类机器学习算法,在自动驾驶中常用

    机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据...

    商业新知
  • NeurIPS 2018提前看:生物学与学习算法

    Joni 目前是日本国立产业综合研究所的研究员。在中国大陆本科本行是自动化,后来对机器人研究有兴趣,在香港就读了电机工程的 Mphil 学位。博士时开始着迷生物...

    机器之心
  • 自动驾驶中常用的四类机器学习算法

    机器学习算法已经被广泛应用于自动驾驶各种解决方案,电控单元中的传感器数据处理大大提高了机器学习的利用率,也有一些潜在的应用,比如利用不同外部和内部的传感器的数据...

    刘盼
  • 论文研读-多目标自适应memetic算法

    DrawSky
  • 视频详解Google和MIT新算法:滤掉遮挡物

    大数据文摘

扫码关注云+社区

领取腾讯云代金券