前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于机器学习的Hello World程序

基于机器学习的Hello World程序

作者头像
selinayu
发布2018-02-13 16:00:08
7490
发布2018-02-13 16:00:08

机器学习有大量的算法,往往很容易让人感到不知所措。也正因为有太多的选择,导致人们不知道应该从哪里开始和要怎么去做。

这么多的选择,常常会让人感到麻木。

你需要先克服这种恐惧再开始。

没有魔法书或课程会告诉你什么时候应该使用什么算法。实际上,在实践中你不可能事先知道这一点。你必须通过反复试验才能发现它。这也意味着你会犯一些错误。

在这篇文章中,你会发现一个简单的技巧,让你应用在刚开始的机器学习上。

这个技巧将会引人深思,激励你更深入的钻研,还会增强你最喜欢的算法或工具,加速你的机器学习的旅程。

这是一个简单的策略,甚至一些有经验的从业者也会因为它的简单而忽略或忘记这个策略。

机器学习的Hello World,Faris Algosaibi的照片,保留部分权利
机器学习的Hello World,Faris Algosaibi的照片,保留部分权利

熟悉机器学习算法

你需要用各种不同的算法建立信心。

你解决机器学习问题的技巧大部分都掌握在你掌握的工具和能自信运用的能力上。

在这条道路上的第一步是打开一个工具或者库,并开始应用算法。就像学习编程一样,你需要从hello world开始。应用机器学习的hello world就是加载数据集并运行算法。

运行算法就是你建立自信的方式。

你应该运行大量的算法。运行完一个工具或库提供的所有算法后,接着尝试另一个库或工具的。

你不要想着找到最好的算法,没有最好的机器学习算法,如果对所有问题使用同一种算法或一类算法,则会严重的限制你可以实现的结果。

运行你的第一个算法

你会惊讶于有兴趣应用机器学习,但没有运行算法问题的人数。

同样,在你运行完你的第一个算法之后,你也会惊奇地发现,这是多么的微不足道,而你还有更多的东西需要你做。

很简单的流程:

  1. 选择一个工具。如果你不是程序员,我推荐Weka,因为它提供了一个图形用户界面。如果你是一个程序员,我建议使用基于 Python 语言的 scikit-learn 或者 R
  2. 选择一个标准的数据集。我推荐来自UCI机器学习库的标准数据集,虹膜分类问题是一个和 Hello World 一样经典的分类问题。
  3. 找到或设计一个方法。确定你使用这个工具加载数据集,将其放进队列和测试数据集中,并运行一种算法对这个数据集进行预测。如果你使用Weka,你可以按照这个方法。当然,我也有使用Rscikit-learn的方法。
  4. 运行这个方法
  5. 查看结果。 根据你运行结果的准确性,思考这意味着什么。查看是否有关于算法的信息,这些信息有可能代表着什么。
  6. 重复。尝试用不同的算法,不同的算法配置或不同的数据集运行大量的算法。

上面的流程很简单。事实上,正因为这么简单,你更应该这么做,这让你在所有主流的机器学习工具和库中,都能轻松地处理简单的问题。

除了选择最喜欢的算法之外,另一个问题是选择一个最喜欢的工具或库。

要想真正有效的解决问题,你需要使用任何能给你带来更好结果的工具。而且还要学习如何充分地使用每个工具,但要做好这些工具过时的准备。

动力来源于好奇心

你暂时还不需要了解工具或算法的问题。您正在建立对这个工具的信心和熟悉它提供的东西。

你刚开始应该问这样的问题:

  • 这个算法是怎样实现的?
  • 为什么这个算法比那个算法给出更好的结果呢?
  • 这些算法的所有参数分别代表什么?

在机器学习的应用方面有很多东西需要学习,这也正是为什么它是一个激动人心的领域。

希望这个练习能激励你深入一点,并开始研究一定的算法或算法参数来回答这些问题。

这个技巧不只是克服算法的选择困难症,对这个工具建立信心和熟练使用它,我还希望它能激发你的好奇心。毕竟知道更多需要的东西可以让你走很长一段路,帮助你理解以前觉得难以理解的事情。

可以随时在想要演示的数据集上运行给定的算法的好处在于,你可以把书籍,博客和其他资料所阅读和学习的内容加以理解融入你使用的工具。这种将创意付诸行动的能力将会提高你的学习动力并促进你的学习。

走得更远

这里有很多工具,几乎和机器学习算法一样多。

我喜欢尝试其中的大部分,但只是看看他们提供什么,他们可以做什么。

有一个小技巧,您可以在文本文件比如word文档或程序代码中创建一套属于你自己的方法或执行计划。这让你以后再使用这个工具时,可以针对问题和算法快速的开始。

你的好奇心会让你更进一步,因为你可能想要开始建立一个机器学习算法列表描述这些算法,甚至运用在小型的研究项目中从而研究他们

行动步骤

在这篇文章中,你发现的这个简单的技巧,可以用来压倒性的克服算法。这关键在于开始使用现成的工具和库将算法应用于小内存问题。

这个技巧的妙处在于它让你熟悉算法和工具,但更重要的是让你对算法,算法的实现和参数产生了好奇心。这种好奇心可以激励你更深入的了解,追求知道更多相关知识。

当你在学习机器学习的过程中遇到它们,熟悉工具和算法是你发现新东西想进行尝试并付诸行动的基础,这也可以促进你的学习。

请选择一个工具,然后运行你的第一个算法。

如果你仍然感到迷惑,请按照这个循序渐进的教程在Weka中运行你的第一个机器学习算法。然后运行更多的算法。

请分享你的经验。比如说你选择了哪一种工具,运行了哪种算法,引发了什么问题?

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 熟悉机器学习算法
  • 运行你的第一个算法
  • 动力来源于好奇心
  • 走得更远
  • 行动步骤
相关产品与服务
TI-ONE 训练平台
TI-ONE 训练平台(以下简称TI-ONE)是为 AI 工程师打造的一站式机器学习平台,为用户提供从数据接入、模型训练、模型管理到模型服务的全流程开发支持。TI-ONE 支持多种训练方式和算法框架,满足不同 AI 应用场景的需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档