前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >如何研究机器学习算法

如何研究机器学习算法

作者头像
天空
发布2018-02-23 16:09:27
1.6K0
发布2018-02-23 16:09:27

算法是机器学习领域的重要组成部分。

您需要了解哪些算法在那里,以及如何有效地使用它们。

简化这一知识的简单方法是查看已知的算法,并对其进行研究。

在这篇文章中,您将会发现研究机器学习算法的重要性,以及您可以用来加速对机器学习算法的理解的5个不同来源。

研究机器学习算法
研究机器学习算法

研究机器学习算法

为什么研究机器学习算法

你需要理解算法来掌握机器学习。

机器学习算法不像您可能熟悉的排序算法等这样的算法。

机器学习算法不仅依赖于数据,而且是自适应的。一个给定的机器学习算法的核心往往是一个随机的优化过程,这意味着它具有随机性的元素。因此,这使得机器学习算法更难以分析,并对最佳和最差性能做出苛刻的判断。

您需要应用,实施或深入思考算法以了解它们。

你可以描述一个算法如何作为一个数学方法,但要理解它的行为在实践中,你必须研究它的行动。您可以通过对算法进行实验,将其应用于很多问题,并提炼出其行为方式,以及如何在面对不同的问题类型时揭露和利用这些行为。

或者,您可以采取的捷径是深入了解其他人在您之前了解的算法。

你只需要从研究它们的算法中获得背景。

获取您的免费算法思维导图

机器学习算法思维导图
机器学习算法思维导图

方便的机器学习算法思维导图示例。

我创建了一个按照类型组织的60多个算法的方便的思维导图。

下载它,打印并使用它。

免费下载

也可以独家使用机器学习算法电子邮件迷你课程。

研究算法时使用5个来源

研究机器学习算法需要从多个来源对算法进行系统研究。

这听起来可能比实际上更可怕。你的目标是建立你自己对不同机器学习算法的一致理解,并且一致的理解对你是个人的,并且需要从多个来源对给定算法的解释进行整理。

不同的来源可以用于不同的目的,所以你需要仔细挑选和有目的地选择这些来源。

首先明确为什么要研究一个给定的机器学习算法,然后选择那些能够最好地回答您的问题的来源。

有5个不同的来源,您可以在您的机器学习算法的研究中使用,我们将依次审查。

1.权威来源

权威来源提供算法的专家解释和描述。

它们对于加快算法速度很有用,因为解释通常是严格的,有些标准化的,至少在材料中是这样。

这些描述也可以是密集的,经常沉浸在数学中,并且侧重于使用学术语言的理论方面。这样,如果没有足够的背景,它们就很难穿透。

权威来源的例子包括:

  • 教科书,如在研究生机器学习课程中使用的教科书。
  • 讲义和幻灯片,例如在研究生机器学习课程中提供的幻灯片。
  • 概述论文,例如构成关于某个主题的学术汇编的论文。

2.来源

精髓来源是算法的专家来源和原始描述。

精确的来源对于进入原作者的头脑或者机器学习算法的描述器是有利的,并且可以排除算法参数和过程的意图。

这些来源几乎总是学术和理论的,只是偶尔包含有用的使用信息。

精浆来源的例子包括:

  • 会议论文和期刊文章。
  • 技术报告可能在该方法的原始出版物之前或补充。

3.前沿资源

许多算法正在进行研究。这可以采取扩展,更深入的调查,甚至简单的应用和方法与其他方法的比较的形式。

我把这些资源称为领先优势,因为它们揭示了关于机器学习算法的有用的新的和最先进的信息。

领先的边缘资源可以用来了解当前正在处理的与算法有关的问题。这些可能代表您可以注意到的算法中的有趣或困难的子流程。

通常前沿资源是密集的和技术性的,并且将需要许多工作来解释工作的意图,并提取有助于更好地理解算法的显着细节。

前沿资源的例子包括:

  • 会议论文和期刊文章。
  • 会议会议,如全体会议,也许是研讨会。

4.用法启发式来源

在实际应用中研究机器学习算法时,使用启发式算法和最佳实践可能是您感兴趣的关键信息类型。

使用启发式源提供了一个关于如何在实践中使用给定的机器学习算法的专家描述。它们对实际使用建议很有帮助,如参数配置,建议的数据准备步骤以及如何针对特定类别的问题调整和缩放算法的建议。

通常情况下,这些来源中缺少的细节必须通过直接联系作者推断或寻求。不要指望能够轻松地从这些来源重现结果,专注于提取可用于提示算法使用情况的启发式算法。

使用启发式资源的例子包括:

  • 描述机器学习比赛结果的论文,如KDD Cup和Kaggle。
  • 我做了什么 ”博客帖子和论坛帖子与机器学习竞赛有关。
  • 问答网站,如交叉验证和其他机器学习社区网站。
  • 应用会议论文。

5.实施来源

您可能对研究算法感兴趣,因为您想要实现它。除了上面列出的其他来源之外,您应该咨询实施来源。

这些资源是由专家或半专家在图书馆和工具中作为例子提供机器学习算法的实现。样本可能会根据许可或开源许可证发布,供您学习。

这些资源是很好的想法如何给机器学习算法可以被转换成一个可执行和可用的系统。

实施来源的例子包括:

  • 开源项目,如库和工具。
  • 相关机器学习博客上的帖子。
  • 由研究生或研究实验室准备的技术报告。

通常,博客帖子上的实现是为了教程和理解目的而提供的,可能不会为了速度或可伸缩性而编写。在库和工具中找到的开源算法实现往往是高度优化的,不是为了便于阅读而编写的。

研究不只是为了学术

你可以研究机器学习算法。不要被正式的学术语言和文章和文章所吓倒。

您不需要成为博士研究生,也不需要机器学习算法专家。

您可以像任何人一样阅读论文,书籍和算法实现。

读者难以阅读的问题往往在于作者,而不在于读者。编写一个算法或研究的良好技术处理是非常困难的,当你发现它们时,那​​些好的来源就是宝石。

行动步骤

在这篇文章中,您发现了研究机器学习算法的重要性,以及您可以用来在机器学习算法中找到所需信息的5个来源。

下一步是练习你的新技能。

  1. 选择一个你想研究的算法。
  2. 考虑一下你想知道的算法,并从上面的列表中选择可以最好地回答你的问题的来源。
  3. 系统地研究算法。从Google Scholar开始,如果您正在查找论文,请输入算法名称。从GitHub的Google搜索开始,如果您正在查找算法实现,请输入算法名称。

分享你学到的东西。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 为什么研究机器学习算法
  • 获取您的免费算法思维导图
  • 研究算法时使用5个来源
    • 1.权威来源
      • 2.来源
        • 3.前沿资源
          • 4.用法启发式来源
            • 5.实施来源
            • 研究不只是为了学术
            • 行动步骤
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档