前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >如何研究机器学习算法

如何研究机器学习算法

作者头像
天空
发布于 2018-02-23 08:09:27
发布于 2018-02-23 08:09:27
1.6K0
举报

算法是机器学习领域的重要组成部分。

您需要了解哪些算法在那里,以及如何有效地使用它们。

简化这一知识的简单方法是查看已知的算法,并对其进行研究。

在这篇文章中,您将会发现研究机器学习算法的重要性,以及您可以用来加速对机器学习算法的理解的5个不同来源。

研究机器学习算法

为什么研究机器学习算法

你需要理解算法来掌握机器学习。

机器学习算法不像您可能熟悉的排序算法等这样的算法。

机器学习算法不仅依赖于数据,而且是自适应的。一个给定的机器学习算法的核心往往是一个随机的优化过程,这意味着它具有随机性的元素。因此,这使得机器学习算法更难以分析,并对最佳和最差性能做出苛刻的判断。

您需要应用,实施或深入思考算法以了解它们。

你可以描述一个算法如何作为一个数学方法,但要理解它的行为在实践中,你必须研究它的行动。您可以通过对算法进行实验,将其应用于很多问题,并提炼出其行为方式,以及如何在面对不同的问题类型时揭露和利用这些行为。

或者,您可以采取的捷径是深入了解其他人在您之前了解的算法。

你只需要从研究它们的算法中获得背景。

获取您的免费算法思维导图

方便的机器学习算法思维导图示例。

我创建了一个按照类型组织的60多个算法的方便的思维导图。

下载它,打印并使用它。

免费下载

也可以独家使用机器学习算法电子邮件迷你课程。

研究算法时使用5个来源

研究机器学习算法需要从多个来源对算法进行系统研究。

这听起来可能比实际上更可怕。你的目标是建立你自己对不同机器学习算法的一致理解,并且一致的理解对你是个人的,并且需要从多个来源对给定算法的解释进行整理。

不同的来源可以用于不同的目的,所以你需要仔细挑选和有目的地选择这些来源。

首先明确为什么要研究一个给定的机器学习算法,然后选择那些能够最好地回答您的问题的来源。

有5个不同的来源,您可以在您的机器学习算法的研究中使用,我们将依次审查。

1.权威来源

权威来源提供算法的专家解释和描述。

它们对于加快算法速度很有用,因为解释通常是严格的,有些标准化的,至少在材料中是这样。

这些描述也可以是密集的,经常沉浸在数学中,并且侧重于使用学术语言的理论方面。这样,如果没有足够的背景,它们就很难穿透。

权威来源的例子包括:

  • 教科书,如在研究生机器学习课程中使用的教科书。
  • 讲义和幻灯片,例如在研究生机器学习课程中提供的幻灯片。
  • 概述论文,例如构成关于某个主题的学术汇编的论文。

2.来源

精髓来源是算法的专家来源和原始描述。

精确的来源对于进入原作者的头脑或者机器学习算法的描述器是有利的,并且可以排除算法参数和过程的意图。

这些来源几乎总是学术和理论的,只是偶尔包含有用的使用信息。

精浆来源的例子包括:

  • 会议论文和期刊文章。
  • 技术报告可能在该方法的原始出版物之前或补充。

3.前沿资源

许多算法正在进行研究。这可以采取扩展,更深入的调查,甚至简单的应用和方法与其他方法的比较的形式。

我把这些资源称为领先优势,因为它们揭示了关于机器学习算法的有用的新的和最先进的信息。

领先的边缘资源可以用来了解当前正在处理的与算法有关的问题。这些可能代表您可以注意到的算法中的有趣或困难的子流程。

通常前沿资源是密集的和技术性的,并且将需要许多工作来解释工作的意图,并提取有助于更好地理解算法的显着细节。

前沿资源的例子包括:

  • 会议论文和期刊文章。
  • 会议会议,如全体会议,也许是研讨会。

4.用法启发式来源

在实际应用中研究机器学习算法时,使用启发式算法和最佳实践可能是您感兴趣的关键信息类型。

使用启发式源提供了一个关于如何在实践中使用给定的机器学习算法的专家描述。它们对实际使用建议很有帮助,如参数配置,建议的数据准备步骤以及如何针对特定类别的问题调整和缩放算法的建议。

通常情况下,这些来源中缺少的细节必须通过直接联系作者推断或寻求。不要指望能够轻松地从这些来源重现结果,专注于提取可用于提示算法使用情况的启发式算法。

使用启发式资源的例子包括:

  • 描述机器学习比赛结果的论文,如KDD Cup和Kaggle。
  • 我做了什么 ”博客帖子和论坛帖子与机器学习竞赛有关。
  • 问答网站,如交叉验证和其他机器学习社区网站。
  • 应用会议论文。

5.实施来源

您可能对研究算法感兴趣,因为您想要实现它。除了上面列出的其他来源之外,您应该咨询实施来源。

这些资源是由专家或半专家在图书馆和工具中作为例子提供机器学习算法的实现。样本可能会根据许可或开源许可证发布,供您学习。

这些资源是很好的想法如何给机器学习算法可以被转换成一个可执行和可用的系统。

实施来源的例子包括:

  • 开源项目,如库和工具。
  • 相关机器学习博客上的帖子。
  • 由研究生或研究实验室准备的技术报告。

通常,博客帖子上的实现是为了教程和理解目的而提供的,可能不会为了速度或可伸缩性而编写。在库和工具中找到的开源算法实现往往是高度优化的,不是为了便于阅读而编写的。

研究不只是为了学术

你可以研究机器学习算法。不要被正式的学术语言和文章和文章所吓倒。

您不需要成为博士研究生,也不需要机器学习算法专家。

您可以像任何人一样阅读论文,书籍和算法实现。

读者难以阅读的问题往往在于作者,而不在于读者。编写一个算法或研究的良好技术处理是非常困难的,当你发现它们时,那​​些好的来源就是宝石。

行动步骤

在这篇文章中,您发现了研究机器学习算法的重要性,以及您可以用来在机器学习算法中找到所需信息的5个来源。

下一步是练习你的新技能。

  1. 选择一个你想研究的算法。
  2. 考虑一下你想知道的算法,并从上面的列表中选择可以最好地回答你的问题的来源。
  3. 系统地研究算法。从Google Scholar开始,如果您正在查找论文,请输入算法名称。从GitHub的Google搜索开始,如果您正在查找算法实现,请输入算法名称。

分享你学到的东西。

评论
登录后参与评论
暂无评论
推荐阅读
机器学习的5种“兵法"
在研究机器学习中,理论在其整个自上而下方法中试用于哪里呢? 在传统的机器学习教学中,丰富的数学理论知识对于理解机器学习是至关重要的,我的机器学习教学方法通常是教你如何端对端解决问题以及传输结构。 所以此方法哪里要用到理论知识了呢? 在此帖中你将了解我们是如何理解机器学习中的“理论”一词。提示:全部与算法有关。 你会发现一旦你可以熟练解决问题以及传输结果后,你就欲罢不能地想要对机器学习有更深入的理解以及获得更好的结果,没人能拉得住你。 最后,你会发现可以通过应用标准数据集练习机器学习的5个技巧,从而进一步加深
CDA数据分析师
2018/02/05
5800
机器学习的5种“兵法"
警惕!机器学习入门阶段易犯的5个错误
怎样进入机器学习领域没有定式。我们的学习方式都有些许不同,学习的目标也因人而异。 但一个共同的目标就是要能尽快上手。如果这也是你的目标,那么这篇文章为你列举了程序员们在通往机器学习高手道路上常见的五种错误。 1.将机器学习看得高不可攀 机器学习不过是另一堆技术的集合,你可以用它来解决复杂问题。这是一个飞速发展的领域,因此,机器学习的学术交流一般出现在学术期刊及研究生的课本里,让它看起来高不可攀又难于理解。 要想高效掌握机器学习,我们需要转变观念,从技术转到方法,由精确变为“足够好”,这也同样适用于程序员感兴
CDA数据分析师
2018/02/05
5710
谷歌机器学习白皮书全解析 43条黄金法则(一)
编者按:此文由AI科技评论独家编译,未经许可拒绝转载。此白皮书为谷歌总结的机器学习(ML)最优实践方法,浓缩了其多年技术积累与经验,尤其是 Youtube、Google Play 和 Google+ 等平台背后的 ML 算法开发、维护经历。谷歌于白皮书中总结了四十三条 ML 黄金法则,旨在帮助已经掌握了基础知识的开发者少走弯路。鉴于其珍贵程度与技术性,AI科技评论逐条做了严格尊重原文的翻译。若你已学习过机器学习课程,抑或有开发 ML 模型的经验,那么应当具备足够的背景知识理解这篇文章。 术语 以下是对文
AI科技评论
2018/03/09
1.1K0
谷歌机器学习白皮书全解析 43条黄金法则(一)
5种无需数学背景也可理解机器学习算法的技巧
在一种自顶向下的研究机器学习的方法中,理论应立足于何处?
Bon
2018/02/06
1.2K1
5种无需数学背景也可理解机器学习算法的技巧
理解任何机器学习算法的6个问题
有很多机器学习算法,每个算法都是一个独立的研究。
BAStriver
2018/02/06
7800
理解任何机器学习算法的6个问题
停止从头开始编写机器学习算法
从头开始实现算法是我看到初学者犯的最大的错误之一。
anthlu
2018/02/08
7420
停止从头开始编写机器学习算法
机器学习法则:(谷歌)机器学习工程最佳实践
机器学习(ML)最优实践方法,浓缩了其多年技术积累与经验,尤其是YouTube、Google Play和Google+ 等平台背后的ML算法开发、维护经历。谷歌于白皮书中总结了四十三条ML黄金法则,旨在帮助已经掌握了基础知识的开发者少走弯路。
机器学习AI算法工程
2019/10/28
5920
机器学习法则:(谷歌)机器学习工程最佳实践
动态 | 谷歌发布机器学习规则: 关于机器学习工程的最佳实践(上)
本文档旨在帮助已掌握机器学习基础知识的人员从 Google 机器学习的最佳实践中受益。以下为上篇,包含术语、概览以及在进行机器学习之前的第 1-20 条规则。
AI科技评论
2018/07/26
5020
《量子机器学习》作者 Peter Wittek 最新研究:高级量子资源可用于机器学习
【新智元导读】《量子机器学习》作者 Peter Wittek 的最新研究发现,与近似概率推理的经典启发式算法相比,量子协议的最新结果直接应用于 Gibbs 抽样,在速度上产生了指数级的提升,这一发现从
新智元
2018/03/26
7630
《量子机器学习》作者 Peter Wittek 最新研究:高级量子资源可用于机器学习
ML入门阶段易犯的5个错误
怎样进入机器学习领域没有定式。我们的学习方式都有些许不同,学习的目标也因人而异。但一个共同的目标就是要能尽快上手。如果这也是你的目标,那么这篇文章为你列举了程序员们在通往机器学习高手道路上常见的五种错误。 1. 将机器学习看得高不可攀   机器学习不过是另一堆技术的集合,你可以用它来解决复杂问题。这是一个飞速发展的领域,因此,机器学习的学术交流一般出现在学术期刊及研究生的课本里,让它看起来高不可攀又难于理解。   要想高效掌握机器学习,我们需要转变观念,从技术转到方法,由精确变为“足够好”,这也同样适用于
计算机视觉研究院
2018/04/17
1K0
机器学习近年来之怪现状
总体来说,机器学习(ML)的研究人员正在致力于数据驱动算法知识的创建与传播。在一篇论文中提到,研究人员迫切地想实现下列目标的任一个:理论性阐述可学习内容、深入理解经验严谨的实验或者构建一个有高预测精度的工作系统。虽然确定哪些知识值得探究是很主观的,但一旦主题确定,当论文为读者服务时,它对社区最有价值,它能创造基础知识并尽可能清楚地进行阐述。
机器之心
2018/07/26
2770
机器学习近年来之怪现状
计算机视觉研究入门全指南
后台有很多人问如何入门CV,这篇是旧文重发,文章很长,翻译自某外文博客,时间有点久,但道理是相通的,非常值得一读! 这篇文章从一个刚刚开始计算机视觉研究的初学者的角度,详细探讨了这个领域的文献、专家学者、研究组、博客,并重点说明了如何开始研究,如何选择方向,如何看论文、实现代码、调试代码等,并详细说明了研究计算机视觉应该如何学习机器学习等。是初入该领域的博士、学者、欲深入研究的开发者的非常值得详细考察和收藏的参考。 顶级会议和期刊 第一梯队顶级会议: CVPR, ECCV, ICCV, NIPS, IJCA
CV君
2019/12/27
7710
【机器学习】从零实现来理解机器学习算法
从零开始实现机器学习算法的好处 我推广了从零开始实现机器学习算法的观念。 我认为你可以学到很多关于算法是如何工作的。我也认为,作为一名开发者,它提供了一个学习用于机器学习的数学符号、描述以及直觉的桥梁。 在“从零开始实现机器学习算法的好处”这篇文章里,我已经讨论了从零实现机器学习算法的好处。 在那篇文章,我列出的好处如下: 你获取了知识; 它提供了一个起点; 拥有算法和代码的所属权。 在这篇文章中,我对如何利用现有的教程和书籍来缩短这个学习过程表达了一些个人看法。有一些用于初学的丰富资源,但也要堤防一些绊脚
陆勤_数据人网
2018/02/26
9250
【机器学习】从零实现来理解机器学习算法
机器学习问题框架的循序渐进指南
在过去的四年里(在谷歌,以及之前的Comet Labs),我有机会与世界各地的数百家初创公司和公司合作,帮助他们定义他们的ML战略,从问题框架到结束 - 到 -最终实施在生产中运行的ML模型。我们共同致力于部署模型以提高运营效率(例如内部工具,DevOps等),摆脱瓶颈(例如,为客户服务团队提供“神奇的力量”),开发基于ML的产品功能,并构建新产品一起。
iOSDevLog
2019/04/09
4670
机器学习问题框架的循序渐进指南
机器学习为何重要|通过计算一个句子的音节总数证明给你看
大数据文摘编译作品,转载具体要求见文末 翻译校对| 黄文畅 姜范波 Dr. Guo 对信息时代的大多数人来说,如果想通过电脑编程解决一些难题,你只有两种方法:查找式和启发式。 现在,便利的机器学习算
大数据文摘
2018/05/22
5290
[机器学习|理论&实践] 机器学习与生物启发式算法的融合
在现代科技的发展中,机器学习和生物启发式算法的结合为问题解决提供了一种创新的方式。本文将深入研究机器学习与生物启发式算法的融合,通过一个实例项目展示其部署过程,并探讨这一技术在未来的发展方向。
数字扫地僧
2024/01/20
3611
华为 AI 战略第一步:发布基于机器学习的智能网络控制系统 Network Mind
【新智元导读】华为诺亚方舟实验室昨天首次对外公布了 Network Mind——全球网络通信业界首个基于机器学习的网络大脑,实现智能化的网络控制与管理。Network Mind 原型的研发成功将促进机器学习、人工智能技术在通信网络的应用,推动下一代通信网络自动化、智能化的进程。 2016 年 10 月 26 日,华为诺亚方舟实验室对外公布了他们的最新研究成果——全球网络通信业界首个基于机器学习的网络大脑(Network Mind),可以自动检测、准确预测网络流量的变化,智能地实现网络流量的自动控制。 华为利
新智元
2018/03/26
1.3K0
华为 AI 战略第一步:发布基于机器学习的智能网络控制系统 Network Mind
机器学习自学指南
有很多途径来学习机器学习。有丰富的资源:有书籍,有课程可以参与,可以参加比赛,有大量供你使用的工具。在这篇文章中,我想围绕这些活动提出一些你机器学习之旅大致会有的阶段并在你程序员通往到机器学习大师之路上给出一个大概的顺序,以及在各个层次上有哪些可供你利用的资源
xixigiggling
2018/02/07
5790
如何实现机器学习算法
在代码中实现一个机器学习的算法能够使你更加了解该算法以及其工作机理。
CJ
2018/02/02
8820
AI+组合优化 |机器学习顶会ICLR/ICML/NeurIPS'23最新进展-MIP求解篇(附原文源码)
----ICLR、NIPS和ICML是人工智能领域的三个顶级学术会议,以下是它们的介绍:
决小策
2023/12/17
1.4K0
相关推荐
机器学习的5种“兵法"
更多 >
目录
  • 为什么研究机器学习算法
  • 获取您的免费算法思维导图
  • 研究算法时使用5个来源
    • 1.权威来源
    • 2.来源
    • 3.前沿资源
    • 4.用法启发式来源
    • 5.实施来源
  • 研究不只是为了学术
  • 行动步骤
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档