什么是机器学习技术?

问题导读 1.什么是机器学习? 2.机器学习可以来做什么? 3.机器学习技术可以被应用于哪三种不同方式?

这篇博客文章由微软研究院的杰出科学家John Platt所撰写。作者简单地介绍了机器学习技术,并将其分为数据挖掘、统计工程、人工智能三种应用途径。最后,以对抗恶意软件、建立搜索引擎、赋予电脑视觉听觉这三种具体事例加以解释。

大家好,我是John Platt。在微软,我从事于建立和使用机器学习技术(略称ML)的算法,至今已有17年之久。因为机器学习技术最近变得非常流行,所以经常有人问我:“什么是机器学习?你用它来做什么?”

我非常高兴来回答这些疑问,因为事实证明,机器学习技术的应用已经广泛地渗入到微软庞大的产品群之中——也得益于此,使得微软成为一个趣味性强、影响力广的地方来研究机器学习技术(这就如同一个孩子身临糖果屋一般)。

一般而言,机器学习技术可将数据集(由数据所组成的集合)转换为称为“模型”的许多软件,它能够表示数据集并概括,以对新数据进行预测。介于机器学习技术被如此广泛地应用,我认为将机器学习的应用进行粗略地分类大有裨益。机器学习技术可以被应用于如下三种不同方式:

1.数据挖掘:机器学习技术可以被人们使用以从大型数据库中获得见解。

2.统计工程:机器学习技术可以被用于将数据转换为,对不确定性数据做出决策的软件。

3.人工智能:机器学习技术可以被用于模拟人类思维,来创造出能够(如人类一样)看、听、理解的电脑。

在微软,我们在这三种途径上都应用了机器学习技术。例如:

对抗恶意软件

微软恶意软件防护中心,与微软研究院一道,已经使用机器学习技术来开发出能够自动监测出恶意软件的软件,并用来帮助分析师了解恶意软件的发展状况。你能通过Dennis Batchelder的博客条目来阅读这方面的更多内容。

建立搜索引擎

微软的搜索引擎Bing是一个能够解读你的查询信息、快速遍历网页、然后返回对你有帮助的信息的一个非常复杂的系统。由于Bing拥有如此高额的流量,我们必须使用自动化决策方案,使之能够处理自然语言的不确定性与不明确性。我们已经利用机器学习技术开发出许多Bing的组件,它们能够协同工作以形成一个高质量的搜索引擎。机器学习技术有助于搜索的一个特别形式是搜索结果排序:几年前,来自微软研究院的一个团队使用我们已经开发出的算法,在一个排序竞赛上获胜。

赋予电脑以视觉和听觉

微软在计算机视觉与语音识别两方面,一直于技术的各个阶段起推动作用。在Kinect中能够识别你手势的软件正是由机器学习技术所开发。微软的语音识别系统是基于深度学习技术,它是以大脑结构为灵感的机器学习模型的一个形式。我们还运用机器学习技术开发出一个实时的对话翻译器。

看这些令人兴奋的应用程序,我意识到现在对机器学习技术而言,正是一个具有魔力的时期。许多研究人员与开发人员一直稳定地致力于这些应用长达数年。得益于摩尔定律和互联网,我们现在拥有标记数据与运算能力,使用机器学习技术开发出卓越的软件。我期望为其他开发者们提供我们的算法和工具,使他们能够发挥他们的创造力开发出属于他们自己的卓越的各项应用产品。

译者: Propiram 原作者:John Platt

原文发布于微信公众号 - about云(wwwaboutyuncom)

原文发表时间:2015-03-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

业界 | 快手科技李岩:多模态技术在产业界的应用与未来展望

李岩在演讲中表示,多模态技术有两大应用方向,一是会改变人机交互的方式,二是将使信息分发更加高效;视频本身就是一个多模态的问题,而快手则拥有海量的多模态数据,多模...

1033
来自专栏AI科技评论

现场 | 英特尔中国研究院认知计算实验室主任陈玉荣博士:如何“享用”视觉识别技术的低廉化大潮

英特尔中国研究院认知计算实验室: 致力于视觉认知和机器学习前沿领域的科技创新,开发视觉内容理解和视觉内容创建的领先技术,从而在英特尔平台上实现视觉数据的智能处理...

2839
来自专栏IT派

喜大普奔!TensorFlow中文社区论坛 (测试版) 发布上线!

昨天,TensorFlow与 Caicloud (才云) 联合发起和创建的 TensorFlow 中文社区论坛测试版(https://www.tensorflo...

680
来自专栏数据科学与人工智能

【机器学习】“机器深度学习”的未来:读懂人类的情感

“机器学习”的概念自上世纪50年代出来以来就备受科技界的关注,而近年来“深度学习”逐渐成为机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神...

2726
来自专栏机器之心

业界 | 快手AI技术副总裁郑文:为什么说AI是短视频平台的核心能力

郑文是美国斯坦福计算机系博士,研究方向主要集中在计算机图形学和电影特效方面,毕业之后在美国从事机器学习和计算机视觉相关研究,2016 年回国后加盟快手,现任快手...

1303
来自专栏机器之心

OpenAI联合DeepMind发布全新研究:根据人类反馈进行强化学习

选自DeepMind 作者:Shane Legg等 机器之心编译 参与:吴攀、黄小天、李亚洲 DeepMind 和 OpenAI 是现在人工智能研究界最重要的两...

2778
来自专栏大数据文摘

业界 | Kaggle问卷主成分分析,16000万数据从业者面临这5类挑战

1496
来自专栏专知

机器学习模型在工业界真的创造价值了么?

【导读】看到标题你可能会有疑惑,因为我们可能经常听到的是“你在实际应用中如何使用机器学习模型的”。本文正是数据科学家Venkat Raman关于“机器学习在工业...

3596
来自专栏灯塔大数据

荐读|电信大数据关键技术挑战

电信大数据来源于运营商通信网络平台的BSS和OSS,沉淀了海量用户7个维度的信息:1维用户真实ID、1维行为数据、1维社交数据、1维时间数据和3维空间数据。运营...

3557
来自专栏PPV课数据科学社区

浅谈数据挖掘与数据分析?

浅谈数据分析与数据挖掘?   数据分析和数据挖掘都可以做为“玩数据”的方法论,两者有很多的共性,也有显著的差异。 ?   从分析的目的来看,数据分析一般是对历史...

45111

扫码关注云+社区