前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >写给开发者的机器学习指南(一)

写给开发者的机器学习指南(一)

作者头像
哒呵呵
发布2018-08-06 17:50:02
3700
发布2018-08-06 17:50:02
举报
文章被收录于专栏:鸿的学习笔记鸿的学习笔记

文:Mike de Waard

大多数开发人员已经听说过机器学习,但是当试图找到一种“容易”的方法进入这种技术时,大多数人发现自己被机器学习和术语的抽象概念吓退了,例如回归,无监督学习,概率密度函数等许多其他的定义。如果一个人选择阅读书籍,如使用R语言的统计学习介绍,以及使用R语言的黑客的机器学习。

然而R并不是真正的编程语言,其中用于日常使用的是例如Java,C#,Scala等语言。这就是为什么在这个博客中,将介绍使用Smile,一个机器学习库,在Java和Scala中都可以使用的一个机器学习库。这些是大多数开发人员在学习或职业生涯中至少看过一次的语言。

第一部分“The global idea of machinelearning”包含了您需要了解的所有重要概念和概念,用于开始了解“实际示例”一节中描述的实际示例。该部分的实例来自“机器学习黑客”一书的例子。此外,机器学习实战这本书可以被用于验证。

第二部分“Practical examples”包含了各种机器学习(ML)应用程序的示例,作为ML库的Smile。

The global idea of machine learning

你可能已经听说过机器学习不止一次了。 但是,如果你必须解释机器学习是什么给另一个人,你会怎么做呢?在阅读本节的其余部分之前,想一想这一点。

机器学习可以以许多方式解释,有些会比其他的更准确,但是它的定义有很多不一致的地方。有人说机器学习是基于历史数据生成静态模型,然后允许您预测未来的数据。其他人说这是一个动态模型,随着时间的推移,随着更多的数据被添加,它会不断变化。

我更认可的动态的定义,但由于某些限制,我们会解释示例中的静态模型方法。然而,我们会去解释动态原理如何在子集机器学习中工作的。

下面的小节解释了机器学习领域中常用的定义和概念。 我们建议您在开始实践示例之前阅读这些内容。

Features

特征是训练完的模型的特性。举例来说,您可以根据「购买」和「金钱」这个字词的频率,将电子邮件归为垃圾邮件或垃圾邮件。然后这些词就是特征,或者是特征的一部分,如果你将它与更多的词组合。 如果你使用机器学习来预测一个人是你的朋友,那么“常见”朋友的数量可能是一个特征。 请注意,在字段中,有时特征也可称为属性。

Model

当谈到机器学习时,通常提到模型这个术语。模型是任何机器学习方法和该方法中使用的算法的结果。模型可用于在监督下进行预测,或在无监督学习中检索聚类。有很高的机率,你会遇到在在线训练模型和离线训练模型等术语。在线训练背后的理念是,您可以将训练数据添加到已存在的模型中,而使用离线训练可以从头开始生成新模型。出于性能原因,在线训练将是最好的方法。然而对于一些算法,这是不可能的。

--未完待续

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-11-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 鸿的学习笔记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档