文章/答案/技术大牛

发布

机器学习篇

共 26 篇文章

机器学习（二十五） ——adaboost算法与实现

机器学习（二十四） ——从图像处理谈机器学习项目流程

机器学习（二十三） —— 大数据机器学习(随机梯度下降与map reduce)

机器学习（二十二） ——推荐系统基础理论

机器学习（二十一） ——高斯密度估计实现异常检测

机器学习（二十） ——PCA实现样本特征降维

机器学习（十五） ——logistic回归实践

机器学习（十四） ——朴素贝叶斯实践

机器学习（十四） ——朴素贝叶斯实现分类器

机器学习（十三） ——交叉验证、查准率与召回率

机器学习（十二） ——神经网络代价函数、反向传播、梯度检验、随机初始化

机器学习（十一） ——神经网络基础

机器学习（十） ——使用决策树进行预测（离散特征值）

机器学习（九） ——构建决策树（离散特征值）

机器学习（八） ——过拟合与正则化

机器学习（七） ——logistic回归

机器学习（六） ——线性回归的多变量、特征缩放、标准方程法

机器学习（五） ——k-近邻算法进一步探究

机器学习（四） ——梯度下降算法解释以及求解θ

机器学习（三） ——k-近邻算法基础

机器学习（二） ——线性回归、代价函数与梯度下降基础

机器学习（一）——机器学习概述

清单首页机器学习篇文章详情

清单「机器学习篇」 26/26

机器学习（一）——机器学习概述

用户1327360

机器学习（一）——机器学习概述

（原创内容，转载请注明来源，谢谢）

前言：近期开始学习机器学习，当前视频和书籍一起看，视频看的是吴恩达的机器学习系列课程，书籍看的《机器学习实战》。目前是机器学习小白，希望各位有感兴趣的，可以一起开始学机器学习。大家可以多交流~~

另外，由于工作上还是在做web服务端，因此还会经常更新对于web的学习体会~希望大家共同进步。

一、概述

机器学习是近期非常火的技术，其可以将输入的数据经过一定的处理，得到结果，具有预测、决策、统计、分类等功能，被广泛应用于各行各业。

机器学习主要分为两大类：监督学习（supervisor learning）和无监督学习（unsupervisor learning）。

二、监督学习

1、概念

监督学习，指的是在已知结果的类别的情况下，将一系列的数据交给计算机，由其进行处理后，得出不同数据是从属于哪个类别的。

2、主要任务

监督学习主要用于分类、回归两大功能。

1）分类

分类的结果是离散的。例如要将不同的花进行分类，根据花的颜色、形状、大小等因素，得出花的类型。对于这个工作，首先其总的类别是已知的，所以称为监督学习，其次其结果是有限个的，所以其叫做分类。

2）回归

与分类相对，回归是处理连续的结果。例如根据房子的面积、地段、楼层、朝向等因素，预测房子的价格。虽然价格最多精确到分，但是还是可以看作是连续函数。另外，由于可以确定结果就是价格，所以结果类别是已知的，所以也是监督学习。

3、常用算法

监督学习常用的算法包括：K-近邻（KNN）、线性回归、朴素贝叶斯、局部加权线性回归、支持向量机（SVM）、Ridge回归、决策树、Lasso最小回归系数估计等。

三、无监督学习

1、概念

无监督学习，指的是结果未知的情况下，给计算机一系列数据，由计算机自行处理后，得出不同结果的分类。

2、主要任务

无监督学习主要用于聚类、密度估计功能，另外对于降低数据维度也有重要作用。

1）聚类

可以类比监督学习的分类，聚类就是在未知结果有哪些类别的情况下，离散的数据经由计算机计算后，得出结果的过程。例如很多门户网站的新闻列表，都是从各个网站上将链接抓取，再分析新闻的内容，进行聚类。

2）密度估计

可以类比回归。密度估计即在未知结果类别情况下，将连续的数据给计算机，由其计算并告知结果。

3、常用算法

无监督学习常用的算法包括：K-均值（K-Means）、最大期望算法、DBSCAN、Parzen窗设计等。

四、机器学习开发步骤

机器学习应用开发，主要步骤如下：

1、收集数据

对于机器学习来说，没有数据就没有学习可言。数据可以是爬虫抓取、开源语料库、自己提供的数据源等。

2、准备输入数据（人工）

根据需要处理的数据，对格式进行整理，以便后续处理。这一步骤是人工进行。

3、分析输入数据（人工）

这一步骤主要是剔除错误数据。对于明显错误的数据，可以人工剔除。但是这个会增大工作量，对于好的算法而言，可以省略这个步骤。

4、训练算法

这一步骤是专门针对监督学习而言的。

监督学习由于已经知道结果的类别，因此，需要先给计算机一组数据，是一组类似{特征1,特征2,…特征N,结果}的数据集合，让计算机进行“学习”。

对于无监督学习，由于不确定结果的类型，因此不需要“学习”。

5、测试算法

这一步是非常重要的。给定一些数据，让计算机告知处理后的结果，并且人工查看结果是否符合要求。对于不符合要求的，需要重新调整算法的参数。

6、使用算法

在项目中使用算法。

——written by linhxx 2017.12.27

机器学习篇

机器学习（一）——机器学习概述

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐